數(shù)據(jù)分析師的基本工作流程:
1.定義問題
確定需要的問題,以及想得出的結(jié)論。需要考慮的選項(xiàng)有很多,要根據(jù)所在業(yè)務(wù)去判斷。常見的有:變化趨勢(shì)、用戶畫像、影響因素、歷史數(shù)據(jù)等。
2.數(shù)據(jù)獲取
數(shù)據(jù)獲取的方式有很多種:
一是直接從企業(yè)數(shù)據(jù)庫調(diào)取,需要SQL技能去完成數(shù)據(jù)提取等的數(shù)據(jù)庫管理工作。
二是獲取公開數(shù)據(jù),政府、企業(yè)、統(tǒng)計(jì)局等機(jī)構(gòu)有。
三是通過Python編寫網(wǎng)頁爬蟲。
3.數(shù)據(jù)預(yù)處理
對(duì)殘缺、重復(fù)等異常數(shù)據(jù)進(jìn)行清洗。
4.數(shù)據(jù)分析與建模
這個(gè)部分需要了解基本的統(tǒng)計(jì)分析方法、數(shù)據(jù)挖掘算法,了解不同統(tǒng)計(jì)方法適用的場(chǎng)景和適合的問題。
5.數(shù)據(jù)可視化和分析報(bào)告撰寫
學(xué)習(xí)一款可視化工具,將數(shù)據(jù)通過可視化最直觀的展現(xiàn)出來。
數(shù)據(jù)分析入門需要掌握的技能有:
1. SQL(數(shù)據(jù)庫):
怎么從數(shù)據(jù)庫取數(shù)據(jù)?怎么取到自己想要的特定的數(shù)據(jù)?等這些問題就是你首要考慮的問題,而這些問題都是通過SQL解決的,所以SQL是數(shù)據(jù)分析的最基礎(chǔ)的技能。
2. excel
分析師更多的時(shí)候是在分析數(shù)據(jù),分析數(shù)據(jù)時(shí)需要把數(shù)據(jù)放到一個(gè)文件里,就是excel。
熟練excel常用公式,學(xué)會(huì)做數(shù)據(jù)透視表,什么數(shù)據(jù)畫什么圖等。
3.Python或者R的基礎(chǔ):
必備項(xiàng),也是加分項(xiàng),在數(shù)據(jù)挖掘方向是必備項(xiàng),語言相比較工具更加靈活也更加實(shí)用。
4.學(xué)習(xí)一個(gè)可視化工具
如果你想往更高層次發(fā)展,上面的東西頂多只占20%,剩下的80%則是業(yè)務(wù)理解能力,目標(biāo)拆解能力,根據(jù)數(shù)據(jù)需求更多新技能的學(xué)習(xí)能力。
一個(gè)很好的學(xué)習(xí)網(wǎng)址:
https://www.cnblogs.com/nxld/p/6756492.html
聯(lián)系客服