更新時(shí)間:2022年12月21日10時(shí)36分 來(lái)源:傳智教育 瀏覽次數(shù):
在弄清楚大數(shù)據(jù)分析師要學(xué)什么之前,我們先來(lái)對(duì)大數(shù)據(jù)這個(gè)概念稍作下了解。大數(shù)據(jù)也叫作巨量數(shù)據(jù)或者說(shuō)海量數(shù)據(jù),基于大數(shù)據(jù)結(jié)構(gòu)復(fù)雜和類型復(fù)雜的特點(diǎn),技術(shù)人員從這類數(shù)據(jù)中去獲取有價(jià)值的信息的能力,我們稱為大數(shù)據(jù)技術(shù)。一般來(lái)講,大數(shù)據(jù)分析師主要要學(xué)習(xí)以下技術(shù):
在剛踏入大數(shù)據(jù)這行的時(shí)候,我們會(huì)有直觀的感覺(jué)就是數(shù)據(jù)挖掘和數(shù)據(jù)分析十分相像,隨著我們工作的逐漸深入,在挖掘與分析兩個(gè)細(xì)分領(lǐng)域我們能體會(huì)出有明顯的差別。數(shù)據(jù)挖掘涉及到的算法和模型是相當(dāng)多的,比方說(shuō)可視化技術(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)算法及K平均算法等。
數(shù)據(jù)分析在整個(gè)大數(shù)據(jù)分析師的學(xué)習(xí)生涯里是一個(gè)具有挑戰(zhàn)性的工作,因?yàn)樾袠I(yè)的不同,所涉及到的業(yè)務(wù)就會(huì)差別較大。對(duì)于初級(jí)的數(shù)據(jù)分析師而言,會(huì)使用數(shù)據(jù)分析工具制作簡(jiǎn)單的圖表,結(jié)合數(shù)據(jù)得出一定的結(jié)論是必要的。而對(duì)高級(jí)數(shù)據(jù)分析師而言,更要有縝密的思維和邏輯,能夠洞察數(shù)據(jù)中存在的問(wèn)題并提出行之有效的觀點(diǎn),這就需要對(duì)業(yè)務(wù)理解得更加深刻。
軟件從易到難分別有Excel、Spass和SAS。通常作為初級(jí)的數(shù)據(jù)分析師,會(huì)使用SQL進(jìn)行查詢,編寫Hadoop和Hive很有必要;另外,會(huì)使用Python可以在工作中起到事半功倍的效果。利用好工具和軟件循序漸進(jìn),對(duì)數(shù)據(jù)進(jìn)行一步步清洗和整理,最終得到一個(gè)明確的結(jié)果。
一提到概率論和統(tǒng)計(jì),很多朋友都聯(lián)想到了高等數(shù)學(xué),其實(shí)就互聯(lián)網(wǎng)的數(shù)據(jù)分析現(xiàn)狀來(lái)說(shuō),對(duì)于統(tǒng)計(jì)理論這塊不需要做到太深入復(fù)雜的研究,還是要在實(shí)踐中去印證更為重要。
北京校區(qū)