更新時間:2020年04月23日14時10分 來源:傳智播客 瀏覽次數(shù):
隨著互聯(lián)網(wǎng)的高速發(fā)展,被收集并應用于分析的數(shù)據(jù)量呈現(xiàn)出爆發(fā)式增長,面對如此量級的數(shù)據(jù),以及常見的實時利用該數(shù)據(jù)的需求,僅依靠人工處理難免力不從心,這就催生了所謂的大數(shù)據(jù)和機器學習系統(tǒng)。
機器學習是一門多領域的交叉學科,涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科,專門研究計算機如何模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。通俗地講,傳統(tǒng)計算機工作時需要接收指令,并按照指令逐步執(zhí)行,最終得到計算結果;機器學習是通過某種算法,將歷史數(shù)據(jù)進行訓練得出某種模型,當有新的數(shù)據(jù)提供時,可以使用訓練產(chǎn)生的模型對未來進行預測。機器學習是一種能夠賦予機器進行自主學習,不依靠人工進行自主判斷的技術,它和人類對歷史經(jīng)驗歸納的過程有著相似之處,接下來,通過圖1和圖2對機器學習和人類思考過程進行對比。
圖1
圖2
圖1是機器學習的過程,圖2圖則是人類思考的過程。人類在學習成長的過程中,積累了很多歷史經(jīng)驗,將經(jīng)驗進行歸納總結,得到規(guī)律,因此當人類遇到些問題時,總能從事物的發(fā)展規(guī)律找到方向,進行推測;而機器學習中的訓練和預測過程可以近似看作人類的歸納和推測的過程。從圖1中可以發(fā)現(xiàn),機器學習思想并不復雜,僅僅是對人類學習成長過程的一個模擬,由于機器學習不是通過編程的形式得出結果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出相關結論。這也可以聯(lián)想到人類為什么要學習歷史,歷史實際上是人類對過往經(jīng)驗的總結,俗話說“歷史總是驚人的相似”,通過學習歷史,可以從中歸納出事物發(fā)展的規(guī)律,從而指導今后的工作。如根據(jù)數(shù)據(jù)類型和需求的不同,建模方式也會不同。在機器學習領域中,按照學習方式分類,可以讓研究人員在建模和算法選擇的時候,根據(jù)輸入數(shù)據(jù)來選擇合適的算法,從而得到更好的效果,通常機器學習可以分為下面兩類。
(1)有監(jiān)督學習。通過已有的訓練樣本(即已知數(shù)據(jù)以及其對應的輸出)訓練得到一個最優(yōu)模型,再利用這個模型將所有的輸入映射為相應的輸出,對輸出進行簡單的判斷從而實現(xiàn)分類的目的。如分類、回歸和推薦算法都屬于有監(jiān)督學習。
(2)無監(jiān)督學習。針對類別未知(沒有被標記)的訓練樣本,需要直接對數(shù)據(jù)進行建模,人們無法知道要預測的答案。如聚類、降維和文本處理的某些特征提取都屬于無監(jiān)督學習。
以上我們介紹了“機器學習的相關知識”,希望對您有所幫助,如果想了解更多機器學習相關知識可以關注傳智播客大數(shù)據(jù)課程。
猜你喜歡: