自2016 AlphaGo 圍棋戰(zhàn)后,人工智能是確實被點燃起來了。
這是一張來自IT桔子的投資數(shù)據(jù),可以看到投資的金額是在逐年遞增,整個人工智能行業(yè)越來越火熱,需求的崗位也越來越多。所以先從技術(shù)的角度聊聊什么目前人工智能是怎樣的。前方會有大量理論知識,可以選擇性跳過。
在過去人工智能主流是符號主義學派,他們認為人工智能是建立在數(shù)理邏輯為基礎(chǔ)的。典型的就是我們編程出來的軟件,就是被認為是帶有智能,只是這個智能比較低級。所以人工智能其實沒那么玄,不過確實被過去的一些電影作品,文學作品所夸大了。
我們先聊聊人類智能是構(gòu)成。人類的智能是通過神經(jīng)系統(tǒng)感知,傳遞,存儲,加工,最后做出反應(yīng)。人通過身上的大量的感覺神經(jīng)元,感知外界信息,轉(zhuǎn)換成信號傳送到大腦,然后通過大腦進行加工整合成立體的印象。比如大腦整合蘋果的顏色屬性(如紅色)和形狀屬性(如圓形),得到蘋果就是圓形紅色的結(jié)論。
目前的主流的人工智能流派是連接主義,連接主義學派是仿生的學派。用工程技術(shù)的手段模擬人腦的神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能,通過大量的處理器模擬人腦的眾多神經(jīng)元,用處理器復(fù)雜的連接關(guān)系模擬人腦中神經(jīng)元之間的突觸行為,用大量知識,經(jīng)驗進行學習,構(gòu)建出智能。這就是目前的人工智能。
機器學習是人工智能的重要研究方向之一,通過線性代數(shù)(集合,向量,矩陣)來描述特征形成數(shù)據(jù),以這些數(shù)據(jù)構(gòu)建起概率統(tǒng)計模型,同時運用模型對事情預(yù)測分析,目的是為了解決問題。其實就是我們在大學里的數(shù)學建模嘛。
機器學習的預(yù)測結(jié)果并不一定準確,因為
一任何算法預(yù)測出結(jié)果與所有訓(xùn)練數(shù)據(jù)結(jié)果難以絲毫不差。
二訓(xùn)練數(shù)據(jù)與真實數(shù)據(jù)相比是不完全的,而且會有噪音的存在。
因此在機器學習中誤差難以避免的。典型的問題就是過擬合(過度的貼近訓(xùn)練數(shù)據(jù)的結(jié)果)和欠擬合(未能學習訓(xùn)練數(shù)據(jù)中的關(guān)系)。一般欠擬合可以更換學習算法進行改進,但過擬合是不可避免的。所以在沒有遇見過的樣本的表現(xiàn)(泛化能力)是重要指標之一。
為了降低誤差,人工神經(jīng)網(wǎng)絡(luò)出現(xiàn)了。大腦對信息的加工是復(fù)雜的多次的處理。人工神經(jīng)網(wǎng)絡(luò)其實就是模擬大腦對信息的處理,對信息的多層次的處理,通過權(quán)重的控制,不同特征的提取,降低誤差,讓模型的表現(xiàn)優(yōu)異。深度學習其實就是人工神經(jīng)網(wǎng)絡(luò)的加強版,多加幾層,利用逼近定理讓精度更高一些。不過深度學習還缺少缺乏一些理論基礎(chǔ),比較前沿,有待驗證,盡管已經(jīng)取得不少結(jié)果。
訓(xùn)練的數(shù)據(jù)帶結(jié)果的,叫監(jiān)督學習。訓(xùn)練的不帶結(jié)果的,更多是為了把訓(xùn)練數(shù)據(jù)進行分類,叫無監(jiān)督學習。各帶一半的,叫半監(jiān)督學習。目前監(jiān)督學習是機器學習的主流任務(wù)。
因此機器學習日常要解決的問題。
一解決誤差問題。(貝葉斯公式,線性回歸,決策樹,交叉驗證,集成學習等等)
二數(shù)據(jù)問題,如噪音,數(shù)據(jù)過多,過少等。(數(shù)據(jù)剪裁,數(shù)據(jù)分類等等)
三性能問題,一個神經(jīng)網(wǎng)絡(luò)可能會包含上100個參數(shù),每個參數(shù)包含有上100種取值。所以需要調(diào)參,進行一個誤差與效率的折中。
恭喜理論知識到此結(jié)束,然后我們聊聊我的看法和商業(yè)應(yīng)用。
上面有說到,目前計算機的運算能力依然是機器學習發(fā)展瓶頸,所以定制芯片是解決這個問題的解決方案之一。
目前谷歌的tensorflow是主流的機器學習的框架。我看了一些封裝了各種模型調(diào)用就行。但機器學習需要的人是理論基礎(chǔ)比較好的,數(shù)學基礎(chǔ)比較好的,編程只是一種手段,不需要過于精通。
然后到應(yīng)用層,圖像識別,語音處理,文字處理等等這些是應(yīng)用的基礎(chǔ)層,之前理論說到的感知。應(yīng)用方面會有幾個大方面
一決策類。像自動駕駛,智能投放系統(tǒng),量化交易等等。不過之前的理論有說到過,機器學習是會有誤差的,但人的操作也會有誤差,但機器學習的誤差會來得更低一些,發(fā)揮也會更穩(wěn)定一些,所以會優(yōu)于人工?;蛘呤且恍┹o助決策類。
二替代低端勞動力類。像一些掃地機器人,無人港口,智能客服等等。大幅度的替代傳統(tǒng)人力,生產(chǎn)無人化。
三定制化的服務(wù)類。像推薦系統(tǒng),智能老師等等。機器學習能計算出一些人類難以手工計算的復(fù)雜度異常高問題,提出多種的解決方案。定制化的服務(wù)就是屬于此類,由標準化與差異化組成。人工是難以做到千人千面,但機器能輕松做到。
人工智能的本身其實是不產(chǎn)生價值的,更多是處于優(yōu)化環(huán)節(jié),在商業(yè)鏈條上不占據(jù)位置的,價值是在于效率優(yōu)化,這價值要能支撐得起高昂的人才成本。當然也有可能在改造的過程中,造成一些定式的打破,產(chǎn)生新的需求。我認為這波人工智能熱潮的紅利應(yīng)該是傳統(tǒng)行業(yè),傳統(tǒng)行業(yè)大部分核心業(yè)務(wù)仍需要靠人力輔助來完成,因為機器替代人工的這個效能是能達到10倍以上,這將會是最大的紅利。上面也說到其實機器學習的人才的需求是比較高端的,所以人力的成本會很高。沒有足夠的勢能差是難以推動。互聯(lián)網(wǎng)其實已經(jīng)經(jīng)歷過改造,核心的業(yè)務(wù)其實都已經(jīng)由機器所替代。
當然機器學習并不是萬能的,有要求的
一問題足夠復(fù)雜,因為簡單的用不上
二問題的結(jié)果并不是由隨機,是由軌跡可循的。
三可訓(xùn)練的數(shù)據(jù)能量化(外貌是能量化,但世界觀,文化是難以量化)且數(shù)據(jù)數(shù)量足夠多
四世界是變化的,短期的,變動不太大的,或者周期性變化的領(lǐng)域。
五場景相對小,運算力還難以支持起巨大的場景。
六創(chuàng)意類,機器學習是本質(zhì)上是歸納整理,是需要新的數(shù)據(jù),才能產(chǎn)生新結(jié)論。
七機器學習是會犯錯,不能是在一些犯錯會造成嚴重后果的領(lǐng)域。所以核導(dǎo)彈還是需要人來控制。
以上是我對人工智能的見解。畢竟我不是從業(yè)人士,只是出于技術(shù)人對技術(shù)好奇,花兩周時間的學習,了解了這是什么東西,所以如有錯漏,歡迎批評指正。本公眾號有本人的聯(lián)系方式。
聯(lián)系客服