編者按: 人工智能和機(jī)器學(xué)習(xí)可謂火爆空前。自從AlphaGo完勝人類圍棋頂尖棋手后,人們關(guān)于人工智能的討論就從未間斷過。 有人說,人工智能會使大批人失業(yè),又有人說,人工智能會給人類帶來威脅。更多人期待的則是,人工智能可以幫助我們創(chuàng)造更多的價值。AI是一個非常廣義的概念。為了更好的了解它,現(xiàn)在先讓我們來討論一下人工智能的一個重要分支——機(jī)器學(xué)習(xí)。本文編譯于Ben Dickson近期在techfinancials.co.za上發(fā)表的題為“What is machine learning?”的文章。
當(dāng)我第一次試著編程時,我就愛上了這門藝術(shù)(是的,我相信編程既是科學(xué)又是藝術(shù)), 那一年,我九歲。 我很快就迷上了如何通過設(shè)置邏輯規(guī)則和條件來控制程序的流程,if... else語句,switch,循環(huán)等等。
在接下來的幾年里,我學(xué)會了通過創(chuàng)建模塊和將代碼段抽象成函數(shù)和類的手段來保持代碼整潔。 我通過面向?qū)ο蟮姆治龊驮O(shè)計(OOA / D)增強(qiáng)了我的軟件開發(fā)技能。 我學(xué)習(xí)了代碼的重復(fù)使用和設(shè)計模式。 我學(xué)會了用UML圖形和示意圖來解釋我的程序。 我學(xué)會了將這些原則應(yīng)用于近十幾種不同的編程語言之中。
但是編程的經(jīng)驗法則保持不變:定義規(guī)則和邏輯。 其余的只是幫助實施和維護(hù)這些規(guī)則的技巧。
幾十年來,基于規(guī)則的代碼主導(dǎo)了我們創(chuàng)建軟件的方式。 我們分析一個或一組問題,指定邊界,實例,進(jìn)程,關(guān)系,并將它們轉(zhuǎn)換為確定軟件工作方式的規(guī)則。
雖然這種方法對我們來說很好,但卻導(dǎo)致了“笨”軟件,除非人類以某種方式更新其邏輯,否則該程序永遠(yuǎn)不會改變其行為。 另外,它也不適用于規(guī)則不明確的情況,例如識別圖像中的對象,在網(wǎng)絡(luò)流量中發(fā)現(xiàn)惡意活動,或是在不平坦的地面上對機(jī)器人進(jìn)行導(dǎo)航。
機(jī)器學(xué)習(xí)是現(xiàn)代人工智能的基石,它顛覆了傳統(tǒng)編程模式。 機(jī)器學(xué)習(xí)有助于創(chuàng)建修正和改善其性能的軟件,而無需人類向其解釋如何完成任務(wù)。 這就是我們今天直接使用的, 以及許多即將發(fā)生的,創(chuàng)新背后的技術(shù),包括你從網(wǎng)站,數(shù)字助理,無人駕駛汽車,分析軟件等處看到的令人驚訝的建議。
機(jī)器學(xué)習(xí)是從示例中學(xué)習(xí)的軟件。 你不需要編寫機(jī)器學(xué)習(xí)的算法,而是通過提供大量的相關(guān)數(shù)據(jù),來訓(xùn)練它們。 例如,不要試圖對機(jī)器算法解釋一只貓看起來是什么樣的,你需要通過提供數(shù)百萬張貓的圖片來培訓(xùn)它。 該算法在這些圖像中找到重復(fù)的模式,并為自己確定如何定義貓的外觀。在此之后,當(dāng)你向該程序顯示新照片時,它可以區(qū)分照片中是否含有貓的成分。
許多人將機(jī)器學(xué)習(xí)等同于人工智能。 然而,AI是一個松散的概念,它可以應(yīng)用于從復(fù)雜的、基于規(guī)則的軟件到尚未發(fā)明的,人類智能之間的任何事情。 實際上,機(jī)器學(xué)習(xí)是AI的一個特別分支,它基于數(shù)據(jù)而并非規(guī)則來創(chuàng)建程序。
機(jī)器學(xué)習(xí)有幾種不同風(fēng)格的算法。 其中最流行的是“監(jiān)督學(xué)習(xí)”,進(jìn)一步說,就是你使用帶有標(biāo)簽數(shù)據(jù)的訓(xùn)練算法,將一組輸入對象(通常為矢量)映射到一組期望的輸出值中(也稱為監(jiān)督信號)。 上面所講的貓的示例就是監(jiān)督學(xué)習(xí)的一個例子。 另一個例子是語音識別,你可以通過提供聲音波形來對應(yīng)其中的書面字體。
你提供給監(jiān)督學(xué)習(xí)的算法樣本越多,其分析新數(shù)據(jù)的能力就越精確。 而這也是監(jiān)督學(xué)習(xí)的主要挑戰(zhàn)。 創(chuàng)建帶有標(biāo)記樣本的大數(shù)據(jù)非常耗時,同時也需要大量的人力。 一些平臺,如亞馬遜的Mechanical Turk提供數(shù)據(jù)標(biāo)簽服務(wù)。
在“無監(jiān)督學(xué)習(xí)”中,機(jī)器學(xué)習(xí)的另一個分支,則沒有參考數(shù)據(jù),一切都沒有標(biāo)簽。 換句話說,你提供輸入,但不提供輸出。 該算法對未標(biāo)記的數(shù)據(jù)進(jìn)行整理,提取推論并找出模式。 無人監(jiān)督學(xué)習(xí)對于人類無法定義的,隱藏模式的情況尤其有用。
例如,你允許機(jī)器學(xué)習(xí)算法監(jiān)視你的網(wǎng)絡(luò)活動。 然后,它將根據(jù)其找到的模式設(shè)置正常網(wǎng)絡(luò)活動的基準(zhǔn)。根據(jù)這個標(biāo)準(zhǔn),它將檢測并且記錄異常網(wǎng)絡(luò)活動。
與監(jiān)督學(xué)習(xí)相比,無監(jiān)督的學(xué)習(xí)更接近于機(jī)器自我學(xué)習(xí)的過程。 然而,無監(jiān)督學(xué)習(xí)的問題是其結(jié)果往往是不可預(yù)測的。 這就是為什么它通常需要結(jié)合人的直覺來引導(dǎo)其保持正確方向,因為它一切都是自學(xué)的。 例如,上述網(wǎng)絡(luò)安全的例子,網(wǎng)絡(luò)活動中有許多原因會使其偏離規(guī)范,然而這并不是惡意制造的。 但機(jī)器學(xué)習(xí)的算法并不知道。在開始的時候,人類分析人員必須糾正其決定,直到它學(xué)會判斷異常并作出更好的決策。
另一個不太知名的機(jī)器學(xué)習(xí)領(lǐng)域是“強(qiáng)化學(xué)習(xí)”。在強(qiáng)化學(xué)習(xí)中,程序員定義了狀態(tài),期望目標(biāo),允許的行動以及約束。 該算法通過嘗試將各種不同的允許行動進(jìn)行組合來了解如何實現(xiàn)目標(biāo)。 當(dāng)你知道目標(biāo)是什么,但無法定義達(dá)到目標(biāo)的路徑時,此方法特別有效。
強(qiáng)化學(xué)習(xí)在許多設(shè)置中被使用。 在更著名的案例中,Google DeepMind的AlphaGo,掌握了復(fù)雜的棋盤游戲Go的機(jī)器學(xué)習(xí)程序。 該公司正在采用同樣的方法來提高英國電網(wǎng)的效率。 Uber也在使用相同的技術(shù)來教AI代理玩?zhèn)b盜獵車手車(或更準(zhǔn)確地說,讓它們自己學(xué)習(xí))。
雖然機(jī)器學(xué)習(xí)是人工智能的一個分支,但深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的專門分支。 深度學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò),一個具有人類大腦結(jié)構(gòu)和功能的復(fù)制品。
深入學(xué)習(xí)解決了上一代學(xué)習(xí)算法中存在的一個主要問題。先前, 隨著數(shù)據(jù)的增長,算法平臺的效率和性能趨于停滯。 現(xiàn)在,深度學(xué)習(xí)算法在獲得更多數(shù)據(jù)的同時,其性能也在不斷改進(jìn)。深度學(xué)習(xí)算法并不是直接通過將輸入映射到輸出的方式,而是依賴于幾層處理單元。 每個層將其輸出傳遞到下一個層,進(jìn)行處理,然后再傳遞到下一層。 在某些模型中,計算可能會在處理層之間來回流動多次?,F(xiàn)已證明深度學(xué)習(xí)在各種任務(wù)中非常有效,包括圖像字幕,語音識別和語言翻譯。
雖然機(jī)器學(xué)習(xí)對未來應(yīng)用的發(fā)展至關(guān)重要,但并不是沒有自己的挑戰(zhàn)。
一方面,機(jī)器學(xué)習(xí)算法的開發(fā)和部署在很大程度上依賴于大量的計算和存儲資源來執(zhí)行其任務(wù)。 這種依賴關(guān)系使得它們在執(zhí)行時受限于云服務(wù)和大數(shù)據(jù)。 因此,在執(zhí)行邊緣計算機(jī)集成解決方案時(edge intelligence)它們更具挑戰(zhàn)性。
機(jī)器學(xué)習(xí)的另一個問題 - 特別是深度學(xué)習(xí) - 是它的不透明度性。 隨著算法變得越來越復(fù)雜,人類越來越難以解釋它們是基于什么,做出決定的。 在許多情況下,這可能不是問題。 但是,當(dāng)你想要對算法做出關(guān)鍵決定時,使它們具有透明性并且讓人一目了然是非常重要的。
此外還存在一些偏見問題。 機(jī)器學(xué)習(xí)往往會吸收嵌入到它們在接受培訓(xùn)時,數(shù)據(jù)中包含的一些的習(xí)慣和傾向。 在某些情況下,尋找和消除偏見很容易,而在其他情況下,它的嵌入度極深,人類往往難以察覺。
然而,這些挑戰(zhàn)都不可能阻止AI和機(jī)器學(xué)習(xí)成為我們這個時代的通用技術(shù)(這個術(shù)語曾經(jīng)被用于蒸汽機(jī)和電力這樣的發(fā)明)。 不管我們往哪個方向發(fā)展,機(jī)器學(xué)習(xí)都將會對我們產(chǎn)生深刻影響。
原文鏈接:https://techfinancials.co.za/2017/09/08/what-is-machine-learning/
編譯組出品。編輯:郝鵬程
聯(lián)系客服