近年來,隨著人工智能的發(fā)展,深度學(xué)習(xí)儼然已經(jīng)成為一個(gè)熱詞。谷歌將深度學(xué)習(xí)應(yīng)用于語音識(shí)別和圖像識(shí)別,Netflix和亞馬遜則利用深度學(xué)習(xí)來了解客戶的行為習(xí)慣。還有一個(gè)事,說出來你可能不信,但確實(shí)已經(jīng)發(fā)生了——MIT的研究學(xué)者已經(jīng)在嘗試用深度學(xué)習(xí)來預(yù)測(cè)未來了。
在真正談及深度學(xué)習(xí)之前,我們必須先來了解一下人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別,請(qǐng)看這張圖:
從這張圖中,很明顯能看出來,機(jī)器學(xué)習(xí)是人工智能的一個(gè)子集,這也就是說,我們可以創(chuàng)建一個(gè)智能機(jī)器,它可以在基于已給的數(shù)據(jù)集中學(xué)習(xí)。當(dāng)然,你肯定也注意到了,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集。我們可以利用簡單的機(jī)器學(xué)習(xí)算法來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),從而在機(jī)器學(xué)習(xí)算法表現(xiàn)得并不好的案例中,獲得更好的準(zhǔn)確度。
深度學(xué)習(xí)是我們?cè)谔卣魈崛r(shí)克服挑戰(zhàn)的方法之一。原因在于,深度學(xué)習(xí)模型只需要編程人員提供的少許指導(dǎo),就可以自己學(xué)習(xí)去關(guān)注正確特征。從基本上來講,深度學(xué)習(xí)模仿的是我們?nèi)祟惔竽X運(yùn)行的方式——從經(jīng)驗(yàn)中學(xué)習(xí)。眾所周知,我們的大腦是由數(shù)十億個(gè)神經(jīng)元組成的,正因?yàn)檫@些神經(jīng)元,我們才能有驚人的行為。即使是個(gè)一歲的小孩子,他也可以解決復(fù)雜的問題,而這些問題是超級(jí)電腦也很難解決的。比如說:
1)認(rèn)出父母以及其他物體。
2)區(qū)分不同的聲音,甚至根據(jù)聲音來認(rèn)出某個(gè)特定的人。
3)從人們的臉部表情推斷出某些結(jié)論。
實(shí)際上,多年來,我們的大腦已經(jīng)不自覺地訓(xùn)練自己去做這些事情。那么深度學(xué)習(xí)是如何模仿大腦功能的呢?嗯,其實(shí)呢,深度學(xué)習(xí)利用的是人工神經(jīng)元概念,其功能與大腦中現(xiàn)存的生物神經(jīng)元有些相似。因此,我們可以說,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子類。
舉個(gè)例子,假設(shè)我們想建立一個(gè)系統(tǒng),可以識(shí)別一張圖片中不同的人臉。如果我們把它當(dāng)作一個(gè)典型的機(jī)器學(xué)習(xí)問題來處理,那么我們可以定義臉部特征,如眼睛、鼻子、耳朵等,那么,這個(gè)系統(tǒng)就可以識(shí)別哪些特征對(duì)于哪個(gè)人來說是更重要的。
現(xiàn)在,深度學(xué)習(xí)已經(jīng)向前邁出了一步。通過深度神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)可以自動(dòng)提取對(duì)分類算法比較重要的特征。而機(jī)器學(xué)習(xí)則需要手動(dòng)定義這些特征。
那么深度學(xué)習(xí)的應(yīng)用領(lǐng)域具體有哪些呢?我來列舉幾個(gè)廣泛應(yīng)用深度學(xué)習(xí)的領(lǐng)域。
一、語音識(shí)別
相信多數(shù)人都聽說過Siri——蘋果的智能語音助手。和其他大廠一樣,蘋果也開始進(jìn)軍深度學(xué)習(xí)。
在語音識(shí)別和智能語音助手領(lǐng)域,我們可以利用深度神經(jīng)網(wǎng)絡(luò)開發(fā)出更準(zhǔn)確的聲學(xué)模型。簡而言之,你可以建立這樣一個(gè)系統(tǒng),學(xué)習(xí)新特征,或者根據(jù)你自己的需求進(jìn)行調(diào)整,從而通過事先預(yù)測(cè)所有可能性來提供更好的幫助。
二、自動(dòng)機(jī)器翻譯
我們都知道,谷歌支持100種語言的即時(shí)翻譯,速度之快宛如魔法。谷歌翻譯的背后,就是機(jī)器學(xué)習(xí)。此時(shí),你可能會(huì)想,谷歌翻譯已經(jīng)經(jīng)歷了很長的時(shí)間,那么現(xiàn)在有些什么新意呢?實(shí)際上,在過去的兩年時(shí)間里,谷歌已經(jīng)完全將深度學(xué)習(xí)嵌入進(jìn)了谷歌翻譯中。事實(shí)上,這些對(duì)語言翻譯知之甚少的深度學(xué)習(xí)研究人員正提出相對(duì)簡單的機(jī)器學(xué)習(xí)解決方案,來打敗世界上最好的專家語言翻譯系統(tǒng)。文本翻譯可以在沒有序列預(yù)處理的情況下進(jìn)行,它允許算法學(xué)習(xí)文字與指向語言之間的關(guān)系。谷歌翻譯利用的是大型遞歸神經(jīng)網(wǎng)絡(luò)的堆疊網(wǎng)絡(luò)。
三、即時(shí)視覺翻譯(拍照翻譯)
眾所周知,深度學(xué)習(xí)可以用來識(shí)別照片中的文字。一旦識(shí)別了,文字就會(huì)被轉(zhuǎn)成文本,并且被翻譯,然后圖片就會(huì)根據(jù)翻譯的文本重新創(chuàng)建。這就是我們通常所說的即時(shí)視覺翻譯。
那么,假設(shè)你現(xiàn)在身處一個(gè)非母語國家,你也不用擔(dān)心,只要下載一個(gè)谷歌翻譯這樣的app,你就可以大膽往前沖。利用這樣的app,你可以去翻譯路標(biāo)或門店名。這類軟件之所能實(shí)現(xiàn)這些目標(biāo),其實(shí)就是因?yàn)樯疃葘W(xué)習(xí)。
四、自動(dòng)駕駛汽車
谷歌利用深度學(xué)習(xí)算法使自動(dòng)駕駛汽車領(lǐng)域達(dá)到了一個(gè)全新的水平。因此,谷歌現(xiàn)在不再使用老的手動(dòng)編碼算法,而是編寫程序系統(tǒng),使其可以通過不同傳感器提供的數(shù)據(jù)來自行學(xué)習(xí)。對(duì)于大多數(shù)感知型任務(wù)和多數(shù)低端控制型任務(wù),深度學(xué)習(xí)現(xiàn)在是最好的方法。因此,即使是不會(huì)開車的人,或是殘疾人,都可以在不依賴于其他人的情況下自己出門。
至此,我其實(shí)只是提了一小部分深度學(xué)習(xí)被廣泛應(yīng)用的領(lǐng)域,事實(shí)上還有很多其他領(lǐng)域有待探索,如果你了解什么,歡迎留言與我探討~
下周見。
編譯 | AI搬運(yùn)工
聯(lián)系客服