人工智能(AI)和機(jī)器學(xué)習(xí)(ML)是目前最熱門的話題。
術(shù)語“AI”每天無處不在。經(jīng)常聽到有抱負(fù)的開發(fā)者說他們想要學(xué)習(xí)人工智能。還聽到高管們說他們希望在他們的服務(wù)中實(shí)施AI。但很多時候,很多人都不明白AI是什么。
閱讀完本文后,您將了解AI和ML的基礎(chǔ)知識。更重要的是,您將了解最受歡迎的ML類型深度學(xué)習(xí)是如何工作的。
背景
了解深度學(xué)習(xí)如何運(yùn)作的第一步是掌握重要術(shù)語之間的差異。
人工智能與機(jī)器學(xué)習(xí)
人工智能
是人類智能在計算機(jī)中的復(fù)制。
當(dāng)AI研究首次開始時,研究人員正試圖復(fù)制人類智能以執(zhí)行特定任務(wù) - 比如玩游戲。
他們介紹了計算機(jī)需要尊重的大量規(guī)則。計算機(jī)有一個特定的可能操作列表,并根據(jù)這些規(guī)則做出決策。
機(jī)器學(xué)習(xí)
是指機(jī)器使用大型數(shù)據(jù)集而不是硬編碼規(guī)則進(jìn)行學(xué)習(xí)的能力。
ML允許計算機(jī)自己學(xué)習(xí)。這種類型的學(xué)習(xí)利用了現(xiàn)代計算機(jī)的處理能力,可以輕松處理大型數(shù)據(jù)集。
監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)
涉及使用具有輸入和預(yù)期輸出的標(biāo)記數(shù)據(jù)集。
當(dāng)您使用監(jiān)督學(xué)習(xí)訓(xùn)練AI時,您可以給它一個輸入并告訴它預(yù)期的輸出。
如果AI生成的輸出錯誤,則會重新調(diào)整其計算結(jié)果。這個過程在數(shù)據(jù)集上迭代完成,直到AI不再犯錯誤為止。
監(jiān)督學(xué)習(xí)的一個例子是天氣預(yù)測AI。它學(xué)會使用歷史數(shù)據(jù)預(yù)測天氣。該訓(xùn)練數(shù)據(jù)具有輸入(壓力,濕度,風(fēng)速)和輸出(溫度)。
無監(jiān)督學(xué)習(xí)
是使用沒有指定結(jié)構(gòu)的數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí)的任務(wù)。
當(dāng)您使用無監(jiān)督學(xué)習(xí)訓(xùn)練AI時,您可以讓AI對數(shù)據(jù)進(jìn)行邏輯分類。
無監(jiān)督學(xué)習(xí)的一個例子是電子商務(wù)網(wǎng)站的行為預(yù)測AI。它不會通過使用標(biāo)記的輸入和輸出數(shù)據(jù)集來學(xué)習(xí)。
相反,它將創(chuàng)建自己的輸入數(shù)據(jù)分類。它會告訴您哪種用戶最有可能購買不同的產(chǎn)品。
現(xiàn)在,深度學(xué)習(xí)如何運(yùn)作?
您現(xiàn)在已準(zhǔn)備好了解深度學(xué)習(xí)是什么以及它是如何工作的。
深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法。它允許我們在給定一組輸入的情況下訓(xùn)練AI來預(yù)測輸出。有監(jiān)督和無監(jiān)督學(xué)習(xí)都可以用來訓(xùn)練AI。
我們將通過建立假設(shè)的機(jī)票價格估算服務(wù)來了解深度學(xué)習(xí)的工作原理。我們將使用有監(jiān)督的學(xué)習(xí)方法對其進(jìn)行訓(xùn)練。
我們希望我們的機(jī)票價格估算器使用以下輸入預(yù)測價格(為簡單起見,我們不包括退票):
神經(jīng)網(wǎng)絡(luò)
讓我們看看人工智能的大腦內(nèi)部。
像動物一樣,我們的估算器AI的大腦有神經(jīng)元。它們由圓圈表示。這些神經(jīng)元是相互連接的。
神經(jīng)元被分為三種不同類型的層:
在輸入層接收輸入數(shù)據(jù)。在我們的例子中,我們在輸入層有四個神經(jīng)元:Origin機(jī)場,目的地機(jī)場,出發(fā)日期和航空公司。輸入層將輸入傳遞給第一個隱藏層。
在隱藏圖層上我們投入的數(shù)學(xué)計算。創(chuàng)建神經(jīng)網(wǎng)絡(luò)的挑戰(zhàn)之一是決定隱藏層的數(shù)量,以及每層的神經(jīng)元數(shù)量。
深度學(xué)習(xí)中的“ 深層”是指具有多個隱藏層。
在輸出層返回的輸出數(shù)據(jù)。在我們的例子中,它給了我們價格預(yù)測。
那么它如何計算價格預(yù)測呢?
這就是深度學(xué)習(xí)的魔力所在。
神經(jīng)元之間的每個連接與權(quán)重相關(guān)聯(lián)。這個權(quán)重決定了輸入值的重要性。初始權(quán)重是隨機(jī)設(shè)置的。
在預(yù)測機(jī)票價格時,出發(fā)日期是較重的因素之一。因此,出發(fā)日期神經(jīng)元連接將具有很大的權(quán)重。
每個神經(jīng)元都有一個激活功能。沒有數(shù)學(xué)推理,這些函數(shù)很難理解。
簡而言之,其目的之一是“標(biāo)準(zhǔn)化”神經(jīng)元的輸出。
一旦輸入數(shù)據(jù)集通過神經(jīng)網(wǎng)絡(luò)的所有層,它就會通過輸出層返回輸出數(shù)據(jù)。
沒什么復(fù)雜的吧?
訓(xùn)練神經(jīng)網(wǎng)絡(luò)
培訓(xùn)AI是深度學(xué)習(xí)中最難的部分。為什么?
大型數(shù)據(jù)集。
大量的計算能力。
對于我們的機(jī)票價格估算器,我們需要查找機(jī)票價格的歷史數(shù)據(jù)。由于大量可能的機(jī)場和出發(fā)日期組合,我們需要一個非常大的票價列表。
為了訓(xùn)練AI,我們需要從數(shù)據(jù)集中提供輸入,并將其輸出與數(shù)據(jù)集的輸出進(jìn)行比較。由于人工智能尚未經(jīng)過培訓(xùn),其產(chǎn)出將是錯誤的。
一旦我們完成整個數(shù)據(jù)集,我們就可以創(chuàng)建一個函數(shù),向我們展示AI輸出與實(shí)際輸出的錯誤。此功能稱為成本函數(shù)。
理想情況下,我們希望我們的成本函數(shù)為零。那時我們的AI輸出與數(shù)據(jù)集輸出相同。
我們?nèi)绾谓档统杀竞瘮?shù)?
我們改變神經(jīng)元之間的權(quán)重。我們可以隨機(jī)更改它們直到我們的成本函數(shù)很低,但這不是很有效。
相反,我們將使用一種名為Gradient Descent的技術(shù)。
Gradient Descent是一種允許我們找到函數(shù)最小值的技術(shù)。在我們的例子中,我們正在尋找最低成本函數(shù)。
它的工作原理是在每次數(shù)據(jù)集迭代后以小增量改變權(quán)重。通過計算成本函數(shù)在某一組權(quán)重下的導(dǎo)數(shù)(或梯度),我們能夠看出最小值的方向。
要最小化成本函數(shù),您需要多次遍歷數(shù)據(jù)集。這就是您需要大量計算能力的原因。
使用梯度下降更新權(quán)重是自動完成的。這就是深度學(xué)習(xí)的魔力!
一旦我們訓(xùn)練了我們的機(jī)票價格估算器AI,我們就可以用它來預(yù)測未來的價格。
綜上所述…
自然語言處理 (Natural Language Processing,NLP) 是計算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能夠?qū)崿F(xiàn)人與計算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。
目前市面上非常缺乏自然語言處理方面的人才,對應(yīng)的薪水也要高于其他崗位1倍以上,甚至更高。有2,3年經(jīng)驗(yàn)的人才要價50-60萬年薪是很正常的一件事情!
聯(lián)系客服