從科幻小說到可靠和多樣化的放大了商業(yè)運(yùn)作的多個要素的商業(yè)工具,機(jī)器學(xué)習(xí)已經(jīng)走過了很長一段路。機(jī)器學(xué)習(xí)對業(yè)務(wù)績效的影響可能非常大,因此需要實施機(jī)器學(xué)習(xí)算法以保持許多領(lǐng)域和行業(yè)的競爭力。
將機(jī)器學(xué)習(xí)實施到業(yè)務(wù)運(yùn)營是一個戰(zhàn)略步驟,需要大量資源。 因此,知道你希望ML為你的特定業(yè)務(wù)做什么以及不同類型的ML算法帶來什么樣的好處是非常重要的。在本文中,我們將介紹主要類型的機(jī)器學(xué)習(xí)算法,解釋每個算法的目的,并了解它們的優(yōu)點。
監(jiān)督學(xué)習(xí)算法是直接監(jiān)督運(yùn)行的一種算法。在這種情況下,開發(fā)人員可以標(biāo)記樣本數(shù)據(jù)語并設(shè)置算法運(yùn)行的嚴(yán)格邊界。
這是一個“喂食”版本的機(jī)器學(xué)習(xí):
你選擇什么樣的輸入(樣本)來“喂”算法;
需要什么樣的結(jié)果(例如“是/否”或“真/假”)。
從機(jī)器的角度來看,這個過程或多或少是一個“連接點”的例行程序。
監(jiān)督學(xué)習(xí)的主要目的是擴(kuò)展數(shù)據(jù)范圍,并根據(jù)標(biāo)記的樣本數(shù)據(jù)預(yù)測未知標(biāo)記的數(shù)據(jù),未來的或由已標(biāo)記的樣本無法推斷的數(shù)據(jù)。
監(jiān)督機(jī)器學(xué)習(xí)包括兩個主要過程:分類和回歸。
分類是基于過去的數(shù)據(jù)樣本標(biāo)記并且手動訓(xùn)練算法以識別某些類型的對象,并相應(yīng)地對它們進(jìn)行分類的過程。系統(tǒng)必須知道如何區(qū)分信息類型,并進(jìn)行特定對象的識別(特定數(shù)據(jù)是否符合或不符合特定要求的方式為“是”或“否”) 。
回歸是識別模式和計算連續(xù)結(jié)果預(yù)測的過程。系統(tǒng)必須理解這些數(shù)字,數(shù)值,分組(例如,高度和寬度)等。
最常用的監(jiān)督機(jī)器學(xué)習(xí)有:
線性回歸
邏輯回歸
隨機(jī)森林
梯度下降決策樹
支持向量機(jī)(SVM)
神經(jīng)網(wǎng)絡(luò)
決策樹
樸素貝葉斯
鄰近鄰居(Nearest Neighbor)
監(jiān)督學(xué)習(xí)算法使用實例:
監(jiān)督學(xué)習(xí)最常用的領(lǐng)域是銷售,零售商業(yè)和股票交易中的價格預(yù)測和趨勢預(yù)測。 在這兩種情況下,算法都使用傳入數(shù)據(jù)來評估結(jié)果的可能性并計算可能的結(jié)果。最好的例子是像Seismic和Highspot這樣的銷售支持平臺,它們使用這種算法來模擬各種可能的情景以供考慮。
監(jiān)督學(xué)習(xí)的商業(yè)案例包括將廣告技術(shù)操作作為廣告內(nèi)容交付順序的一部分的情況。 監(jiān)督學(xué)習(xí)算法的作用是評估廣告空間的價格及其在實時出價過程中的價值,并將預(yù)算支出保持在特定限制之下。(例如,單個購買的價格范圍和總體預(yù)算的某時段)
無監(jiān)督學(xué)習(xí)是指不直接控制模型進(jìn)展的。 如果監(jiān)督機(jī)器學(xué)習(xí)的要點是在知道標(biāo)簽的狀況下需要對數(shù)據(jù)進(jìn)行分類,那么在無監(jiān)督機(jī)器學(xué)習(xí)算法下,期望的結(jié)果是未知并且尚未定義的。
兩者之間的另一個重要區(qū)別是,監(jiān)督學(xué)習(xí)專門使用標(biāo)記數(shù)據(jù),而無監(jiān)督學(xué)習(xí)則使用未標(biāo)記數(shù)據(jù)。
無監(jiān)督機(jī)器學(xué)習(xí)用于:
探索數(shù)據(jù)的結(jié)構(gòu)
從數(shù)據(jù)中提取有價值的信息
發(fā)現(xiàn)數(shù)據(jù)中的模式
將以上用于實際問題中,以提高效率
換句話說,無監(jiān)督機(jī)器學(xué)習(xí)通過篩選信息并理解信息來描述信息。
無監(jiān)督學(xué)習(xí)算法應(yīng)用以下方式來描述數(shù)據(jù):
聚類:它是對用于基于其內(nèi)部模式將其分割成有意義的組,分割出的組沒有任何前驗知識。分組的憑據(jù)由各個數(shù)據(jù)對象的相似性以及與其余數(shù)據(jù)對象的不相似性(也可用于檢測異常)來定義。
維度降低:傳入數(shù)據(jù)中存在大量噪音。 機(jī)器學(xué)習(xí)算法使用降維來消除噪聲,同時提取相關(guān)信息。
最常用的無監(jiān)督學(xué)習(xí)算法有:
K-Means聚類
t-SNE(t-Distributed Stochastic Neighbor Embedding)
PCA(主成分分析)
關(guān)聯(lián)規(guī)則(Association Rule)
無監(jiān)督學(xué)習(xí)算法使用實例:
數(shù)字營銷和廣告技術(shù)是無人監(jiān)督學(xué)習(xí)被用于最大效果的領(lǐng)域。 除此之外,無監(jiān)督學(xué)習(xí)通常用于探索客戶信息并相應(yīng)地調(diào)整服務(wù)。關(guān)鍵問題在于,傳入的數(shù)據(jù)中有很多所謂的“已知未知數(shù)”。 業(yè)務(wù)運(yùn)營的有效性取決于能夠理解未標(biāo)記數(shù)據(jù)并從中提取相關(guān)見解的能力。
無監(jiān)督算法定義了現(xiàn)代數(shù)據(jù)管理。 目前,Lotame和Salesforce是實施此ML算法的最前沿數(shù)據(jù)管理平臺之一。
因此,可以使用無監(jiān)督學(xué)習(xí)來基于某些憑證來識別目標(biāo)受眾群體(它可以是行為數(shù)據(jù),個人數(shù)據(jù)的元素,特定的軟件設(shè)置等)。 此算法可用于開發(fā)更有效的廣告內(nèi)容定位,也可用于識別廣告系列效果中的模式。
半監(jiān)督學(xué)習(xí)算法是介于監(jiān)督和無監(jiān)督算法之間的一種算法。 本質(zhì)上,半監(jiān)督模型將兩者的某些方面結(jié)合到一個自己的計算中。
半監(jiān)督算法的工作原理為:
半監(jiān)督機(jī)器學(xué)習(xí)算法使用一組數(shù)量較小的有標(biāo)記的樣本數(shù)據(jù)來完成某些操作的要求(如自我訓(xùn)練)。
樣本數(shù)量的使得訓(xùn)練出的模型為部分訓(xùn)練模型(Partial-trained model),該模型的任務(wù)是獲取未標(biāo)記數(shù)據(jù)的標(biāo)記,其結(jié)果被認(rèn)為是偽標(biāo)記數(shù)據(jù)。
最后,結(jié)合標(biāo)記和偽標(biāo)記的數(shù)據(jù)集,這創(chuàng)建了一種獨特的算法,該算法結(jié)合了監(jiān)督和無監(jiān)督學(xué)習(xí)的描述性和預(yù)測性。
半監(jiān)督學(xué)習(xí)使用分類過程來識別數(shù)據(jù)資產(chǎn)和聚類過程,以將其分組為不同的部分。
半監(jiān)督機(jī)器學(xué)習(xí)使用實例:
法律和醫(yī)療等行業(yè)在半監(jiān)督學(xué)習(xí)的幫助下得以管理網(wǎng)絡(luò)內(nèi)容分類,進(jìn)行圖像及語音分析。
在Web內(nèi)容分類的情況下,半監(jiān)督學(xué)習(xí)應(yīng)用于爬蟲引擎和內(nèi)容聚合系統(tǒng)。 在這兩種情況下,它都使用各種標(biāo)簽來分析內(nèi)容并將其排列在特定配置中。 但是,此程序通常需要人工輸入才能進(jìn)一步分類。
一個優(yōu)秀例子是uClassify。 此類別的另一個著名工具是GATE(General Architecture for Text Engineering,文本工程的通用架構(gòu))。在圖像和語音分析的情況下,算法執(zhí)行標(biāo)記以提供基于樣本庫的具有相干轉(zhuǎn)錄的可行圖像或語音分析模型。 例如,它可以是MRI或CT掃描。 利用一小組示例性掃描,可以提供能夠識別圖像中的異常的相干模型。
強(qiáng)化學(xué)習(xí)通常被理解為人工智能。
實質(zhì)上,強(qiáng)化學(xué)習(xí)就是開發(fā)一種自我維持的系統(tǒng),該系統(tǒng)在連續(xù)的嘗試和失敗序列中,基于標(biāo)記數(shù)據(jù)的組合和與傳入數(shù)據(jù)的交互來改進(jìn)自身。
強(qiáng)化ML使用稱為探索/開發(fā)的技術(shù)。其機(jī)制很簡單,即動作發(fā)生、觀察結(jié)果,根據(jù)上一個結(jié)果做出下一個動作。
在強(qiáng)化中心,學(xué)習(xí)算法是在執(zhí)行特定任務(wù)時發(fā)生的獎勵信號。在某種程度上,獎勵信號用作增強(qiáng)算法的導(dǎo)航工具。他們讓人理解正確和錯誤的行動方針。
兩種主要類型的獎勵信號是:
正獎勵信號鼓勵特定的行動順序持續(xù)進(jìn)行
負(fù)獎勵信號因執(zhí)行任務(wù)而受到懲罰,并促使其糾正算法以停止懲罰。
然而,獎勵信號的功能可以根據(jù)信息的特征而變化。因此,可以根據(jù)操作的要求進(jìn)一步對獎勵信號進(jìn)行分類??傮w而言,該系統(tǒng)試圖最大化正獎勵以最大限度地減少負(fù)面影響。
最常用的強(qiáng)化學(xué)習(xí)算法包括:
Q-Learning
瞬時差分(Temporal Difference,TD)
蒙特卡洛樹搜索(Monte-Carlo Tree Search,MCTS)
Asynchronous Actor-Critic Agents (A3C)
強(qiáng)化機(jī)器學(xué)習(xí)的應(yīng)用場景:
強(qiáng)化機(jī)器學(xué)習(xí)適用于可用信息有限或不連貫的情況。在這種情況下,算法的操作過程可以通過與數(shù)據(jù)和相關(guān)進(jìn)程的交互來形成。
現(xiàn)代NPC和其他視頻游戲大量使用強(qiáng)化學(xué)習(xí)模型。強(qiáng)化學(xué)習(xí)讓AI對玩家的行為有更加靈活地反應(yīng),從而為玩家提供了挑戰(zhàn)。例如,碰撞檢測功能將強(qiáng)化學(xué)習(xí)算法用于俠盜獵車手系列中的移動車輛和人員。
自動駕駛汽車也依賴于強(qiáng)化學(xué)習(xí)算法。例如,如果自動駕駛汽車(如Waymo)檢測到前方是左轉(zhuǎn)道路,它就會激活“向左轉(zhuǎn)”場景,依此類推。強(qiáng)化學(xué)習(xí)這種適應(yīng)變化的最著名的例子是AlphaGo與世界排名第二的圍棋玩家直接對決,其通過計算當(dāng)前棋盤位置的動作序列來戰(zhàn)勝人類選手。
另一方面,營銷和廣告技術(shù)運(yùn)營也使用強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)可以通過適應(yīng)用戶的行為和周圍環(huán)境,使重定向操作更靈活,并更有效地提供轉(zhuǎn)換。
此外,強(qiáng)化學(xué)習(xí)用于放大和調(diào)整自然語言處理(NLP)及聊天機(jī)器人的對話生成:
模仿輸入消息的風(fēng)格
開發(fā)更具吸引力,信息量更大的回復(fù)
根據(jù)用戶反應(yīng)找到相關(guān)的答案
隨著Google DialogFlow構(gòu)建的出現(xiàn),這種機(jī)器人成為了用戶體驗的挑戰(zhàn)而非技術(shù)層面。
如上所述,不同類型的機(jī)器學(xué)習(xí)算法正在解決不同類型的問題。 不同算法的結(jié)合使得其能夠處理各種各樣的任務(wù)并從各種數(shù)據(jù)中提取有價值的信息。
無論應(yīng)用企業(yè)是出租車應(yīng)用程序還是食品配送服務(wù),甚至是社交媒體移動應(yīng)用程序,一切都可以從機(jī)器學(xué)習(xí)算法中受益。 準(zhǔn)備開始了嗎? APP解決方案團(tuán)隊會利用他們的專業(yè)知識將ML算法構(gòu)建并實施到各種類型的項目中,我們很期待看到機(jī)器學(xué)習(xí)的應(yīng)用持續(xù)增長。
聯(lián)系客服