九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
今天的內(nèi)容你可能看不懂,全是關(guān)于AI算法的終極討論

人工智能下一站是哪里?

深度學習還能紅多久?

全球最頂尖的科學家,

共論AI的未來。

他們的眼光,

越過當下,

落在那個AI與人類共存的未來。

數(shù)據(jù)、算法、算力,人工智能三要素。如果說數(shù)據(jù)和算力是必要條件,決定了AI的過去,那么算法作為“靈魂”,定義了AI的未來。

自人工智能概念被提出60多年來,幾起幾落,直到2012年深度學習技術(shù)被引入圖像識別和語音識別數(shù)據(jù)集之后,才進入真正爆炸期。如今,基于神經(jīng)網(wǎng)絡(luò)的深度學習算法已經(jīng)被廣泛應(yīng)用甚至商業(yè)化,同時亦有諸多問題未能解釋,或者并無太好解決方案。

深度學習算法之后是什么?如何解決機器學習算法門檻高、算法人才不足的問題?如何打破數(shù)據(jù)孤島并且保護數(shù)據(jù)隱私?如何找到破解深度學習“黑箱”的方法?如何保證機器學習系統(tǒng)的安全性?

來自全球的人工智能“最強大腦”們,為你解答。

NELL

自我學習永不停止

人工智能技術(shù)正以一日千里的速度向前發(fā)展。2016年,阿爾法狗戰(zhàn)勝李世石時,人們還在討論這種有監(jiān)督的學習,到底能不能算真正智能,如今,無監(jiān)督的人工智能NELL自動學習的數(shù)據(jù)已經(jīng)超過2500萬個。

機器學習之父、卡耐基梅隆大學計算機學院院長湯姆·米切爾和他的團隊,2010年便開始做一個項目——NELL(永恒語言學習)。

(“機器學習之父”湯姆·米切爾)

NELL每天只做兩件事:第一,24小時不停搜集網(wǎng)絡(luò)上的公開內(nèi)容,豐富結(jié)構(gòu)化的事實和知識的知識庫;第二,根據(jù)已有的文本和知識具備的知識抽取能力,優(yōu)化自己的閱讀能力,從而通過自我學習、自我標注,不斷提升自我理解能力。湯姆認為,計算機是可以做到無監(jiān)督學習的。

所謂有監(jiān)督學習,是指機器對標注過的數(shù)據(jù)進行訓練,并將結(jié)果與預測結(jié)果進行比較,后進行修正,而無監(jiān)督學習,則更有點像人類,數(shù)據(jù)沒有任何標注,也沒有人告訴計算機,這個數(shù)據(jù)用來做什么,你的目的是什么,計算機只能自我學習。

回溯NELL的“出生”,可能更利于人們了解它的模式。2010年,NELL剛開始時,湯姆放入了少量標注過的樣本,比如飲料、人、植物、城市等,并加入了一定的關(guān)系說明,比如說人創(chuàng)建了公司,飲料是食物產(chǎn)生的等等,然后在此基礎(chǔ)上,利用少量標注樣本集合訓練學習模型,再以此模型去標注更多樣本。

這些初始樣本類似“種子”,NELL從它這里學到不同信息之間的關(guān)聯(lián),然后將已知的關(guān)系和本體進一步擴展,對沒有事先標注的數(shù)據(jù)進行指導、分類,并納入知識庫。比如“楓葉的故鄉(xiāng)是加拿大,多倫多是屬于加拿大的一座城市”等等三元關(guān)系,都是在對海量、無意識的網(wǎng)絡(luò)信息進行篩選,并不斷和知識庫里的知識進行疊加后,NELL自己得出的結(jié)論。

“事實上計算機是可以做到無監(jiān)督學習的,它們每天都在提升水平,”湯姆·米切爾表示?!拔覀儚膫鹘y(tǒng)的單一函數(shù)學習框架擴展到了多函數(shù),今天,我們已經(jīng)擁有 4000 余種分類方法,1.2億三元的數(shù)據(jù)知識庫,實現(xiàn)了前所未有的準確性?!?/p>

深度森林

“非神經(jīng)”的深度學習

“現(xiàn)在我們每天都在談?wù)撋疃葘W習,這種方法取得了巨大成功。但它到底是什么?為什么深比淺好?”南京大學計算機系主任、人工智能學院院長、歐洲科學院外籍院士周志華一直在思考一個問題,如果能搞懂深度學習到底做了什么,是不是能實現(xiàn)那些目的的算法,就是好算法。

(周志華)

1

滿足三要素不一定非要神經(jīng)網(wǎng)絡(luò)

“有一個錯誤的觀點認為,現(xiàn)在AI成功是因為有強大的算力,只要把老算法放在新機器上就可以了,”周志華說道,“事實上,訓練深層神經(jīng)網(wǎng)絡(luò)的算力在20 世紀 90 年代就已經(jīng)具備。但我們使用反向傳播方法(bp算法)訓練神經(jīng)網(wǎng)絡(luò)需要做梯度優(yōu)化,否則就會出現(xiàn)梯度消失問題。直到2006年,Geoffrey Hinton才通過逐層訓練的方法解決了這個問題。”

周志華認為,目前主流的深度神經(jīng)網(wǎng)絡(luò)關(guān)鍵是,第一要有逐層的處理;第二要有特征的內(nèi)部變化;第三,要有足夠的模型復雜度。簡單來說,就是當一張圖片被計算機看到后,識別它的神經(jīng)網(wǎng)絡(luò)有很多層,最底層識別到的可能只是像素,慢慢有邊緣,再往上有輪廓等等,模型不斷往上尋找這張圖片的特征,而這個辨識特征的模型是不斷可以向上分層的,最終一張圖可能被分成無數(shù)個特征點,每一層的函數(shù)計算可能很簡單,但如果層級夠深,一層嵌套一層,模型足夠復雜,對圖片的識別能力就越強。

2012年ImageNet競賽時,冠軍只用了8層,到2016年已經(jīng)可以做到1207層,現(xiàn)在更是超過了2000層,這是一個非常龐大的系統(tǒng),深度神經(jīng)網(wǎng)絡(luò)對算力的需求可想而知。

但反過來想,“只要做到這三點,我們就能做到一個好的深度神經(jīng)網(wǎng)絡(luò)。而更重要的結(jié)論是:這三點猜測沒有說非要神經(jīng)網(wǎng)絡(luò)不可,我們可以研究神經(jīng)網(wǎng)絡(luò)之外的模型?!边@是周志華和他的團隊提出“深度森林”的根本理論基礎(chǔ)。

2

“深度森林”首戰(zhàn):找出非法套現(xiàn)者

“深度森林”也是深度學習的一種,但它并不是神經(jīng)網(wǎng)絡(luò),而是不使用BP算法訓練的深度模型,是基于決策樹的深度模型。

研究非神經(jīng)網(wǎng)絡(luò)的意義在于,“機器學習早就知道,沒有任何一個模型可以包打天下?!敝苤救A表示。

而且從應(yīng)用價值的角度講,在圖像、視頻、語音之外的很多任務(wù)上,深度神經(jīng)網(wǎng)絡(luò)往往并非最佳選擇,不少方面,比如符號建模、混合建模、離散建模等問題上,甚至表現(xiàn)不佳。

“深度森林”模型得到的結(jié)果和深度神經(jīng)網(wǎng)絡(luò)高度相似,但和神經(jīng)網(wǎng)絡(luò)不同的是,它不需要手動調(diào)整模型參數(shù),可以自適應(yīng)模型復雜度,可以用同樣一套參數(shù),用在不同的任務(wù)中也不需要逐任務(wù)慢慢調(diào)參數(shù),還可以根據(jù)數(shù)據(jù)的大小自動來判定該模型長到什么程度。

這大大解決了神經(jīng)網(wǎng)絡(luò)的黑盒子問題,并提升了混合數(shù)據(jù)建模后的計算效果。周志華曾與國內(nèi)某金融公司合作對判斷“非法套現(xiàn)者”做了測試,需要做的是檢測出欺詐行為的潛在風險,以避免不必要的經(jīng)濟損失。

從此前相關(guān)論文中可以看到,在訓練初期,測試組收集了四個方面的原始信息,包括描述身份信息的賣家特征和買家特征,描述交易信息的交易特征和歷史交易特征。如此,每當一次交易發(fā)生時,就能收集到超過 5000 維的數(shù)據(jù)特征,其中包含了數(shù)值和分類特征,而且有大量符號化的數(shù)據(jù)。

可想而知,原始數(shù)據(jù)的維度高達5000維,其中很可能包含一些不相關(guān)的特征屬性,如果直接使用的話,整個訓練過程將非常耗時,同時也將降低模型部署的效率。

事實上,與之前最好的MART模型相比 (由600個樹結(jié)構(gòu)構(gòu)成的MART模型),深度森林模型 (以MART模型為基礎(chǔ)模塊,每個 ART模塊只需200個樹結(jié)構(gòu)) 能夠以更簡單的結(jié)構(gòu)帶來更顯著的經(jīng)濟效益,大大降低了經(jīng)濟損失。

不過,“深度森林在實驗中做到21層就做不下去了,其中很大一部分原因在于沒有找到適合加速的硬件,”周志華表示,“現(xiàn)代的智能應(yīng)用需要框架和特殊硬件,從另一個角度來看,打破神經(jīng)網(wǎng)絡(luò)、GPU、TensorFlow 等硬件和技術(shù)的壟斷也可以降低智能化時代‘缺芯少魂’的風險?!?/p>

聯(lián)邦學習

打破信息間的不信任

人工智能的場景包括很多方面。在金融業(yè),以用戶數(shù)超過1.7億的微眾互聯(lián)網(wǎng)銀行為例,人工智能和機器人在其中的作用是在用戶辦理業(yè)務(wù)的過程中,審核、批準各種貸款文件,對申請人進行人臉識別、語音識別的核驗等等。在這些應(yīng)用中一個元素至關(guān)重要——數(shù)據(jù)。

1

數(shù)據(jù)孤島依然難打破

實際上,直到今天,深度學習能夠運用到的數(shù)據(jù)仍然非常有限。比如在法律領(lǐng)域,積累一條有效的數(shù)據(jù)需要很長時間,而且法律的數(shù)據(jù)最多積累一萬條就很難再有量的突破;在金融領(lǐng)域、醫(yī)療領(lǐng)域更是如此。由于監(jiān)管、安全、利益等原因,不同醫(yī)院之間的數(shù)據(jù)往往不能夠互相傳遞,在這個情況下,即便有強烈的需求把數(shù)據(jù)聚合起來還是很難。

此外,隨著歐洲GDPR的正式提出、國內(nèi)相關(guān)法律的陸續(xù)出臺不難發(fā)現(xiàn),社會對用戶隱私的要求越來越高,公司之間進行數(shù)據(jù)交換的限制也越來越多。在此情況之下,大數(shù)據(jù)的形成就變成一個挑戰(zhàn)。

在2019世界人工智能大會科學前沿的主論壇上,國際人工智能聯(lián)合會議理事會主席、香港科技大學教授楊強提出了一個新的解決方案——聯(lián)邦學習方法。

楊強表示,所謂聯(lián)邦學習的方法,就是如果我們有辦法讓數(shù)據(jù)的擁有方在數(shù)據(jù)不出本地的情況下,建立一個可以共享的模型,與此同時在建立模型的過程中不違反用戶的隱私,那么整個建模的過程就叫聯(lián)邦學習的框架和算法。

眾安保險數(shù)據(jù)智能中心總經(jīng)理孫谷飛告訴《IT時報》記者,聯(lián)邦學習2016年由谷歌提出,用來優(yōu)化安卓輸入法的模型。比如,谷歌想給每個安卓手機優(yōu)化輸入法,但不可能把每一臺安卓手機用戶打的文字都上傳上來,這有嚴重的隱私問題。所以想的方法是在基礎(chǔ)端學習本地的模型,把每一個參數(shù)上傳到“云服務(wù)器”,并且在云端進行模型的融合,最后再將優(yōu)化的結(jié)果推送到客戶。

2

讓不同機構(gòu)間有共同語言

“在保護隱私的過程中,一共有三種模式進行聯(lián)邦學習,分別是橫向聯(lián)邦學習、縱向聯(lián)邦學習和聯(lián)邦遷移學習?!睏顝娬f道。

橫向聯(lián)邦學習是不同的機構(gòu)共享一些用戶的特征,這些機構(gòu)可以把這個模型通過橫向聯(lián)邦學習更新聚合,過程中可以保護隱私;縱向聯(lián)邦學習則是,不同的機構(gòu)雖然不共享用戶的特征,但是他們卻共享用戶的ID,可以利用這些散落在各地的數(shù)據(jù)形成一個整體的模型聯(lián)邦,對此加密之后,使得各個機構(gòu)的數(shù)據(jù)不出本地就可以進行用戶隱私的保護;聯(lián)邦遷移學習則是,用遷移學習的算法把兩方數(shù)據(jù)的模型的本質(zhì)給挖掘出來,把抽象的模型加以聚合,那么在這個聚合的過程中就保護用戶隱私。

目前,聯(lián)邦學習在產(chǎn)業(yè)界的應(yīng)用已經(jīng)有了長足的進展,在第一屆國際聯(lián)邦學習的研討會上也開放了世界上首個聯(lián)邦學習的開源平臺。

孫谷飛透露,在保險行業(yè)的業(yè)務(wù)場景里,目前聯(lián)邦學習的方式分為兩類。第一類是行業(yè)內(nèi)共享,大家有差不多相同的X值和Y值,可以促進整個行業(yè)的數(shù)據(jù)共享和積累,主要涉及聯(lián)合風控和定價,比如意外險累計的保額。舉個例子,去年有一個用戶短期之內(nèi)在很多保險公司買了非常高額的意外險,這是很典型的欺詐行為,如果大家把累計保額通過隱私方式共享出來,可以很好杜絕此類風險。

第二類場景是跨行業(yè)共享。各場景方X軸可以給保險公司更好的補充,讓保險公司可以多方面了解客戶,比如做各種互聯(lián)網(wǎng)的險種,可以跟一些電商公司進行合作,了解平常的一些購買行為,就可以很好地做運費險定價。

楊強表示,目前他和團隊正在建立一個國際聯(lián)邦學習的標準,使得不同的機構(gòu)之間可以有共同的語言,這樣在建立聯(lián)邦學習共同模型的時候,各方可以更敏捷地溝通。

作者郝俊慧 李丹琦

編輯挨踢妹

圖片/網(wǎng)絡(luò)

來源/《IT時報》公眾號vittimes

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
深度森林打破神經(jīng)網(wǎng)絡(luò)壟斷,AutoML讓AI本身自動化:WAIC國際前沿算法峰會落幕
拯救AI
AI的發(fā)展不會對人類造成損害|專訪楊強
醫(yī)學影像與基因組學,NVIDIA Clara正在這兩個方向潛入
解析 | 人工智能發(fā)展及技術(shù)架構(gòu)
人工智能行業(yè)深度分析:第四次工業(yè)革命,AI 助力人類進入新世界
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服