提到人工智能(下文簡稱為AI),如今大家顯然都不會(huì)感到陌生。小到智能手機(jī)里的拍照算法,大到醫(yī)療診斷的工具軟件、工業(yè)生產(chǎn)線上的機(jī)器人、城市中的交通調(diào)度和安防監(jiān)控系統(tǒng),AI正在以前所未有的速度和效率改變著我們的日常生活,更在不斷促進(jìn)著諸多行業(yè)的改變與進(jìn)步。但你知道AI是如何誕生的嗎,該怎樣“造”出一個(gè)AI嗎,如果你是一名并未接觸過AI的程序員,接到上級(jí)想要在業(yè)務(wù)中部署AI的指令,又該如何是好呢?別擔(dān)心,這些答案在2020年12月9日都迎來了解答。因?yàn)榫驮谶@一天,全球云計(jì)算行業(yè)領(lǐng)導(dǎo)者AWS召開了他們以機(jī)器學(xué)習(xí)(Machine learning, 下文簡稱為ML)為主題的活動(dòng)。而機(jī)器學(xué)習(xí),正是如今最主流的AI實(shí)現(xiàn)方式之一。機(jī)器學(xué)習(xí)是什么?簡單來說,它是一種通過使用大量的特定數(shù)據(jù),經(jīng)過相應(yīng)算法進(jìn)行訓(xùn)練,最終誕生出一個(gè)可以實(shí)際使用(AI)模型的機(jī)制。打個(gè)比方,就好像讓一個(gè)人在一段時(shí)間里閱讀大量同一類型的書籍,并最終形成某一個(gè)固定的思維模式一樣。正因如此,對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)過程來說,開發(fā)者需要經(jīng)歷收集和準(zhǔn)備訓(xùn)練用數(shù)據(jù)、選擇和優(yōu)化學(xué)習(xí)算法、配置和管理機(jī)器學(xué)習(xí)過程、對(duì)訓(xùn)練出的模型進(jìn)行微調(diào)和查錯(cuò)、在生產(chǎn)環(huán)境中部署AI模型,以及擴(kuò)大和管理生產(chǎn)環(huán)境等多個(gè)繁瑣且相當(dāng)“燒錢”的過程,才能將一項(xiàng)項(xiàng)數(shù)據(jù)最終轉(zhuǎn)換為生產(chǎn)線或最終產(chǎn)品里起作用的“AI算法(模型)”。很顯然,對(duì)于任何一個(gè)常規(guī)企業(yè)或個(gè)人開發(fā)者來說,想要靠自己去完成整個(gè)過程實(shí)際上都是極不劃算的。而這也正是為什么自從AWS推出云端機(jī)器學(xué)習(xí)Amazon SageMaker以來,它就一路成長為AWS旗下增長速度最快的業(yè)務(wù),并得到全球成千上萬家客戶信賴的原因。那么,Amazon SageMaker到底有哪些特色呢?首先,它提供了能大幅簡化數(shù)據(jù)準(zhǔn)備過程的Amazon Sagemaker Data Wrangler服務(wù),它允許開發(fā)者從多個(gè)數(shù)據(jù)源導(dǎo)入數(shù)據(jù),并通過內(nèi)置的300余個(gè)免費(fèi)的預(yù)置數(shù)據(jù)轉(zhuǎn)換選項(xiàng),讓開發(fā)者甚至連一行代碼也不用寫,就能在直觀的圖形界面下就能直接搞定數(shù)據(jù)的預(yù)處理和一鍵導(dǎo)出。其次在通常的機(jī)器學(xué)習(xí)過程中,為了優(yōu)化模型訓(xùn)練的效果,我們通常必須把原始的、關(guān)聯(lián)性小的數(shù)據(jù)提煉為一些明顯的、具有代表性的特征(Feature)。對(duì)于AWS來說,Amazon Sagemaker Data Wrangler可以輕松做到近乎自動(dòng)化的特征提取,而在這之后,就可以使用Amazon SageMaker Feature Store對(duì)特征數(shù)據(jù)進(jìn)行簡便易得的圖形化管理和存儲(chǔ)。與常規(guī)的機(jī)器學(xué)習(xí)工具相比,Amazon SageMaker Feature Store不僅具備高度可視化的圖形界面,它還可以做到安全地存儲(chǔ)、發(fā)現(xiàn),以及共享特性數(shù)據(jù),并在執(zhí)行新的機(jī)器學(xué)習(xí)任務(wù)時(shí),輕松地對(duì)此前已經(jīng)提煉出的特性進(jìn)行再度使用,而無需重新配置數(shù)據(jù)。當(dāng)然,有的時(shí)候我們會(huì)發(fā)現(xiàn),辛辛苦苦收集了數(shù)據(jù)、訓(xùn)練出了模型,最后模型的預(yù)測值卻與真實(shí)情況相差甚大。這種時(shí)候,模型本身的偏差顯然就使得它無法用在產(chǎn)品上了。為了避免這種情況,AWS在今天也正式發(fā)布了全新的機(jī)器學(xué)習(xí)工具,旨在實(shí)現(xiàn)全流程端對(duì)端偏差監(jiān)測的Amazon SageMaker Clarify。Amazon SageMaker Clarify能做些什么?在數(shù)據(jù)分析階段,它能夠分析數(shù)據(jù)本身的偏差值,發(fā)現(xiàn)那些可能出錯(cuò)的數(shù)據(jù),避免將其引入訓(xùn)練。而在模型訓(xùn)練階段,它能夠在訓(xùn)練后對(duì)模型進(jìn)行偏差和可解釋性分析,并及時(shí)發(fā)現(xiàn)模型中的問題。在部署生產(chǎn)階段,它能夠持續(xù)驗(yàn)證模型偏差和數(shù)據(jù)特征的相關(guān)性,從而幫助企業(yè)在進(jìn)一步的模型訓(xùn)練中提高精確度。不僅如此,考慮到如今機(jī)器學(xué)習(xí)早已成為一種極為消耗資源的計(jì)算項(xiàng)目,為了幫助開發(fā)者更好地識(shí)別計(jì)算瓶頸,最大化性能利用,AWS今天還為SageMaker Debugger調(diào)試器新增了Deep Profiling深入分析功能。它能夠以直觀的圖形界面顯示當(dāng)前各種計(jì)算資源的占用情況,并給出如何進(jìn)行優(yōu)化的建議。這樣一來,開發(fā)者就能及時(shí)調(diào)整算力分布或訓(xùn)練計(jì)劃,從而縮短訓(xùn)練時(shí)間,并進(jìn)一步提升整體效益。事實(shí)上說到機(jī)器學(xué)習(xí)的效益,可以說正是AWS這些年一直在努力,且始終引領(lǐng)行業(yè)標(biāo)準(zhǔn)的驕傲所在。一方面,AWS目前已經(jīng)擁有了包括Intel、AMD、ARM三種不同計(jì)算架構(gòu)的云計(jì)算能力,并提供包括CPU與GPU在內(nèi)的多種機(jī)器學(xué)習(xí)加速方案;另一方面,得益于剛剛發(fā)布的,由AWS自主設(shè)計(jì)的AWS Trainium機(jī)器學(xué)習(xí)處理器,云端機(jī)器學(xué)習(xí)的處理效能得以進(jìn)一步提高。事實(shí)上在幾乎所有主流的機(jī)器學(xué)習(xí)模型里,如今AWS都已經(jīng)可以帶來比過去快得多的訓(xùn)練速度,從而有效提高開發(fā)者的效益。有意思的是,在AWS看來,如果一個(gè)企業(yè)內(nèi)部僅有少數(shù)幾名員工掌握了運(yùn)用機(jī)器學(xué)習(xí)技術(shù)的能力,那么其實(shí)并不是一種好的現(xiàn)象。一方面這是因?yàn)闄C(jī)器學(xué)習(xí)本身就需要大量的數(shù)據(jù)、反復(fù)的訓(xùn)練和迭代才能更加準(zhǔn)確、更為好用;另一方面來說,缺乏交流的業(yè)務(wù)進(jìn)行方式,也很容易讓相關(guān)員工陷入消極和被動(dòng)之中,從而影響到最終的產(chǎn)品品質(zhì)。那么,解決問題的辦法是讓大家都去學(xué)習(xí)AI和機(jī)器學(xué)習(xí)相關(guān)的編程知識(shí)嗎?這不失為一種解決辦法,但現(xiàn)在AWS有了更好的主意。因?yàn)樗麄冮_發(fā)出了面向數(shù)據(jù)庫管理員、數(shù)據(jù)分析師的全新“黑科技”,讓這些人無需相關(guān)知識(shí)背景也能用好機(jī)器學(xué)習(xí)。這就是Amazon SageMaker Autopilot,正如它的名稱(Autopilot直譯就是自動(dòng)導(dǎo)航)所示的那樣,這是一種讓ML開發(fā)者可以完全拋棄相關(guān)編程知識(shí),只需輸入原始數(shù)據(jù)就能在幾分鐘內(nèi)得到可用機(jī)器學(xué)習(xí)模型的自動(dòng)生成技術(shù)。在這個(gè)過程中,AWS會(huì)自動(dòng)完成數(shù)據(jù)分析、特征提取、模型訓(xùn)練,以及模型分析,并最終按照性能高低給出數(shù)個(gè)現(xiàn)成可用的機(jī)器學(xué)習(xí)模型,且立刻就能投入實(shí)際生產(chǎn)。不僅如此,AWS現(xiàn)在還擁有了包括Amazon Aurora ML、Amazon Athena ML、Amzon Redshift ML等一系列深植于數(shù)據(jù)庫產(chǎn)品中的機(jī)器學(xué)習(xí)服務(wù)。通過這些服務(wù),數(shù)據(jù)庫操作員僅需要使用他們熟悉的SQL工具,就能完成對(duì)數(shù)據(jù)庫內(nèi)數(shù)據(jù)的自動(dòng)篩選、訓(xùn)練、構(gòu)建起可供預(yù)測、查詢和自動(dòng)生成數(shù)據(jù)報(bào)告的機(jī)器學(xué)習(xí)模型。可能有的朋友會(huì)說,我們公司實(shí)在太缺機(jī)器學(xué)習(xí)的開發(fā)人員,也不知道機(jī)器學(xué)習(xí)到底對(duì)于傳統(tǒng)制造業(yè)到底能起到怎樣的幫助。就算這樣,AWS也能幫到我嗎?答案是肯定的,因?yàn)榫驮谇皫滋?,AWS剛剛發(fā)布了針對(duì)工業(yè)生產(chǎn)線的多項(xiàng)機(jī)器學(xué)習(xí)服務(wù)。它們包括自動(dòng)檢測異常設(shè)備狀況的Amazon Monitron、能配合設(shè)備傳感器進(jìn)行自動(dòng)預(yù)測性設(shè)備維護(hù)的Amazon Lookout for Equipment、能通過工業(yè)攝像頭改善質(zhì)量控制或者保護(hù)員工安全的AWS Panorama Appliance、能為攝像設(shè)備添加計(jì)算視覺處理能力的AWS Panorama軟件開發(fā)套件(SDK),以及可以通過分析生產(chǎn)線監(jiān)控視頻、自動(dòng)發(fā)現(xiàn)產(chǎn)品制造缺陷或者生產(chǎn)流程異常狀況的Amazon Lookout for Vision。舉例而言,鉛筆制造業(yè)無疑是一個(gè)歷史悠久、自動(dòng)化程度也非常高的產(chǎn)業(yè)。在傳統(tǒng)的鉛筆制造生產(chǎn)線上,為了監(jiān)控生產(chǎn)設(shè)備的工作是否正常,一臺(tái)機(jī)器可能要被安裝幾十個(gè)傳感器,它們有的測量轉(zhuǎn)速、有的測量壓力、有的測量溫度、有的測量顏料的余量……然而這樣一來,設(shè)備管理員需要一次同時(shí)監(jiān)控許許多多的傳感器數(shù)據(jù),工作量極大。并且另一方面,當(dāng)設(shè)備出現(xiàn)一些故障(比如說可能被意外卡?。┑臅r(shí)候,這些數(shù)量眾多的傳感器其實(shí)未必能夠直接指出問題所在,實(shí)際上還會(huì)給檢修增添麻煩。相比之下,AWS的解決之道就智能多了。首先他們發(fā)布了應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的Monitron傳感器和網(wǎng)關(guān)產(chǎn)品,這些傳感器只需要監(jiān)測設(shè)備的溫度和振動(dòng)兩項(xiàng)指標(biāo),就能夠在它們出現(xiàn)細(xì)微故障征兆的時(shí)候自動(dòng)發(fā)出警報(bào),大幅降低了設(shè)備管理員的工作量。其次通過只有一個(gè)鞋盒大小的AWS Panorama Appliance設(shè)備,傳統(tǒng)的工業(yè)攝像機(jī)就能搖身一變成為機(jī)器學(xué)習(xí)質(zhì)量檢測攝像頭,它可以精確地“看出”生產(chǎn)線上的鉛筆是否削切正確,上色是否均勻,從而在設(shè)備出現(xiàn)故障、產(chǎn)品出現(xiàn)瑕疵時(shí)迅速提醒相關(guān)人員,避免造成更大的損失。除了工業(yè)生產(chǎn)外,AWS如今的機(jī)器學(xué)習(xí)技術(shù)也已經(jīng)被全球大量頭部健康關(guān)懷和生命科學(xué)企業(yè)所采用。在積累了足夠的技術(shù)經(jīng)驗(yàn)后,AWS也于今天正式發(fā)布了全新的Amazon HealthLake服務(wù)。它能夠提供PB級(jí)別健康數(shù)據(jù)和生命科學(xué)研究結(jié)果的云端存儲(chǔ)、分析、機(jī)器學(xué)習(xí)推測服務(wù),從而幫助醫(yī)療機(jī)構(gòu)更好地追蹤病例、更好地判斷病灶、幫助藥品研發(fā)機(jī)構(gòu)準(zhǔn)確預(yù)測疾病趨勢,或是通過機(jī)器學(xué)習(xí)模型加速新藥研發(fā)。相比過去所采用的企業(yè)自有計(jì)算資源,不斷升級(jí)的AWS通過強(qiáng)大的算力、先進(jìn)的算法,以及低成本的存儲(chǔ)空間,有效降低了健康產(chǎn)業(yè)的運(yùn)營成本,加速了新服務(wù)及新藥品的落地,更使得“終身健康關(guān)懷”成為了唾手可得的事實(shí)。為什么我們需要機(jī)器學(xué)習(xí)?在AWS看來,能夠“溫故以知新”,從過去的數(shù)據(jù)中找出未來趨勢的機(jī)器學(xué)習(xí)技術(shù),是當(dāng)今所有的企業(yè)適應(yīng)劇變中的世界,提高自身運(yùn)行效率和競爭力的最有力方法之一。迄今為止,全球已經(jīng)有超過十萬家客戶選擇了AWS開展他們的機(jī)器學(xué)習(xí)項(xiàng)目,截至目前為止,在全球已經(jīng)“上云”的TensorFlow和PyTorch算法機(jī)器學(xué)習(xí)項(xiàng)目中,AWS作為運(yùn)行平臺(tái)的比例已經(jīng)分別達(dá)到了92%和91%。而在我們所熟知的企業(yè)當(dāng)中,包括達(dá)美樂披薩、羅氏制藥、拜耳制藥、寶馬、耐克,以及F1的諸多巨頭也早已投入到AWS云端機(jī)器學(xué)習(xí)的懷抱中。不過在AWS看來,僅僅只有大企業(yè)、僅僅只有少數(shù)技術(shù)精英享受AWS機(jī)器學(xué)習(xí)的好處,還是遠(yuǎn)遠(yuǎn)不夠的。因?yàn)橹挥凶尭嗳硕颊莆諜C(jī)器學(xué)習(xí)的能力,它才能更好地服務(wù)于我們生活的每個(gè)方面,并造福于我們每個(gè)人。這也就是為何AWS會(huì)在今天的發(fā)布會(huì)最后,大力強(qiáng)調(diào)機(jī)器學(xué)習(xí)教育重要性的原因,畢竟AI的時(shí)代已經(jīng)到來,而我們每一個(gè)人都不應(yīng)該被這個(gè)時(shí)代拋棄。對(duì)于蘋果昨晚剛剛上架的AirPods Max,或許“智能”才是它的主打方向。
如今突然爆紅的社區(qū)團(tuán)購,真能成為下一個(gè)熱門賽道嗎?
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。