作為商業(yè)公司的百度正在積極推動(dòng)開(kāi)源文化。百度 COO 陸奇曾在內(nèi)部講話中表示,開(kāi)源代碼寫得好,不僅能解決大家的痛點(diǎn),開(kāi)源的代碼也會(huì)變得越來(lái)越強(qiáng),開(kāi)源代碼的生命力也必然會(huì)超過(guò)封閉體系的代碼。而百度的深度學(xué)習(xí)平臺(tái) PaddlePaddle 開(kāi)源后,來(lái)自北京工業(yè)大學(xué)的 4 位學(xué)生利用其深度學(xué)習(xí)模型,制造了一臺(tái)智能桃子分揀機(jī)。
2017 年夏天,果農(nóng)劉連全的大桃有了別樣的用途,為智能桃子分揀機(jī)提供了 6400 張照片。
北京工業(yè)大學(xué)的 4 位學(xué)生利用百度 PaddlePaddle 開(kāi)源平臺(tái)上的深度學(xué)習(xí)模型,用這些大桃照片,通過(guò)機(jī)器學(xué)習(xí)和模型訓(xùn)練,制造了一臺(tái)智能桃子分揀機(jī),從形狀、大小、色澤、光潔度等多維度,對(duì)桃子自動(dòng)分級(jí),從而實(shí)現(xiàn)自動(dòng)分揀。
機(jī)器分揀大桃
桃農(nóng)使用機(jī)器
深度學(xué)習(xí)與果蔬分揀融合,減輕農(nóng)民的負(fù)擔(dān)
CB Insights 的數(shù)據(jù)表明,過(guò)去 5 年,農(nóng)業(yè)科技初創(chuàng)企業(yè)募集了超過(guò) 8 億美元的資金。自 2014 年起,融資交易開(kāi)始猛增,與醫(yī)療、金融等領(lǐng)域相比,毫不遜色。
據(jù)世界銀行的數(shù)據(jù)顯示,到 2050 年,世界食物產(chǎn)量至少需要提高 50%,這樣才足以養(yǎng)活屆時(shí)可能達(dá)到 90 億的龐大人口。但逐漸變暖的氣候變化可能致使農(nóng)作物產(chǎn)量減超過(guò) 25%。
人工智能則有望解決這一問(wèn)題。
據(jù)《連線》雜志報(bào)道,生物學(xué)家戴維·休斯(David Hughes)和作物流行病學(xué)家馬塞爾·薩拉斯(Marcel Salathé)使用深度學(xué)習(xí),通過(guò)對(duì) 5 萬(wàn)多張植物葉照片的訓(xùn)練,可以檢測(cè)出 14 種作物的 26 種疾病,準(zhǔn)確率高達(dá) 99.35%。
農(nóng)業(yè)機(jī)器人公司 Blue River Technology 開(kāi)發(fā)的智能化機(jī)器人通過(guò)攜帶的照相設(shè)備每分鐘掃描 5000 株幼苗,利用機(jī)器學(xué)習(xí)以及計(jì)算機(jī)視覺(jué)技術(shù)識(shí)別作物幼苗和雜草。如果是雜草或者長(zhǎng)勢(shì)不好的作物,就使用農(nóng)藥噴霧,如果幼苗間距過(guò)小,就會(huì)自動(dòng)拔掉一棵。
Prospera 公司則依靠實(shí)時(shí)監(jiān)控?cái)z像頭和溫度傳感器使農(nóng)民實(shí)時(shí)了解農(nóng)作物的情況,使農(nóng)民按需給予水、農(nóng)藥和肥料,高效精準(zhǔn)地種植農(nóng)作物。
機(jī)器學(xué)習(xí)算法和智能化機(jī)器人技術(shù)變革農(nóng)業(yè)的生產(chǎn)方式,使農(nóng)作物的種植由傳統(tǒng)依靠經(jīng)驗(yàn)和直覺(jué)變成依靠數(shù)據(jù)、分析、預(yù)測(cè)的精準(zhǔn)農(nóng)業(yè)。此外,在農(nóng)業(yè)的收割階段,機(jī)器學(xué)習(xí)也能廣泛地應(yīng)用,比如蔬果的自動(dòng)分揀。在傳統(tǒng)的自動(dòng)水果分類機(jī)中,只能按照重量或大小分類,不能同時(shí)兼顧大小、賣相等決定水果品質(zhì)的多維度因素,因而無(wú)法解決農(nóng)民精細(xì)分類、精準(zhǔn)定價(jià)的痛點(diǎn)。
以周忠祥為首的 4 位北京工業(yè)大學(xué)的學(xué)生,決定使用機(jī)器視覺(jué)技術(shù)對(duì)水果精確分類,實(shí)現(xiàn)智能分揀,以解決果農(nóng)痛點(diǎn),減輕他們的負(fù)擔(dān)。
學(xué)生收集數(shù)據(jù)
使用PaddlePaddle模型訓(xùn)練,完成桃子多重屬性分類
圖像分類作為智能分揀的核心,是計(jì)算機(jī)視覺(jué)中重要的基本問(wèn)題,也是物體檢測(cè)、圖像分割、物體跟蹤、行為分析等其他高層視覺(jué)任務(wù)的基礎(chǔ),在很多領(lǐng)域都有廣泛的應(yīng)用,比如人臉識(shí)別、智能視頻分析、交通場(chǎng)景識(shí)別、圖像檢索等等。
在這個(gè)過(guò)程中,如何提取圖像的特征至關(guān)重要。在深度學(xué)習(xí)算法之前,通常使用基于詞袋 (Bag of Words) 模型的物體分類方法。而基于深度學(xué)習(xí)的圖像分類方法,則可以取代手工設(shè)計(jì)或選擇圖像特征的工作。
智能桃子分揀機(jī)的團(tuán)隊(duì)也想到了深度學(xué)習(xí)的方法,但所學(xué)專業(yè)是機(jī)械自動(dòng)化和土木工程的他們,擅長(zhǎng)控制和電路,對(duì)機(jī)器學(xué)習(xí)和模型訓(xùn)練卻較為陌生,因而在模型訓(xùn)練方面遇到了不少問(wèn)題。
按照 PaddlePaddle 開(kāi)源平臺(tái)上的教程,他們將不同顏色的海洋球進(jìn)行分類,進(jìn)行訓(xùn)練,但模型的準(zhǔn)確率并不高,于是他們將問(wèn)題反饋到 GitHub 上,在 PaddlePaddle 社區(qū)值班人員的及時(shí)指導(dǎo)下,很快解決了問(wèn)題,提高了準(zhǔn)確率。
最終,團(tuán)隊(duì)將 6400 張大桃照片按照紅、大、中、小等元素按照分檔建立圖片數(shù)據(jù)集合,將圖片數(shù)據(jù)集放入卷積神經(jīng)網(wǎng)絡(luò)(CNN)中進(jìn)行訓(xùn)練,自動(dòng)提取用于分級(jí)的影響要素并形成分類邏輯。實(shí)現(xiàn)對(duì)大桃的自動(dòng)分列、判斷、分裝,準(zhǔn)確率達(dá)到 90% 以上。
桃子數(shù)據(jù)集
制造的機(jī)器則包括軟件和硬件兩部分,軟件涉及數(shù)據(jù)集采集與算法訓(xùn)練。硬件部分分為算法和下位機(jī)主控,包括傳感器和動(dòng)力部分,下位機(jī)主控用于完成對(duì) PC 數(shù)據(jù)和傳感器數(shù)據(jù)的接收,實(shí)現(xiàn)對(duì)硬件電路的控制工作。
具體來(lái)說(shuō),主要包含四個(gè)部分,傳送帶,推拉裝置,控制電路和一個(gè)電腦主機(jī)。傳送帶上裝有位置傳感器,用于監(jiān)控桃子在運(yùn)動(dòng)過(guò)程中幾個(gè)關(guān)鍵時(shí)刻的位置。推拉裝置采用氣動(dòng)的方式,由一個(gè)氣泵給五個(gè)氣缸供氣,利用電磁氣動(dòng)閥控制氣源的通斷??刂齐娐钒粋€(gè)主控芯片和電磁閥的驅(qū)動(dòng)電路,供 24v2a 的電源。電腦主機(jī)采用一個(gè)小巧的 Mac mini 運(yùn)行 PaddlePaddle 的分類算法。
機(jī)器全圖
力主開(kāi)源,百度與開(kāi)發(fā)者共同推進(jìn)技術(shù)發(fā)展
作為百度的開(kāi)源平臺(tái),PaddlePaddle 的前身是百度于 2013 年自主研發(fā)的深度學(xué)習(xí)平臺(tái),在內(nèi)部已使用多年,曾為鳳巢等業(yè)務(wù)提供支持。
由于開(kāi)源文化來(lái)自西方,中國(guó)的開(kāi)源氛圍并不濃厚。對(duì)大多數(shù)人來(lái)說(shuō),開(kāi)源社區(qū)對(duì)他們的作用就是免費(fèi)提供技術(shù)的地方,他們使用技術(shù)卻不反哺開(kāi)源社區(qū),也不愿意分享。即使有一些開(kāi)源項(xiàng)目,但這些開(kāi)源項(xiàng)目并不活躍。由于缺乏商業(yè)環(huán)境的支持,這些開(kāi)源項(xiàng)目也往往無(wú)法持續(xù)下去,因而形成惡性循環(huán)。
作為商業(yè)公司的百度卻在積極推動(dòng)開(kāi)源文化,陸奇曾經(jīng)在內(nèi)部講話中說(shuō),開(kāi)源代碼寫得好,不僅能解決大家的痛點(diǎn),開(kāi)源的代碼也會(huì)變得越來(lái)越強(qiáng),開(kāi)源代碼的生命力也必然會(huì)超過(guò)封閉體系的代碼。
2016 年 9 月的百度世界大會(huì)上,時(shí)任百度首席科學(xué)家吳恩達(dá)宣布在開(kāi)源社區(qū) GitHub 及百度大腦平臺(tái)上對(duì)外開(kāi)放這個(gè)深度學(xué)習(xí)平臺(tái),并命名為 PaddlePaddle。百度成為繼 Google、Facebook、IBM 之后,開(kāi)源人工智能技術(shù)的又一個(gè)科技巨頭,同時(shí)也是國(guó)內(nèi)首個(gè)開(kāi)源深度學(xué)習(xí)平臺(tái)的科技公司。
PaddlePaddle
在陸奇的主推下,百度杰出科學(xué)家徐偉在 2017 百度開(kāi)發(fā)者大會(huì)上宣布百度不僅會(huì)開(kāi)源代碼,還會(huì)開(kāi)放大規(guī)模數(shù)據(jù)集、計(jì)算能力、應(yīng)用模型庫(kù)。作為國(guó)內(nèi)首個(gè)開(kāi)源深度學(xué)習(xí)平臺(tái),百度在 PaddlePaddle 的研發(fā)中持完全開(kāi)放的態(tài)度,試圖與開(kāi)發(fā)者們共同推進(jìn)技術(shù)的發(fā)展。
實(shí)際上,利用開(kāi)源機(jī)器學(xué)習(xí)平臺(tái)制作果蔬分揀器并非只有這一個(gè)案例,去年,日本工程師 Makoto Koike 曾使用谷歌的開(kāi)源工具 TensorFlow 和 7000 張黃瓜圖片制作了一個(gè)黃瓜分揀器。
目前,如谷歌、Facebook 等科技巨頭都有開(kāi)源的深度學(xué)習(xí)平臺(tái),而由于百度在搜索、圖像識(shí)別、語(yǔ)音語(yǔ)義識(shí)別理解、情感分析、機(jī)器翻譯、用戶畫(huà)像推薦等多領(lǐng)域的業(yè)務(wù)和技術(shù)方向,相較而言,PaddlePaddle 則表現(xiàn)得更加全面,是一個(gè)相對(duì)全功能的深度學(xué)習(xí)框架。
除此之外,由于 PaddlePaddle 的定位是易于使用,因而相對(duì) TensorFlow,PaddlePaddle 也更為易用,提供的每個(gè)任務(wù)都可迅速上手,且大部分任務(wù)可直接套用,只需使用現(xiàn)成的算法 (VGG、ResNet、LSTM、GRU 等等),按照示例執(zhí)行命令,替換數(shù)據(jù)、修改參數(shù)就能執(zhí)行。
此外,PaddlePaddle 可多機(jī)多卡并行,同時(shí)支持 CPU 和 GPU,顯存占用空間小,速度比也 TensorFlow 等更快。
作為人工智能的主要技術(shù),囿于技術(shù)門檻,數(shù)據(jù)量和計(jì)算能量等,并不是每個(gè)公司都有條件使用機(jī)器學(xué)習(xí)。百度資深科學(xué)家、PaddlePaddle 研發(fā)負(fù)責(zé)人徐偉就曾表示:「在 PaddlePaddle 的幫助下,深度學(xué)習(xí)模型的設(shè)計(jì)如同編寫偽代碼一樣容易,設(shè)計(jì)師只需關(guān)注模型的高層結(jié)構(gòu),而無(wú)需擔(dān)心任何瑣碎的底層問(wèn)題。未來(lái),程序員可以快速應(yīng)用深度學(xué)習(xí)模型來(lái)解決醫(yī)療、金融等實(shí)際問(wèn)題,讓人工智能發(fā)揮出最大作用。」
在內(nèi)部力推 PaddlePaddle 開(kāi)源的陸奇則表示,人工智能時(shí)代的核心是數(shù)據(jù)和算法,中國(guó)走向人工智能,一定會(huì)面臨著挑戰(zhàn)。作為百度的核心平臺(tái),他希望團(tuán)隊(duì)將 PaddlePaddle 發(fā)展成具有中國(guó)特色,尤其是在數(shù)據(jù)上最適合中國(guó)國(guó)情的深度學(xué)習(xí)平臺(tái)。
「這是一個(gè)時(shí)代的演變過(guò)程,將來(lái)加入人工智能時(shí)代,喚醒萬(wàn)物,信息一定要傳遍所有的世界的所有的角落。我們要站在這樣的高度來(lái)看待?!龟懫嬲f(shuō)。
陸奇在百度 AI 開(kāi)發(fā)者大會(huì)演講
而現(xiàn)在,這 4 位學(xué)生已將所有代碼和材料清單,上傳至 GitHub 進(jìn)行開(kāi)源和分享,請(qǐng)全世界關(guān)注農(nóng)業(yè)和關(guān)注深度學(xué)習(xí)的人共同完善。
對(duì) PaddlePaddle 平臺(tái)而言,雖然智能桃子分揀器只是其中一個(gè)案例,但百度通過(guò)人工智能回饋社會(huì)的決心卻明確無(wú)疑。
本文為機(jī)器之心原創(chuàng),轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)。
聯(lián)系客服