藝術(shù)家們喜歡讓人們從作品中了解自己,如同在蒙娜麗莎中思考達(dá)芬奇,在第九交響曲中聽(tīng)懂貝多芬。百度大腦有著同樣的情愫:用開(kāi)放生態(tài),為開(kāi)發(fā)者提供發(fā)揮想象力的“黑土地”,讓AI走向社會(huì)的每一個(gè)角落。
文|Alter
中關(guān)村創(chuàng)業(yè)大街,這個(gè)曾見(jiàn)證互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮的著名地標(biāo),也曾陷入冷寂。
而今,”智能+“已經(jīng)成為時(shí)代新命題,這條大街又因AI有了新的活力。
去年12月底,百度大腦在中關(guān)村創(chuàng)業(yè)大街開(kāi)設(shè)第一家“線下體驗(yàn)店“,引來(lái)人頭攢動(dòng)。3月20日,首期百度大腦開(kāi)放日在中關(guān)村創(chuàng)業(yè)大街舉辦,更多了一份熱鬧。
過(guò)去,在創(chuàng)業(yè)大街上生長(zhǎng)起來(lái)的很多互聯(lián)網(wǎng)產(chǎn)品與技術(shù)已經(jīng)與我們的生活難以分割,如今AI到來(lái),又會(huì)是一種什么景象?
在百度大腦開(kāi)放日上,百度大腦帶來(lái)了24種全新開(kāi)放的AI技術(shù),20個(gè)鮮活的落地案例,用滿(mǎn)滿(mǎn)的誠(chéng)意與開(kāi)發(fā)者一起展開(kāi)對(duì)未來(lái)的想象。
用AI的熱度 去溫暖每個(gè)角落
整場(chǎng)開(kāi)放日,最令人印象深刻的案例是“智能貓窩”,看到冬天里無(wú)家可歸的流浪貓,百度大腦工程師晚兮利用百度大腦的動(dòng)物識(shí)別技術(shù)和百度EasyDL,打造出了配備“貓臉門(mén)禁”、“病貓識(shí)別”、“絕育識(shí)別”三大黑科技的貓窩,不僅可以識(shí)別174種不同品種的貓咪,還可以識(shí)別貓口炎、貓鼻支、貓皮膚病、貓外傷4種常見(jiàn)貓病,發(fā)現(xiàn)未絕育的貓,幫助志愿者及時(shí)救助。
和流浪貓一樣,垃圾分類(lèi)也是一大社會(huì)難題。分形科技借助百度EasyDL的圖像分類(lèi)技術(shù),打造了首款智能垃圾桶,可以對(duì)7種常見(jiàn)垃圾自動(dòng)分類(lèi);
德邦物流為了讓用戶(hù)免去自行填寫(xiě)信息的麻煩,使用百度大腦的定制詞法分析快遞申請(qǐng),一秒拆分姓名、電話、住址等信息;
看到審批窗口總是排滿(mǎn)長(zhǎng)隊(duì),科鴻智信利用OCR 、iOCR及EasyDL平臺(tái)開(kāi)發(fā)了智能化審批管理系統(tǒng),建立起“一次都不跑、隨時(shí)隨地辦”的便民服務(wù)新模式。
嫌棄鼠標(biāo)的功能太雞肋,有開(kāi)發(fā)者集成百度的語(yǔ)音識(shí)別和合成技術(shù)、翻譯技術(shù) ,打造了智能語(yǔ)音鼠標(biāo),語(yǔ)音輸入速度可以達(dá)到每分鐘400字,比傳統(tǒng)鍵盤(pán)輸入提升了兩倍,并且支持28種語(yǔ)言的翻譯;
還有開(kāi)發(fā)者為了方便控制跑步機(jī),使用百度大腦的語(yǔ)音識(shí)別和UNIT技術(shù),開(kāi)發(fā)了可語(yǔ)音控制的跑步機(jī),動(dòng)動(dòng)嘴就可以切歌、速度控制、模式變換等,據(jù)說(shuō)月銷(xiāo)量已經(jīng)高達(dá)一萬(wàn)臺(tái)以上。
以上這些在開(kāi)放日展出的案例,只是百度大腦落地案例冰山一角。2018年百度大腦在6個(gè)城市舉辦了7場(chǎng)行業(yè)創(chuàng)新論壇,針對(duì)企業(yè)服務(wù)、信息服務(wù)、地產(chǎn)物業(yè)、智能零售、智能工廠、智能校園、智能政務(wù)推出了7大行業(yè)解決方案,AI能力已然滲透進(jìn)產(chǎn)業(yè)的毛細(xì)血管,從而影響我們生活的方方面面。
正如百度AI技術(shù)生態(tài)部總經(jīng)理喻友平在現(xiàn)場(chǎng)所說(shuō),“人工智能應(yīng)用的領(lǐng)域可以說(shuō)無(wú)處不在,只要企業(yè)、開(kāi)發(fā)者、合作伙伴們能有發(fā)現(xiàn)問(wèn)題的眼睛,就有創(chuàng)新創(chuàng)業(yè)的機(jī)會(huì)。百度大腦把平臺(tái)和AI能力開(kāi)放出來(lái),希望幫助大家快速地實(shí)現(xiàn)各自領(lǐng)域的業(yè)務(wù)解決方案,創(chuàng)造全新商業(yè)模式,帶來(lái)更多機(jī)遇?!?/span>
研發(fā)不是炫技 是對(duì)技術(shù)賦能的踐行
作為百度在人工智能領(lǐng)域多年研究的集大成,百度大腦在2016年正式開(kāi)放后,已經(jīng)開(kāi)放了語(yǔ)音技術(shù)、視覺(jué)技術(shù)、自然語(yǔ)言處理、知識(shí)圖譜、機(jī)器學(xué)習(xí)等近160項(xiàng)通用AI能力,有著超過(guò)100萬(wàn)的開(kāi)發(fā)者,已然成為服務(wù)規(guī)模最大的AI開(kāi)放平臺(tái)。
對(duì)于百度大腦而言,技術(shù)的創(chuàng)新并沒(méi)有盡頭,就像是一場(chǎng)“打怪升級(jí)”的游戲,一直追求的是怎么讓技術(shù)更好用,怎么將效率再提高一些,最終實(shí)現(xiàn)“用AI讓復(fù)雜的世界更簡(jiǎn)單”。
在百度大腦開(kāi)放日當(dāng)天,百度AI技術(shù)生態(tài)部總經(jīng)理喻友平一口氣介紹了新開(kāi)放的24項(xiàng)AI技術(shù)能力,囊括視覺(jué)、自然語(yǔ)言和語(yǔ)音。以往開(kāi)發(fā)者要苦苦研發(fā)上月的技術(shù),在百度大腦都可以一鍵獲取。開(kāi)放一個(gè)全新的AI技術(shù),開(kāi)發(fā)者就可能創(chuàng)造出一個(gè)全新的AI應(yīng)用,實(shí)實(shí)在在改變生活。
在視覺(jué)方向上,OCR、車(chē)輛分析、人臉識(shí)別、圖像識(shí)別都有數(shù)項(xiàng)更新。百度的OCR全系列產(chǎn)品多達(dá)34種,覆蓋了卡證、票據(jù)、文檔、汽車(chē)等場(chǎng)景。
如果你是一名戶(hù)籍系統(tǒng)相關(guān)的開(kāi)發(fā)者,只需要對(duì)著戶(hù)口本拍一張照片,系統(tǒng)就能字段進(jìn)行結(jié)構(gòu)化識(shí)別,然后反饋出信息頁(yè)的出生地、出生日期、姓名、民族、與戶(hù)主關(guān)系、性別、身份證號(hào)碼,將會(huì)幫助相關(guān)工作人員減輕大半的工作量。目前,百度在OCR上的能力最為全面,對(duì)于開(kāi)發(fā)者來(lái)說(shuō),在同一家平臺(tái)上就能找到應(yīng)用場(chǎng)景的對(duì)應(yīng)技術(shù),十分便捷。
如果你是一位交警或者停車(chē)場(chǎng)管理員,一定會(huì)對(duì)百度大腦的車(chē)輛分析技術(shù)點(diǎn)贊。百度大腦推出了車(chē)輛檢測(cè)、車(chē)流統(tǒng)計(jì)、車(chē)輛屬性分析、外觀損傷識(shí)別等服務(wù)。其中車(chē)輛檢測(cè)功能,可以通過(guò)識(shí)別圖像中的所有機(jī)動(dòng)車(chē)輛(包含小汽車(chē)、卡車(chē)、巴士、摩托車(chē)、三輪車(chē)),反饋每輛車(chē)的類(lèi)型和坐標(biāo)位置,并對(duì)每類(lèi)車(chē)輛分別計(jì)數(shù)。
如果你是一名自拍愛(ài)好者,百度大腦顯然知道你想要的是什么。百度大腦新增了人臉情緒識(shí)別,并升級(jí)了人臉關(guān)鍵點(diǎn)檢測(cè)和手勢(shì)識(shí)別,人臉檢測(cè)關(guān)鍵點(diǎn)由72個(gè)增至150個(gè),常見(jiàn)手勢(shì)能識(shí)別也達(dá)到了24種。這些技術(shù)落地之后,人臉識(shí)別不再局限在解鎖和美顏,將帶來(lái)更多有趣的應(yīng)用:錄制短視頻時(shí)有更豐富的手勢(shì)特效,識(shí)別你的情緒自動(dòng)匹配背景音樂(lè)等等。
語(yǔ)音和語(yǔ)義識(shí)別也是百度大腦升級(jí)的重點(diǎn),包括語(yǔ)言處理應(yīng)用平臺(tái)、語(yǔ)言處理應(yīng)用技術(shù)、語(yǔ)言處理基礎(chǔ)技術(shù)、知識(shí)理解以及知識(shí)圖譜。
在百度大腦開(kāi)放日上,令人印象深刻的演示是三個(gè)有趣的應(yīng)用:
一是新聞?wù)瑢?duì)新聞內(nèi)容進(jìn)行全面的語(yǔ)義理解與分析,然后自動(dòng)抽取新聞文本中的關(guān)鍵信息并按指定長(zhǎng)度生成摘要,可以應(yīng)用于熱點(diǎn)新聞聚合、新聞推薦、語(yǔ)音播報(bào)、彈窗推送等場(chǎng)景,幾乎是所有新聞工作者的福音。
二是智能寫(xiě)詩(shī),用戶(hù)只需要輸入任意主題詞(如公司名、節(jié)氣名),百度大腦便可自動(dòng)生成融合了該主題詞的詩(shī)詞。實(shí)際測(cè)試顯示,百度大腦的智能寫(xiě)詩(shī)在語(yǔ)義和語(yǔ)境上并沒(méi)有明顯的違和感,不失為娛樂(lè)化營(yíng)銷(xiāo)的又一重要工具。
三是智能春聯(lián),今年的央視春晚上,主持人高博就演示了智能春聯(lián)“看臉”的絕活兒,通過(guò)“刷臉”生成專(zhuān)屬春聯(lián)。如今這項(xiàng)技能也被百度開(kāi)放出來(lái),何嘗不是人工智能融入美好生活的一個(gè)典型案例呢。
在語(yǔ)音方面,百度首次對(duì)外開(kāi)放了搭載國(guó)際領(lǐng)先的注意力(attention)模型的語(yǔ)音能力,擁有更快的響應(yīng)速度,相對(duì)識(shí)別準(zhǔn)確度提升15%。同時(shí)中英文混雜和純英文自由說(shuō),既能識(shí)別方言又能識(shí)別普通話,那些曾經(jīng)讓用戶(hù)和開(kāi)發(fā)者頭疼的問(wèn)題,在這里被一次性解決。
不止如此,百度還即將上線很多新產(chǎn)品:零代碼自助訓(xùn)練語(yǔ)音識(shí)別模型,可以幫助開(kāi)發(fā)者提升業(yè)務(wù)場(chǎng)景下的識(shí)別準(zhǔn)確率;而遠(yuǎn)場(chǎng)語(yǔ)音開(kāi)發(fā)套件,則可以應(yīng)用于機(jī)器人、兒童故事機(jī)、家電、車(chē)載設(shè)備等硬件,語(yǔ)音識(shí)別將無(wú)處不在。
在喻友平看來(lái),百度大腦的開(kāi)放生態(tài)有著以下優(yōu)勢(shì):一個(gè)是技術(shù)領(lǐng)先,百度很早就成立了深度學(xué)習(xí)研究院,并且早在16年開(kāi)源了國(guó)內(nèi)第一個(gè)深度學(xué)習(xí)框架paddlepaddle,在各類(lèi)國(guó)際比賽上也取得過(guò)非常多的獎(jiǎng)項(xiàng),并且聯(lián)合舉辦了像上面介紹的國(guó)際權(quán)威競(jìng)賽,在這樣的技術(shù)號(hào)召力下,聚集了非常多的人才,這是技術(shù)得以持續(xù)保持領(lǐng)先的基礎(chǔ);
一個(gè)是技術(shù)布局非常全面,從感知到認(rèn)知,從語(yǔ)音到視覺(jué)到語(yǔ)義到AR等等,非常全面,可以幫助大家一站式的獲得服務(wù),提高集成效率;最后,我們以可落地為目標(biāo),在降低人工智能應(yīng)用門(mén)檻的這個(gè)方向上持續(xù)不斷的努力,所以雖然只開(kāi)放了兩年多的時(shí)間,但進(jìn)化速度也非??臁?/span>
“我們可以看到整個(gè)平臺(tái)的架構(gòu),從模型到軟硬一體,從深度學(xué)習(xí)框架到解決方案,從云服務(wù)到多種輸出方式的支持,各個(gè)層面都快速豐富起來(lái)。我們也非常重視各個(gè)企業(yè)和開(kāi)發(fā)者提出的需求,并且特別感謝在這個(gè)進(jìn)化過(guò)程中大家的包容與支持?!?/span>
藝術(shù)家們喜歡讓人們從作品中了解自己,如同在蒙娜麗莎中思考達(dá)芬奇,在第九交響曲中聽(tīng)懂貝多芬。
百度大腦似乎有著同樣的情愫:用開(kāi)放生態(tài),為開(kāi)發(fā)者提供發(fā)揮想象力的“黑土地”,讓AI走向社會(huì)的每一個(gè)角落。
喻友平談到,人工智能應(yīng)用的領(lǐng)域可以說(shuō)無(wú)處不在,只要企業(yè)、開(kāi)發(fā)者、合作伙伴們能有發(fā)現(xiàn)問(wèn)題的眼睛,就有創(chuàng)新創(chuàng)業(yè)的機(jī)會(huì)。百度大腦把平臺(tái)和AI能力開(kāi)放出來(lái),希望幫助大家快速地實(shí)現(xiàn)各自領(lǐng)域的業(yè)務(wù)解決方案,創(chuàng)造全新商業(yè)模式,帶來(lái)更多機(jī)遇。
聯(lián)系客服