在前不久的百度云智峰會(huì)上,百度云副總經(jīng)理傅徐軍剛剛宣布了百度云生態(tài)“云圖計(jì)劃”:未來(lái)五年要在資金和資源投入方面投入100億,建立百度云平臺(tái)及生態(tài)體系,與行業(yè)伙伴共建共贏、共生的云生態(tài)和ABC生態(tài)圈,即旨在打造以人工智能(AI)為中樞、以大數(shù)據(jù)(Big Data)為依托、以云計(jì)算(Cloud Computing)為基礎(chǔ),形成ABC三位一體的云服務(wù)結(jié)構(gòu),與傳統(tǒng)行業(yè)深度融合,構(gòu)建新型云計(jì)算生態(tài)系統(tǒng)。
最近,百度云副總經(jīng)理傅徐軍現(xiàn)身由麥思博主辦的TOP100summit全球軟件案例研究峰會(huì)。在進(jìn)行了開(kāi)幕式分享后,傅徐軍接受了媒體的采訪。以下為采訪實(shí)錄,略有整理與刪減:
記者:為什么要以五年周期來(lái)投入100億打造云生態(tài)體系?在這一目標(biāo)上百度云將如何推進(jìn)?
傅徐軍:坦白說(shuō),5年、3年或者是8年,沒(méi)有特別嚴(yán)謹(jǐn)?shù)亩x。我們覺(jué)得,像國(guó)家計(jì)劃都是5年為目標(biāo),我們也模仿了一下,五年目標(biāo)??傊?,我其實(shí)想表達(dá)的意思是:百度希望長(zhǎng)期、持之以恒地在云計(jì)算產(chǎn)業(yè)不斷投入。至于這100億如何分配?在百度內(nèi)部有百度的風(fēng)投和基金,包括有很多政府基金愿意來(lái)加入,已經(jīng)和百度有一些勾兌,還有一些第三方的投資機(jī)構(gòu)。詳細(xì)的計(jì)劃現(xiàn)在還沒(méi)有,但是一定會(huì)出一個(gè)非常嚴(yán)謹(jǐn)?shù)膶徍嗽瓌t。比如,哪些企業(yè)可以參與這個(gè)計(jì)劃,這是作為一個(gè)補(bǔ)貼方式給出去的,因此要挑一些特別有前瞻性、有潛力的企業(yè)一起合作。
記者:百度云和人工智能有著怎樣的聯(lián)系?
傅徐軍:在百度7月份的戰(zhàn)略發(fā)布會(huì)上,百度的董事長(zhǎng)指出人工智能、大數(shù)據(jù)和云計(jì)算是三位一體的關(guān)系,最近,我們給“三位一體”取了一個(gè)簡(jiǎn)稱“ABC”。它們是什么關(guān)系?百度首席科學(xué)家吳恩達(dá)有一個(gè)比喻:如果人工智能是一個(gè)火箭,那么大數(shù)據(jù)是燃料,云計(jì)算就是個(gè)引擎。有這個(gè)引擎,才可以把火箭升空。云計(jì)算是基礎(chǔ)設(shè)施,我們需要一個(gè)非常穩(wěn)定、可靠、高性能的基礎(chǔ)平臺(tái)。在這個(gè)平臺(tái)上,大數(shù)據(jù)才可以被很好地處理。人工智能很多底層的需求,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí),才可以在這個(gè)應(yīng)用上跑得很好。
從另外一個(gè)角度說(shuō),人工智能是解決具體問(wèn)題的,但是在百度這樣的企業(yè),有技術(shù)、數(shù)據(jù)、產(chǎn)品、計(jì)算能力和解決方案,但是它不知道如何定義問(wèn)題,說(shuō)得比較直白一點(diǎn),360 行都有自己的需求,但是你不懂那些行業(yè),或者說(shuō)百度對(duì)那些行業(yè)缺乏洞察。
云計(jì)算是幫助人工智能尋找場(chǎng)景的方式。當(dāng)我們和這些企業(yè)溝通時(shí),他一定會(huì)把問(wèn)題告訴我,可能中間有些問(wèn)題靠云計(jì)算本身不能解決,人工智能、大數(shù)據(jù)可以解決。把百度云、百度數(shù)據(jù)、百度人工智能三個(gè)技術(shù)內(nèi)在的耦合,才可以提供一個(gè)很好的功能。
記者:百度云、百度數(shù)據(jù)、百度人工智能這三個(gè)技術(shù)領(lǐng)域在百度內(nèi)部怎么協(xié)調(diào)?
傅徐軍:AI 和大數(shù)據(jù)是一個(gè)部門,它的負(fù)責(zé)人是百度的首席科學(xué)家吳恩達(dá),它的定位更像一個(gè)實(shí)驗(yàn)室,而云的定位更像和產(chǎn)業(yè)結(jié)合做解決方案的。雙方的層次不一樣,AI更關(guān)注核心技術(shù),比如,其指標(biāo)是語(yǔ)音識(shí)別準(zhǔn)確率,而云的目標(biāo)是服務(wù)好客戶??赡軠?zhǔn)確率提高了,但是有一些方面有問(wèn)題,比如,客戶還是不喜歡用,或者說(shuō)這個(gè)東西不好用,不方便用。所以,對(duì)云而言,可能更重要的是和產(chǎn)業(yè)結(jié)合,如何全方位滿足客戶的訴求,而 AI 和大數(shù)據(jù)是提供核心,能力。
記者:未來(lái)百度云與人工智能還有出現(xiàn)怎樣的技術(shù)創(chuàng)新?
傅徐軍:百度云的角色就是打造一個(gè)非常靠譜的基礎(chǔ)平臺(tái),同時(shí)為大數(shù)據(jù)和人工智能提供更好的應(yīng)用場(chǎng)景。人工智能的責(zé)任是把很多核心技術(shù)進(jìn)行攻關(guān),無(wú)人車、云識(shí)別、智能對(duì)話機(jī)器等都有很多技術(shù)難題。而這些難題,比如,度秘、和微軟小冰、Siri有點(diǎn)像,但是一個(gè)泛場(chǎng)景的聊天機(jī)器人想做到完美很難的。
一個(gè)泛需求的事很難做到很好,所以可以看看如何在細(xì)分領(lǐng)域做創(chuàng)新。創(chuàng)新也只是一小步,你得先滿足客戶,真正要做的是不斷挖掘客戶的需求。讓他真正想做什么,就做到120分,這個(gè)可能沒(méi)有創(chuàng)新聽(tīng)起來(lái)那么 Sexy,但是他可能是切切實(shí)實(shí)地需要做功課。在某些產(chǎn)品下,可能比創(chuàng)新更重要。
記者:請(qǐng)問(wèn),降低成本后,百度云要如何平衡性能和承受能力?
傅徐軍:百度現(xiàn)在是用整機(jī)柜技術(shù)最多的公司,基本上整機(jī)柜和傳統(tǒng)的服務(wù)器不太一樣,包括高密度存儲(chǔ),傳統(tǒng)服務(wù)器大家都知道,有機(jī)箱、風(fēng)扇、電源、硬盤、主板。整機(jī)柜就變成一個(gè)機(jī)柜里面有40臺(tái)機(jī)器,每臺(tái)機(jī)器就是一個(gè)抽屜,拉開(kāi)來(lái)之后看見(jiàn)什么東西?就是一排硬盤。它是一塊主板加上8-18塊不等的硬盤。通過(guò)這樣的方式來(lái)管理。同時(shí)電源和風(fēng)扇全部外置,放到一邊,機(jī)箱就直接把它丟棄掉。這樣的好處是什么?比如,做一些維護(hù)特別方便。
由于風(fēng)扇和電源統(tǒng)一管理,風(fēng)扇管理得好,加大散熱的效率,電源管理好可以提升用電效率。從這幾方面看,又可以降低很多成本。
我們對(duì)每一塊硬盤都做了狀態(tài)記錄。比如,硬盤有多大,什么時(shí)候買的,哪一家廠商買的,什么型號(hào),上面跑的是在線還是離線的應(yīng)用……這些記錄之后,通過(guò)機(jī)器學(xué)習(xí)的方式,可以預(yù)測(cè)硬盤什么時(shí)候會(huì)壞。因?yàn)橛脖P其實(shí)是一個(gè)耗材,百度有50萬(wàn)臺(tái)服務(wù)器,可能一天就得壞很多塊,不僅是百度,相信很多大型互聯(lián)網(wǎng)公司都是同樣的情況。這時(shí)如何保證壽命?需要提前做預(yù)防和數(shù)據(jù)遷移,在某種程度上也可以提高運(yùn)維效率,降低成本。百度云用了很多方式保證存儲(chǔ),因?yàn)榇鎯?chǔ)的穩(wěn)定性和可用性是最重要的。
記者:百度云提出在/離線業(yè)務(wù)混部,如果離線與在線用同一套資源,如何保證這套資源充分利用,又不影響在線業(yè)務(wù)?
傅徐軍:離線和在線應(yīng)用了混布,當(dāng)然這和存儲(chǔ)沒(méi)什么關(guān)系。一般公司會(huì)把離線放在離線的服務(wù)器上,比如,做單純的離線計(jì)算。在線需要實(shí)時(shí)性,這個(gè)問(wèn)題確實(shí)切中要害,百度確實(shí)在過(guò)去幾年,在這個(gè)方面做了大量實(shí)踐,踩了很多坑,犯了一些錯(cuò)誤。但通過(guò)這種方式,確實(shí)可以把這件事情做好。但是很難用一句話概括是如何做到的,因?yàn)槊恳粋€(gè)應(yīng)用不一樣,搜索是搜索,地圖是地圖,視頻是視頻,外賣是外賣,它都有自己的特點(diǎn),需要責(zé)公司內(nèi)部存儲(chǔ)計(jì)算虛擬化,機(jī)器需求和硬件加速的基礎(chǔ)架構(gòu)部門上層應(yīng)用部門坐到一起分析。比如,這個(gè)業(yè)務(wù)是什么類型,高峰期在何時(shí),能不能做調(diào)度。
百度內(nèi)部的分布式計(jì)算每天已經(jīng)有百萬(wàn)級(jí)任務(wù)量。后來(lái)發(fā)現(xiàn)還是不夠,因?yàn)闃I(yè)務(wù)部門太多了,資源總是往多了要,永遠(yuǎn)不會(huì)往少了要。所以,每個(gè)服務(wù)器都加一個(gè)Agent,查看它的狀況,知道有多少CPU是閑置的。這時(shí)如果有計(jì)算任務(wù),就自動(dòng)部署空閑資源,但也因此,這個(gè)計(jì)算任務(wù)的優(yōu)先級(jí)可能會(huì)低一些。一旦人家要用了,馬上把你的應(yīng)用給Q掉,再給你找一塊新的地。所以對(duì)這樣的服務(wù),你不能期望有太高,可能會(huì)跑得慢一點(diǎn),但是也可以部分解決問(wèn)題。這種方式也是一種如何盡量最大化利用空閑資源、降低成本的方式。
聯(lián)系客服