近日,由人人都是產(chǎn)品經(jīng)理與騰訊大講堂聯(lián)合主辦的2018中國產(chǎn)品經(jīng)理大會深圳站完美落幕,科大訊飛華南研究院執(zhí)行院長、訊飛易聽說總經(jīng)理 劉舒做了“AI+時代,產(chǎn)品經(jīng)理能力模型”的主題分享,并引發(fā)探討:整個AI行業(yè)的產(chǎn)品經(jīng)理從業(yè)者,應(yīng)該具備哪些能力模型?enjoy~
分享嘉賓:科大訊飛華南研究院執(zhí)行院長、訊飛易聽說總經(jīng)理 劉舒
以下內(nèi)容為嘉賓分享實錄,由人人都是產(chǎn)品經(jīng)理社區(qū)@Daisy 整理編輯,部分內(nèi)容有修改,嘉賓已確認(rèn):
16年我曾提到,互聯(lián)網(wǎng)時代的“流量暴利”已經(jīng)消失了,所以當(dāng)時提出了“互聯(lián)網(wǎng)+行業(yè)”這個命題?;仡櫼幌逻@兩年多的發(fā)展,我們可以看到這樣的命題實際上是成立的。
最近兩年多,那種因暴利連接的產(chǎn)品其實已經(jīng)是消失,取而代之的是垂直細(xì)分行業(yè)里生根的一些企業(yè)。其中,我們最重要的是要對行業(yè)知識進(jìn)行一些理解,從而提升它的效率。而人工智能就是在“互聯(lián)網(wǎng)+行業(yè)”的過程中引發(fā)出來的新一輪革命。到了2018年,人工智能實際上已融入到了我們生活中的方方面面。
所以,今天我也是希望結(jié)合這兩年多的一些從業(yè)案例,以及對人工智能的一些思考,在此跟大家做一個主題分享《“AI+”時代,產(chǎn)品經(jīng)理能力模型》,主要分為三個部分:
無論是美國,還是中國和歐盟,都陸續(xù)發(fā)布了有關(guān)人工智能的國家戰(zhàn)略;對于互聯(lián)網(wǎng)來說,這是一個很重要的事件:
2017年7月20號,國務(wù)院發(fā)布了新一代人工智能的發(fā)展規(guī)劃,這是國務(wù)院首次以行政規(guī)劃的方式發(fā)布產(chǎn)業(yè)發(fā)展規(guī)劃。從這一點(diǎn)上可以看出:中國正在以舉國之力搶戰(zhàn)AI的制高點(diǎn)。
大家可以看到:無論從國家還是從行業(yè)的層面上,AI都已經(jīng)到來。
無論是麥肯錫,還是科學(xué)雜志、德勤,以及埃森哲的一些報告,大家都紛紛預(yù)言:人工智能在未來會更多地取代人類現(xiàn)有的一些工作,并且使得人類社會的生產(chǎn)效率變得更高。對此,大家也感到了一些擔(dān)憂,比如就業(yè)率會進(jìn)一步地下跌——或者說失業(yè)率會進(jìn)一步地上漲。
AI并不僅僅停留在國家層面和行業(yè)層面,也融入到了我們生活中的方方面面。
從上圖我們可以看到,AI現(xiàn)在確實很火。
而對于想要從事AI的產(chǎn)品經(jīng)理來說,該抓哪些重點(diǎn)呢?
首先要了解AI技術(shù)的發(fā)展演進(jìn)歷程,包括它的一些技術(shù)原理和技術(shù)邊界;只有這樣,我們才能更好地去設(shè)計產(chǎn)品。
所以,我們先看下AI的前世今生。
AI其實并不是這兩年才出現(xiàn)的,它很早就誕生了,但是為什么到這兩年它才開始火起來呢?
在1965年Dartmouth會議上,當(dāng)時四個圖靈獎的得主聚集在一起提出了十大問題,標(biāo)志著AI行業(yè)的誕生:
自此之后,AI一共經(jīng)歷了三次浪潮:
70年代和90年代,由于算法結(jié)構(gòu)及當(dāng)時的計算能力因素,在當(dāng)時行業(yè)的應(yīng)用上、效果上,都沒有達(dá)到一個很有效的效果,所以前兩次浪潮都是潮起潮落。
隨著這個深度學(xué)習(xí)的出現(xiàn),歷史上的一些問題得以被解決,且取得了超前的好成績。比如語音識別、圖像識別等,都比傳統(tǒng)算法有更好的實用效果。因此,我們遇到的AI才變得實用,從而帶到生活中。
所以,我們認(rèn)為這一次是人工智能真正到了爆發(fā)的時候。
那么,什么是深度學(xué)習(xí)?
接下來,我就會用一些簡單直觀的例子,對深度學(xué)習(xí)做一個詳細(xì)分解:
首先,深度神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個分類器,它是模仿人的感知過程。
如上圖,這是一個簡單的深度神經(jīng)網(wǎng)絡(luò)。從左往右看,整個深度神經(jīng)網(wǎng)絡(luò)是一個函數(shù)(F就是一個函數(shù)),左側(cè)的“1”和“-1”,我們稱為輸入的特征或者輸入的向量;右側(cè)的“0.62”和“0.83”,我們稱之為它輸出的一個結(jié)果。
在這個案例當(dāng)中,“0.62”和“0.83”實際上是屬于不同分類的概率。相當(dāng)于圖像識別中的“這個是男人還是女人?”。
那么,證明他是男人的概率為0.62,她是女人的概率為0.83。
所以,深度神經(jīng)網(wǎng)絡(luò)就是:每一個輸入經(jīng)過深度神經(jīng)網(wǎng)絡(luò)的運(yùn)算后,最后得到它在不同分類的概率;而它的本質(zhì)就是輸入一個特征向量,即“1”和“-1”。
換言之,通過深度網(wǎng)絡(luò)的逐層運(yùn)算,最終得到該向量屬于不同類別的概率。
至于如何定義這個類別?
所以實際上,深度神經(jīng)網(wǎng)絡(luò)的核心就是解決一個分類的問題。
那么下面我們怎么來使用這個深度神經(jīng)網(wǎng)絡(luò)?
它一般分為三步走:
操作步驟1:準(zhǔn)備標(biāo)注數(shù)據(jù)
第一步,我們稱之為叫標(biāo)注數(shù)據(jù)。
剛才這個神經(jīng)網(wǎng)絡(luò)當(dāng)中,進(jìn)行逐層計算的時候,中間都有很多參數(shù),那么這個參數(shù)是怎么得到的?
舉一個數(shù)字識別的例子:假設(shè)我要識別一個圖像,它里面寫了0~9這十個數(shù)字。如果這個圖片的像素點(diǎn)上有值,我就認(rèn)為它是“1”;如果沒有顏色,白色就認(rèn)為它是“0”。
這樣一來,我就把一個圖像變成了一個向量——比如它是16×16,那么就是X1到X256。
我會事先準(zhǔn)備一些數(shù)據(jù),再交給機(jī)器去學(xué)習(xí),我會事先選出標(biāo)準(zhǔn)“2”。
拿出來后,我告訴這個機(jī)器,它的輸出是什么呢?
比如說我準(zhǔn)備的標(biāo)準(zhǔn)是“1”,它的輸出屬于“1”的概率是100%;那么它屬于其他數(shù)字,比如說2345等,它的這個概率為0,它不可能是其他的數(shù)字——所以我會準(zhǔn)備大量的數(shù)據(jù)。
操作步驟2:訓(xùn)練網(wǎng)格
準(zhǔn)備完這個數(shù)據(jù)以后,我就拿進(jìn)去,我們稱之為“訓(xùn)練”,即“訓(xùn)練”這個網(wǎng)格。
我們準(zhǔn)備了大量的手寫體“1”的各種變形、“2”的各種變形、“0”的各種變形……這些是圖像,每一張圖像我們都把它轉(zhuǎn)化成向量(特征),然后把特征輸?shù)竭@個網(wǎng)絡(luò)里面(右側(cè)為輸入);輸出我也是跟機(jī)器講好了,比如說第一排的這個數(shù)字,無論他怎么寫,最后我認(rèn)為它都是“1”,屬于“1”的概率是100%,屬于其他數(shù)字概率是0;第二行,所有的這種手寫的方式,我認(rèn)為它都是“2”——相當(dāng)于把這樣的輸入和輸出,明確地告訴機(jī)器,去訓(xùn)練這個網(wǎng)格。
在訓(xùn)練的過程中,需要的訓(xùn)練數(shù)據(jù)集是非常之大的。
比如在語音識別中,要大量的標(biāo)注人員準(zhǔn)備差不多10^11這么多的語料。而要解決某一個問題,比如說語音識別,要這么多的數(shù)據(jù)量;解決肺部結(jié)節(jié)的圖像自動診斷,又需要這么多的數(shù)據(jù)量……每一個領(lǐng)域都需要這么大數(shù)據(jù)量,要提前輸入到計算機(jī)里面,然后訓(xùn)練好這個網(wǎng)格——所以在做AI的時候,這個成本是巨大的。
操作步驟 3:使用網(wǎng)絡(luò)
訓(xùn)練好以后就很簡單了,這個網(wǎng)格就可以叫人工智能,就可以拿來用。
如上圖,這個時候我再拿一個圖片進(jìn)來(事先不知道是幾),我把它的特征抽出來后,用這個網(wǎng)格一算,最后得出:
這樣逐層算下來后,最后我們認(rèn)為這張圖片就是“2”——實際上,這個網(wǎng)格就可以解決數(shù)字識別的問題。
以上就是關(guān)于深度神經(jīng)網(wǎng)絡(luò)的一個簡單直觀說明。
如上圖,我們可以看到整個AI發(fā)展的三個階段:
那么,這三者的區(qū)別在哪?
我們實際上認(rèn)為:人類區(qū)別于動物最重要的是想象。
什么叫想象?就是人類能創(chuàng)造一些根本不存在的東西。
比如:
這些概念實際上是人創(chuàng)造出來的——通過這種想象出來的概念去凝聚人類,共同去完成一個目標(biāo)。
目前這個人工智能還沒找到有效的一些模型;因為目前整個人工智能的發(fā)展,更多的是技術(shù)在人們已有的一些計算框架下,通過一些仿真學(xué)的一些方式,然后讓它的效率變得更高。
因此,我們認(rèn)為:目前人工智能的發(fā)展還處于前兩個階段,即計算智能和感知智能階段——已經(jīng)媲美,甚至是超越人類,但在認(rèn)知領(lǐng)域是有待突破的。
最近這兩三年,感知智能在深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)以后,取得了飛躍式的發(fā)展。
那么在感知智能的應(yīng)用上,目前已經(jīng)在哪些領(lǐng)域里面已經(jīng)非常實用了?
如下圖:
我們簡單地分析了算法的機(jī)理,下面我就會結(jié)合它的一些特征,然后繼續(xù)分享:在這樣的一個技術(shù)框架下,我們產(chǎn)品經(jīng)理應(yīng)該具備哪些能力,才能夠區(qū)別于互聯(lián)網(wǎng)的產(chǎn)品經(jīng)理,從而在AI這個領(lǐng)域取得更好的一些成果?
基于AI的一些特有性,我們來分享一下關(guān)于AI產(chǎn)品經(jīng)理的三大能力模型:
第一個能力模型很重要, AI產(chǎn)品經(jīng)理一定要對AI的技術(shù)邊界要有很強(qiáng)的認(rèn)知——因為你對所在行業(yè)技術(shù)邊界的認(rèn)知,直接決定了你設(shè)計產(chǎn)品的應(yīng)用場景。如果你對AI技術(shù)的認(rèn)知深度不夠高,那么你設(shè)計出來的產(chǎn)品要么沒人用,要么就累死開發(fā)——所以AI技術(shù)是一個很重要的特征,這是基于概率體系。
也就是說,所有的輸入和輸出不是一個確定性的結(jié)果。
比如我一個手寫的“2”,對于一般的人理解,這個肯定是“2” ;但是對于計算機(jī),對AI引擎來說,它輸出的是概率,如:
而且有些時候還會犯錯——最后輸出的結(jié)果,可能屬于“1”的概率比屬于“2”的概率還大。
這個顛覆了我們原來傳統(tǒng)做軟件、做互聯(lián)網(wǎng)的思維。
舉個例子:
在語音識別這個領(lǐng)域,我們的識別準(zhǔn)確率在過去十多年是低于95%的。這時候,我能用這個概率去作會議記錄嗎?
這個是不行的——100個字里面錯5個字,甚至可能有些關(guān)鍵字都錯了,這個東西不實用。
但是在哪些地方能用呢?比如說K歌的評分,輔助的文字輸入——這種偏娛樂性,對準(zhǔn)確率要求不高的一些場景下面,我們就可以使用。
再舉一個大家耳熟能詳?shù)睦樱?/p>
在圖像識別領(lǐng)域,前兩年特別火的是什么?猜年齡,或者看你長得像哪個明星?——為什么當(dāng)時這類型應(yīng)用特別火?因為當(dāng)時的圖像識別準(zhǔn)確率比較低,比如說是低于95%;在這種技術(shù)邊界下,我們只能做一些娛樂型的設(shè)計。
最近兩年的發(fā)展,在一些特定場景下,我們的準(zhǔn)確率能提高到95%以上,甚至是99%。這項人工智能技術(shù),由于它的邊界前移了,往后也提升了,所以使得它的應(yīng)用場景就變得更加寬闊了。比如現(xiàn)在的安防身份認(rèn)證,包括用微信領(lǐng)公積金,都是用人臉識別作為密碼,這個的原因在于:人臉識別的準(zhǔn)確度,我們經(jīng)過十多年的努力達(dá)到了技術(shù)邊界。
這個是很典型的一種場景:
作為互聯(lián)網(wǎng)軟件的產(chǎn)品經(jīng)理,你對開發(fā)說的一句話肯定走到他桌邊,說:“哎,這個功能要多久實現(xiàn)?”
開發(fā)說:“可能要兩個月吧?!?/span>
但如果你是AI產(chǎn)品經(jīng)理,就不能這樣去問了——因為這樣問就顯得太業(yè)余了;而且這樣的問法,這個產(chǎn)品肯定做不好。
那么該怎么問?
你應(yīng)該說:“三個月,語音識別率能達(dá)到95%嗎?”
你絕對不能說三個月時間能不能搞定語音識別,這時沒有人能回答你什么叫搞定——所以,你要把這個邊界提出來。
而且參與這個的開發(fā)同事肯定會這樣回答,
“三個月,識別率只能達(dá)到90%,而且需要標(biāo)注100萬條數(shù)據(jù),需要100個標(biāo)注師,如果你搞不定這些,那這個準(zhǔn)確率也保證不了。”
所以在AI時代,作為產(chǎn)品經(jīng)理設(shè)計產(chǎn)品的時候,關(guān)于技術(shù)邊界的認(rèn)知是最重要的。
作為AI產(chǎn)品經(jīng)理,第二個能力模型一定是要具備行業(yè)的相關(guān)知識和深刻洞察——這一點(diǎn)也是區(qū)別于互聯(lián)網(wǎng)其他領(lǐng)域的產(chǎn)品經(jīng)理。
互聯(lián)網(wǎng)創(chuàng)造了新的行業(yè)和規(guī)則。比如「微信」這種通信方式,之前是沒有的,現(xiàn)在創(chuàng)造出來了這樣的一種交互方式;再比如阿里巴巴這種電商,雖然這是從外國引入進(jìn)來的,但對絕大部分中國人來說,以前是沒有這樣的一種交互方式,所以里面的規(guī)則、操作和一些認(rèn)知結(jié)構(gòu)全是由互聯(lián)網(wǎng)人全新創(chuàng)造的——你會感覺到天地開闊,你設(shè)計的每個功能好像全國人民都能用。
但是,AI行業(yè)并不是去創(chuàng)造行業(yè)和規(guī)則;恰恰相反,AI行業(yè)是賦能傳統(tǒng)行業(yè),然后幫助傳統(tǒng)行業(yè)提升。
因此結(jié)合上文提到的算法結(jié)構(gòu)來說:AI得有輸入和輸出的數(shù)據(jù),你才能夠訓(xùn)練你的網(wǎng)格。而這個輸入、輸出則是由傳統(tǒng)行業(yè)里面的專家給你提供的。所以,如果你對傳統(tǒng)行業(yè)的認(rèn)知不深,那么你是無法參與到AI行業(yè)中。
比如:
所以,AI產(chǎn)品經(jīng)理肯定比互聯(lián)網(wǎng)產(chǎn)品經(jīng)理更加受拘束。
大家一定是要首先理解行業(yè),然后再運(yùn)用我們的聰明才智,把AI和領(lǐng)域融合起來。因此,這就提出來——了解行業(yè)的痛點(diǎn)和技術(shù)的可切入點(diǎn),1+1的模式是最好的入門途徑。
什么叫1+1?
一般做AI的時候,一定是要找一個行業(yè)專家來合作——當(dāng)然,這種行業(yè)專家可以是一個團(tuán)隊,也可以是顧問的形式。比如做教育,一定得跟很多有經(jīng)驗的教研人員來進(jìn)行合作;做醫(yī)療,一定時和從事某個細(xì)分領(lǐng)域的醫(yī)療專家來進(jìn)行合作。只有這樣,我們才能真正提升AI產(chǎn)品的使用程度,也才有數(shù)據(jù)。
第三點(diǎn)能力,我們稱之為“設(shè)計創(chuàng)新的人機(jī)耦合運(yùn)營模式”,AI時代的這個運(yùn)營模式也是需要創(chuàng)新。
互聯(lián)網(wǎng)時代,因為確定性的存在,所有的問題都減少了中間環(huán)節(jié),直達(dá)終端用戶,這是互聯(lián)網(wǎng)的本質(zhì)——提升效率。
但在AI時代,你不能這么去做,因為這可能會有問題:
案例1:智能客服——完整工作量降低10%,總體效率提升30%
如下圖左側(cè)的這個理想中機(jī)器人客服,用戶一上來后面沒人了,就是一個機(jī)器人“噠噠噠……”。但現(xiàn)實中由于AI技術(shù)邊界的存在,這個對于語義理解的準(zhǔn)確性還無法達(dá)到很實用。
現(xiàn)實生活中,我們都跟很多機(jī)器人對過話,也知道這個機(jī)器人的水平基本上就是兩三歲小朋友的水平。如果你認(rèn)識不到這樣的技術(shù)邊界,而要去設(shè)計這么一個機(jī)器人,在當(dāng)前這個環(huán)境,你肯定會失敗。
所以,我們提出了這樣的一種方式:指針對AI領(lǐng)域的不完美性,通過“人+機(jī)器”一起來做。
如上圖右側(cè)的這個模型,現(xiàn)在的智能客服系統(tǒng)是這樣的:用戶打進(jìn)來以后,把用戶的行為分解成兩種:導(dǎo)航和提問題。
你打到銀行,首先銀行都會先問你:“如果你要問某某某業(yè)務(wù),請按1號鍵;如果你要問某業(yè)務(wù),請按2號鍵……”這個就是分類,這是人工智能解決得最好的一個問題。
現(xiàn)在有一個語音導(dǎo)航,當(dāng)你進(jìn)來以后根據(jù)你語音識別成文字,再判斷你的分類屬于哪一類問題,自動幫你導(dǎo)航——這個接線員就不用了,而且也不需要用戶一步步地操作。
當(dāng)用戶進(jìn)來后可直接用自然語言說話,然后一秒鐘就可以自己導(dǎo)到機(jī)器人客服;如果發(fā)現(xiàn)機(jī)器人理解不了客戶的話,需馬上自動轉(zhuǎn)人工客服,這樣一來就稱之為叫人機(jī)耦合的創(chuàng)新模式。
這樣的模式,已經(jīng)被我們大量地應(yīng)用在金融行業(yè)和運(yùn)營商行業(yè)。
我們可以看到:完整的工作量降低了10%,就是說有10%的工作是完全被機(jī)器人取代了;總體的效率比原來提升30%,即通話時長節(jié)省了30%。
通過這種人機(jī)耦合的運(yùn)營模式,AI才能在這個行業(yè)當(dāng)中真正起到實際的效用。
案例2:醫(yī)療影像智能檢測——有效降低誤診率
接下來一個案例,我們分析一下理想中的醫(yī)療影像智能檢測:
比如說我們照完了肺部、乳腺等以后影像,就要判斷是否得了癌癥:這個結(jié)節(jié)有沒有結(jié)節(jié)?有,是哪一種結(jié)節(jié)?有沒有癌癥也要做一些判定。
如下圖左側(cè)是我們理想中的模型:醫(yī)療這個機(jī)器人診斷醫(yī)療圖像傳進(jìn)來,機(jī)器人給結(jié)果——但是這樣的路徑是錯誤的。因為我們是基于概率體系的,而機(jī)器人也會犯錯;如果你這么去做,那跟以前的做法是一樣的。
人際耦合模式是怎么做?
實際上,我們現(xiàn)在在醫(yī)院里面合作的是右邊這種模式。醫(yī)療影像上傳以后,由人類的醫(yī)生先看,醫(yī)生把所有的圖片以及診斷結(jié)果上傳到云端。我們在云端部署一個叫質(zhì)檢的機(jī)器人。
也就是:質(zhì)檢機(jī)器人也來看一次,如果兩者得到的診斷結(jié)果是一致,那就是pass;反之,則會讓人類的專家再來仲裁。
通過這樣的方式,能有效到降低誤診率,并且也非常實用。
所以,AI產(chǎn)品經(jīng)理在設(shè)計產(chǎn)品時,不光是要設(shè)計功能,一定要預(yù)先考慮到產(chǎn)品在應(yīng)用的時候,它的運(yùn)營模式是什么。而你如何試用運(yùn)營模式,是和你對行業(yè)的認(rèn)知,對技術(shù)邊界的認(rèn)知,以及你的技術(shù)在行業(yè)中是否足夠?qū)嵱玫榷际窍⑾⑾嚓P(guān)的。
以上為本次大會分享內(nèi)容。
聯(lián)系客服