芥末堆 紅印兒 11月17日報道
11月16日,在“GET2017教育科技大會”第三日的人工智能論壇上,科大訊飛教育事業(yè)群副總裁王卓發(fā)表了以“人工智能助力教與學”為主題的演講。他介紹了科大訊飛人工智能技術(shù)的發(fā)展情況,并分享了科大訊飛將人工智能技術(shù)應(yīng)用到教和學之中的經(jīng)驗。
“如果不能回應(yīng)中國社會的重大問題,科大訊飛的價值會大打折扣。”王卓說。科大訊飛在教育行業(yè)中發(fā)現(xiàn)了很多亟待解決的問題,比如,如何讓學生個性化地學習、如何減少老師的重復性工作。通過利用人工智能技術(shù)收集和分析教學數(shù)據(jù),科大訊飛逐漸建立起一個網(wǎng)絡(luò)化、數(shù)字化的教學平臺,為后續(xù)實現(xiàn)個性化學習打下數(shù)據(jù)基礎(chǔ)。
以下是王卓的演講實錄(芥末堆有刪減):
今天我想在這里做兩件事。一是向大家全面地介紹科大訊飛AI技術(shù)發(fā)展到什么樣的程度、在教育行業(yè)是怎樣應(yīng)用的。二是介紹科大訊飛在教育行業(yè)中將技術(shù)、用戶流量、內(nèi)容整合、渠道建設(shè)都做到什么樣的程度,看看這些資源怎么與在座的創(chuàng)業(yè)團隊對接、形成生態(tài),共同推動中國教育產(chǎn)業(yè)的發(fā)展。
技術(shù)發(fā)展的價值在于它能解決怎樣的社會問題首先,介紹一下人工智能現(xiàn)在的發(fā)展情況。人工智能已經(jīng)上升到了國家戰(zhàn)略的層面。在2016年,人工智能被美國和歐盟列入整體發(fā)展戰(zhàn)略。我們國家今年出臺了相關(guān)文件,公布了新一代人工智能發(fā)展規(guī)劃。未來,人工智能對國家的經(jīng)濟發(fā)展將起到至關(guān)重要的作用。在人工智能的發(fā)展方面,中美兩國處于同一個賽道上。我們在人工智能尤其是感知智能的發(fā)展賽道上處于全球最領(lǐng)先的水平。
今年2月,我國人工智能發(fā)展的進展受到美國的關(guān)注,《紐約時報》專門對此進行了報道。在發(fā)展人工智能的過程中,科大訊飛認識到這不是一家企業(yè)的事,也不是幾個團隊的事情,而是需要舉全國之力來做。凡是有志于從事這個領(lǐng)域的團隊、公司、研究機構(gòu),應(yīng)該聯(lián)合起來,一起推動中國人工智能產(chǎn)業(yè)的發(fā)展。2016年,我們聯(lián)合相關(guān)合作單位發(fā)表了《人工智能深圳宣言》,就是要在國內(nèi)團結(jié)一切可以團結(jié)的力量,共同推動中國人工智能產(chǎn)業(yè)的發(fā)展。
在這個背景下,我們再來談教育??拼笥嶏w為什么要進入教育行業(yè)?科大訊飛發(fā)展到目前的狀態(tài),如果想在未來追求更大的發(fā)展,我們的價值取決于我們能解決什么樣的重大社會問題。如果不能回應(yīng)中國社會的重大問題,科大訊飛的價值會大打折扣。
放眼中國各個行業(yè),教育行業(yè)存在的問題最多。教育行業(yè)未來的變革中存在巨大的商業(yè)價值,這是科大訊飛把人工智能技術(shù)應(yīng)用在教育行業(yè)的根本出發(fā)點。由于教育行業(yè)的特性,這件事也不是一家企業(yè)能做的。我們懷著去年發(fā)表《深圳宣言》時的那種心態(tài),希望團結(jié)國內(nèi)有志于從事教育行業(yè)的企業(yè)和創(chuàng)業(yè)團隊,一起實踐人工智能在教育行業(yè)的應(yīng)用。
我們把人工智能分為三個層次,即計算智能、感知智能和認知智能。計算智能是說機器就像AlphaGo機器人一樣,計算能力和存儲能力超強??拼笥嶏w的自身定位是在感知智能和認知智能方面。感知智能就是讓計算機能聽會說、能看會認,像人一樣跟你交流。認知智能是說讓計算機能理解、會思考。科大訊飛從1999年創(chuàng)業(yè)之始就在感知智能的賽道上,到今年,我們的位置已經(jīng)從感知智能在向認知智能靠近。
在感知智能上,我們已經(jīng)做到了全球領(lǐng)先的水平。從2006年參加全球的PK大賽到今天,科大訊飛代表中國在感知智能方面一直獲得全球第一。不管是語音合成、語音識別,還是高噪音環(huán)境下的語音識別,在所有的PK評測中科大訊飛都代表中國拿到了第一名。我們的感知智能技術(shù)在全球絕對是領(lǐng)先的?,F(xiàn)在,感知智能技術(shù)也用在了語文、英語、音樂等一些學科中,用來給學生構(gòu)建標準化的學習環(huán)境。
關(guān)于認知智能,全球基本上都是圍繞考試機器人在做。美國華盛頓大學的圖靈中心已經(jīng)把考試機器人作為人工智能的一個重要抓手,通過美國高中生物考試來檢驗人工智能的效果。日本國立情報研究所也把機器人是否能考上東京大學作為人工智能的抓手。
中國科技部建成了類人答題機器人,聯(lián)合了國內(nèi)9家最領(lǐng)先的研究單位,想在2020年讓機器人能在全學科考試上達到前20%考生的水平?,F(xiàn)在認知智能的重點都投向了考試機器人的研究。為什么?因為考試機器人回答的題目是你以前在社會上見不到的,解析題目并分析整個知識體系對技術(shù)的要求非常高。我們國家也把類人答題考試機器人作為中國人工智能的總抓手。
這對科大訊飛來說是一個機遇??拼笥嶏w牽頭承擔了首個人工智能重大項目“類人答題機器人”。我們跟其他另外8家單位一起致力于這方面的攻關(guān)。在高考機器人的攻關(guān)方面,我們以語音和語言為入口推動認知革命的整體變革。
在國家考試中心出題的評測下,150分的數(shù)學試卷,機器人基本能達到110分的水平。在醫(yī)療方面,360分就能通過全國醫(yī)師資格考試,而機器人考了457分。醫(yī)師資格考試的考題不是基于題庫而是重新定制的,因此它的考試難度也相當高。
技術(shù)開始驅(qū)動教育的變革科大訊飛如何把現(xiàn)有的技術(shù)成果應(yīng)用在教育行業(yè)的變革中?我們總說技術(shù)是為教育服務(wù)的。教育是核心,技術(shù)位于從屬的地位。但到目前這個階段,技術(shù)發(fā)展的成果已遠遠超越了教學理論和方法論的水平。教育技術(shù)的發(fā)展已經(jīng)對教育的方法論產(chǎn)生了具有變革性的影響。我們慢慢在形成一個共識,那就是技術(shù)在驅(qū)動教育,技術(shù)的重要性得到大大提升。
目前,中國的教育已經(jīng)進入教育大數(shù)據(jù)時代。 這個“大”字怎么理解?我們理解它有兩層含義,一是指數(shù)量大,二是指價值大。擁有最大量的數(shù)據(jù)并不一定就獲得最大的價值。在大數(shù)據(jù)的背景下,教育未來的發(fā)展方向一定是在個性化學習上??拼笥嶏w也在從教育大數(shù)據(jù)、個性化學習的角度來推動人工智能和教育的融合。
人工智能技術(shù)應(yīng)該給教育帶來怎樣的價值?第一,人工智能技術(shù)要對數(shù)據(jù)采集的手段進行變革。 大量的教和學的過程化數(shù)據(jù)都是以視頻、音頻、圖片的方式存在的,但這只是數(shù)字化。想要形成數(shù)據(jù)化,就需要人工智能技術(shù)。人工智能技術(shù)要能把音頻都轉(zhuǎn)成文字,把以前寫在紙上的作文識別出來,把以前在紙上寫的學科試題答卷智能解析出來。用人工智能技術(shù)對課堂教學場景進行分析,是人工智能技術(shù)在數(shù)據(jù)采集和分析方面的重要價值。
第二,為教師減負增效。很多老師都在做重復性的工作,比如批改作業(yè)、重復備課。人工智能可以大幅提高老師的效率,讓計算機來承擔那些簡單重復的工作。
第三,幫助學生實現(xiàn)個性化的學習,提高學習效率。一個初三的學生可能會花3個小時來練習一套題,第二天他做這套題可以得100分。通過后臺數(shù)據(jù)的分析,我們可以在半小時里教給學生他想學的、欠缺的、需要提升的東西,剩下兩個半小時的時間,學生可以做別的事情。
第四,為管理決策提供大數(shù)據(jù),為科學治理提供支撐。國家對教育的年度投資已經(jīng)達到了GDP的4%。想要知道投下去的資源是否產(chǎn)生了相應(yīng)的效果,可以用人工智能技術(shù)分析教育大數(shù)據(jù),給國家相關(guān)部門提供科學的決策依據(jù)。
用伴隨式的數(shù)據(jù)收集與分析為個性化學習做鋪墊想要全面地推進人工智能,要做到三點:
1、深入一線,覆蓋教、學、考、管
一定要深入到一線,不能就技術(shù)論技術(shù)。
人工智能技術(shù)聽著很高大上,但也有短板,并沒有達到完全成熟的地步。技術(shù)人員、產(chǎn)品人員必須要到一線去深入了解教、考、評、管各個環(huán)節(jié),才能讓技術(shù)與教育的應(yīng)用場景結(jié)合起來。
2、互聯(lián)聯(lián)通,常態(tài)應(yīng)用中收集真實教育大數(shù)據(jù)
常態(tài)化收集不是說收集一次、兩次的數(shù)據(jù)。它是對課堂教學、課堂學習、家庭作業(yè)等環(huán)節(jié)進行日常性的數(shù)據(jù)采集,每天都會采集學生真實的生活數(shù)據(jù)、體質(zhì)數(shù)據(jù)。常態(tài)化采集對供應(yīng)商的服務(wù)能力、資金能力都提出非常大的要求。
3、應(yīng)用大數(shù)據(jù),實現(xiàn)個性化教、針對性學與科學決策
如果不圍繞以上三點深入研究的話,人工智能就是一個高大上的東西,無法落地??拼笥嶏w對教學過程性數(shù)據(jù)的采集有一個完整的鏈條。從課堂互動、作業(yè)到考試,我們都會收集對應(yīng)的數(shù)據(jù)。不同數(shù)據(jù)的采集方法有所不同。比如我們用智慧課堂設(shè)備采集課堂教學互動和授課數(shù)據(jù),用手機采集日常學生作業(yè)和練習的數(shù)據(jù),用校級云閱卷系統(tǒng)采集校內(nèi)考試數(shù)據(jù),用區(qū)域數(shù)據(jù)中心采集中考、會考等區(qū)域統(tǒng)考數(shù)據(jù)。
學校是數(shù)據(jù)采集的主戰(zhàn)場。我們把科大訊飛的系統(tǒng)安裝到學校里,目前主要針對中學。有1萬多所學校部署了我們的系統(tǒng),并形成了常態(tài)化的使用。采集數(shù)據(jù)的服務(wù)成本和資金成本是巨大的。每個學校都要配備相關(guān)的硬件、軟件和到校服務(wù)團隊。基本上每200個學校就要配12名地面服務(wù)人員。前期的硬件和軟件投入都需要有資本實力,用免費部署系統(tǒng)的方式來培育市場、引領(lǐng)市場。
另外,建設(shè)自身品牌也很重要。當學校得知它的數(shù)據(jù)要匯聚到我們的平臺上,一開始是會抵制的。我們通過一年、兩年、三年用心用情的服務(wù),樹立起自己在教育信息化方面的品牌,獲得了學校的認可,才能做出這樣的匯集數(shù)據(jù)的平臺。
目前,科大訊飛已經(jīng)建立起一個網(wǎng)絡(luò)化、數(shù)字化的教學平臺,采用伴隨式的教學數(shù)據(jù)收集方式,為個性化學習打下堅實的數(shù)據(jù)基礎(chǔ)。
通過搭建平臺、數(shù)據(jù)分析和資源建設(shè)讓人工智能技術(shù)融入教育在推廣應(yīng)用中有幾個亮點。一是口語學習。口語學習面向中考、高考等各類考試。以前的口語考試要么缺乏客觀評價學生口語水平的方法,要么所需投入的人力物力很大。一旦評審老師的疲勞了或者評分標準不統(tǒng)一,就不能保證公平。人工智能技術(shù)已經(jīng)進入中高考的智能評閱中。我們的口語評測技術(shù)在廣東、江蘇、上海、北京、天津等十多個省市的中高考里已經(jīng)得到全面的應(yīng)用。
二是全學科的閱卷。批改主觀題和作文會占用老師大量的時間。我們可以用人工智能技術(shù)把老師從重復的工作中釋放出來。一些省市中高考的作文批改已經(jīng)在使用我們的技術(shù)。
收集好數(shù)據(jù)后,最難的是對教和學的數(shù)據(jù)進行精準的分析評價。為了進行評價,要建立龐大的知識庫,覆蓋全學科、全學段。市面上能采集到的題庫數(shù)據(jù)很多都是冗余的,都不能作為種子試題。當每個學科都選出四、五萬道種子試題之后,就要開始搭建學科知識體系。體系怎么分層、板塊怎么劃分,全國都眾說紛紜,很難找到一致的標準??茖W的分層是靠采集到的數(shù)據(jù)來驅(qū)動的,是非常難的事,所需投入也很大??拼笥嶏w初步建立起一套分析評價體系,針對主管部門、校長、老師、家長和學生,都能提供他們相應(yīng)感興趣的評價服務(wù)。
我們幫助老師實現(xiàn)了精準的講評。在上課前,老師就可以通過后臺數(shù)據(jù)知道學生在作業(yè)中都有哪些問題。在課堂上,老師就可以采用更有針對性的教學策略,精準地去講解相應(yīng)的知識點。我們還初步實現(xiàn)了針對學生的個性化題庫推薦。我們?yōu)槟骋粋€學科構(gòu)建了898個知識點,還梳理了2489個題型,建立了5萬多道種子用戶題和60多萬道拓展題目。在這樣的知識體系下,當學生的學習數(shù)據(jù)被回收上來之后,就可以給學生更加精準地推送題目,提高學習效率。
我們的后臺數(shù)據(jù)也支持老師的教研。以前的教研是經(jīng)驗性的,現(xiàn)在是大數(shù)據(jù)指導下的精準教研。很多學校已經(jīng)建立了精準教研中心。根據(jù)學生的數(shù)據(jù)和分析,我們會告訴老師教學中存在什么問題,他們的教研應(yīng)該如何更有針對性。
除了平臺、數(shù)據(jù)分析和評價之外,人工智能發(fā)展還有一個很核心的問題,那就是資源的匯集。不光是計算機學習海量知識需要海量的數(shù)據(jù),學生的學習、老師的教學也需要海量數(shù)據(jù)資源的支持。
我們的資源建設(shè)分為三個層次:
第一,國家資源平臺。十二五期間,國家積累了大量的數(shù)據(jù),包括名師資源、一師一優(yōu)課的資源。我們把這些資源匯集起來,篩選出高質(zhì)量的內(nèi)容,為老師的課堂教學和學生個性化學習提供服務(wù)。
第二,各大出版社的資源。我們提供的數(shù)據(jù)服務(wù)覆蓋學生學習的整個過程。如果要開發(fā)同步學習的產(chǎn)品,必須要拿到各個出版社的授權(quán),去整合各個出版社的優(yōu)質(zhì)資源??拼笥嶏w每年會在這方面投入幾千萬的資金。
第三,教師日常教學的資源。我們用智慧課堂采集課堂上的全程數(shù)據(jù)。在后臺,我們有一個3000多人的加工團隊。
在未來,人工智能技術(shù)與教育的融合會向哪幾個方面發(fā)展?現(xiàn)階段,我們主要采集學生知識性學習的數(shù)據(jù)。今后,我們也會關(guān)注學生的成長數(shù)據(jù)、心理健康數(shù)據(jù)、體質(zhì)數(shù)據(jù)、創(chuàng)造數(shù)據(jù)、核心素養(yǎng)數(shù)據(jù)等等。我們還會關(guān)注智能硬件、VR、AR技術(shù)的發(fā)展。最終,我們希望搭建一個覆蓋全教育場景的教育數(shù)據(jù)中心,實現(xiàn)個性化學習、針對性教學以及科學管理。