200 多家明星企業(yè),20 位著名投資機(jī)構(gòu)頂級(jí)投資人共同參與!「新智造成長(zhǎng)榜」致力于發(fā)掘 AI 領(lǐng)域有 “三年十倍” 成長(zhǎng)潛力的創(chuàng)新公司,下一波 AI 獨(dú)角獸,會(huì)有你么?點(diǎn)擊閱讀原文了解詳情!
雷鋒網(wǎng)按:本文作者劉利,自學(xué)圍棋多年,弈城 8D 水平,曾獲重慶大學(xué)圍棋賽冠軍,重慶市高校聯(lián)賽冠軍,重慶市首屆周日圍棋賽冠軍。雷鋒網(wǎng)經(jīng)授權(quán)獨(dú)家首發(fā),未經(jīng)許可不得轉(zhuǎn)載。
苦等兩個(gè)月的的人機(jī)大戰(zhàn)終于如期舉行了,但這一天真的到來(lái)之際,卻遠(yuǎn)沒(méi)有之前期待的那樣那人興奮。首先是禁止在直播中出現(xiàn)谷歌字樣,再到后來(lái)的各網(wǎng)站全面禁播,野狐圍棋的直播預(yù)告也下架,反反復(fù)復(fù)的好幾次,讓此次比賽的關(guān)注熱度大大下降。作為致力于宣傳圍棋,推廣圍棋的柯潔,恐怕心情也是很受影響的。
基于賽前的預(yù)測(cè), 多數(shù)觀點(diǎn)認(rèn)為, 柯潔在三盤棋中能贏至少一盤的概率僅為 10%,甚至更加悲觀,很多人更是開(kāi)玩笑說(shuō),只要柯潔能贏一盤,就要吃棋盤電腦翔啥的,或者讓自己身上的零件少點(diǎn)啥的,更是認(rèn)定了柯潔能贏一盤的概率無(wú)限趨近于零。但第一盤的結(jié)果下來(lái),柯潔只輸了 1/4 子,是不是又讓人看到勝利的希望了呢?
首先值得一提的是這次比賽的獎(jiǎng)金,如果柯潔獲勝,將會(huì)獲得 150 萬(wàn)美元,而無(wú)論勝負(fù),柯潔會(huì)獲得 30 萬(wàn)美元的出場(chǎng)費(fèi),這個(gè)數(shù)字對(duì)圍棋界來(lái)講確實(shí)是一個(gè)天文數(shù)字,多年以來(lái),世界各大賽中獎(jiǎng)金最高的四年一屆的應(yīng)氏杯,冠軍獎(jiǎng)金才不過(guò) 40 萬(wàn)美元。一方面反映出對(duì)世界等級(jí)分排名第一的柯潔的尊重,另一方面也反映出柯潔獲勝的概率極小。
DeepMind 團(tuán)隊(duì)不打無(wú)把握之仗,早在去年 3 月,人機(jī)大戰(zhàn)的第一季,DeepMind 團(tuán)隊(duì)選中了十年來(lái)獲得世界冠軍頭銜最多,人氣極高的韓國(guó)選手李世石作為挑戰(zhàn)對(duì)象。據(jù)賽后的爆料,其實(shí) AlphaGo 的自評(píng)實(shí)力已經(jīng)遠(yuǎn)高于李世石的等級(jí)分。李世石五盤中的唯一一勝其實(shí)是擊中了 AlphaGo 程序計(jì)算中的軟肋——在有限的算力下,為了保證計(jì)算的深度,需要對(duì)一些不太可能的變化進(jìn)行剪枝。李世石的神之一手,雖然事后看并不成立,卻正是圍棋中的盲點(diǎn),在 AlphaGo 的眼中,這一手出現(xiàn)的概率僅有萬(wàn)分之四,因而并沒(méi)有太多考慮。突然出現(xiàn)的這一手,使得所有變化都得重新計(jì)算,因而犯下大錯(cuò)。DeepMind 團(tuán)隊(duì)事后也積極的想策略解決這一問(wèn)題,但看得出,他們賽前其實(shí)對(duì)拿下李世石是很有信心的。然而,4:1 的比分畢竟使得人工智能已經(jīng)完全征服圍棋這一長(zhǎng)期難題的結(jié)論不那么使人信服,所以有了今年的柯阿之戰(zhàn)。
一是因?yàn)?,柯潔是?dāng)前的世界第一人,早在人機(jī)大戰(zhàn)第一季結(jié)束的時(shí)候就發(fā)出了「就算 AlphaGo 戰(zhàn)勝了李世石,但它贏不了我」的豪言壯語(yǔ)。
二是 DeepMind 公司在修復(fù)了 AlphaGo 的程序 BUG 之后,總想有再次找高手試手的興奮。
三是看看一年多以后,科技到底能讓 AlphaGo 進(jìn)步到了何種程度。
其實(shí)早在今年年初,去年年底, AlphaGo 就悄悄地出來(lái)試水了,化身「Master」 的阿法狗在弈城圍棋和野狐圍棋上各下了 30 盤棋,取得了 60:0 的戰(zhàn)績(jī)。從中我們可以看出 AlphaGo 的一些「性格」:大多數(shù)棋局在 100 手以前就已取得了壓倒性的優(yōu)勢(shì),優(yōu)勢(shì)后的 AlphaGo 顯得保守和謙讓,后半盤尤其是小官子經(jīng)常犯錯(cuò),這是職業(yè)棋手很難犯錯(cuò)的領(lǐng)域。不過(guò)最終的結(jié)果,反正是 AlphaGo 不管大勝小勝,最終全部都贏下來(lái)了,最少的贏了 0.5 目。真不知道是幸運(yùn)還是早有成算。因?yàn)楫吘怪粍?0.5 目的盤數(shù)并不多,并不能做為結(jié)論。而且根據(jù) AlphaGo 論文所開(kāi)發(fā)出的各個(gè) AI,目前都有收官弱項(xiàng)的共同毛病。
再來(lái)回顧一下今天的這盤棋,早上 10 點(diǎn)半,比賽正式開(kāi)始,柯潔猜到黑棋,不知道對(duì)壓力山大的柯潔的心理有沒(méi)有影響。目前的棋界普遍是愿意下白棋的,尤其是中國(guó)規(guī)則下。中國(guó)規(guī)則黑棋貼 3 又 3/4 子,可能是偏向白棋一方了。從 AlphaGo 的自評(píng)勝率中執(zhí)黑也是勝率稍差,對(duì)柯潔本人近年來(lái)的戰(zhàn)績(jī)來(lái)看,執(zhí)白的勝率也是明顯比執(zhí)黑要好的。筆者開(kāi)著免費(fèi)棋軟 LEELA 最新版 0.10.0,靜靜的欣賞這盤棋??聺嶏@然是有備而來(lái),小目大飛守角加一個(gè)三 3,然后第 7 手,點(diǎn)對(duì)手星星下的三 3,很徹底的表明先撈后洗的策略,先撈足實(shí)地,然后和電腦比大型死活。
筆者還是很認(rèn)可這一策略的,最近在野狐上很火的驪龍 AI(絕藝?yán)习妫?,大殺四方,偶爾輸棋,基本也只吃大型死活偶爾犯錯(cuò)這一招了。 AlphaGo 是不是也有這樣的弱點(diǎn)呢?
由于黑棋的位置低,第 5 手黑棋的勝率從開(kāi)局的 48% 降到 46%,看來(lái)電腦并不認(rèn)可三 3 這手棋。黑棋第 7 手點(diǎn)右下角三 3 至 22 手征掉一子告一段落,不知道柯潔此時(shí)有沒(méi)有后悔左上角是三 3。如果左上角是星位,那么 22 是征不掉黑子的。
24 是極其出乎筆者意料的一手, AlphaGo 果然是高者在腹。
這手棋如果按筆者的理解叫中途半端,是要被老師批評(píng)的,沒(méi)有撥掉一子那么干凈,對(duì)二路的夾也沒(méi)有補(bǔ)到??聺嵖吹竭@手棋時(shí)的表情也非常有意思,一下笑了,然后直起身子,不停的摸自己的頭。考慮良久之后,拆了一個(gè)邊,限制的外勢(shì)。白棋 26 打入進(jìn)入戰(zhàn)斗,面對(duì)柯潔的 29、31 兩記重拳, AlphaGo 都沒(méi)有應(yīng),讓筆者想起了太極高手的閃轉(zhuǎn)騰挪。這狗也太靈活了,這讓人怎么下? 好在后面的進(jìn)程還算正常,到 46 告一段落,黑棋勝率 45%。50,54 刺和斷,又是出乎人類棋手的意料!人類棋手不會(huì)在四顆子還有跑的可能的時(shí)候,去讓刺和黑拐頭相交換,讓四子徹底死掉,也不會(huì)在大場(chǎng)還那么多的時(shí)候花一手?jǐn)鄟?lái)?yè)Q取一點(diǎn)點(diǎn)的借用的。 AlphaGo 大師真乃神出鬼沒(méi)!它會(huì)走在哪你真是猜不到的。
黑 55 被動(dòng)得來(lái)的先手,柯潔沒(méi)有選擇拆邊加強(qiáng)自身,而是選擇了繼續(xù)打入破空,堅(jiān)決貫徹自己的戰(zhàn)略意圖。
至 65,黑棋在左下又成功掏掉一個(gè)角,不過(guò)勝率下降到 39%。
后面便是 AlphaGo 穩(wěn)如泰山的表演了,先攻擊兩子,再洗掉上邊。局面的差距越拉越小,黑勝的機(jī)率卻越來(lái)越小,真是一個(gè)怪圈!其中不乏 AlphaGo 有一些勸降的招數(shù),比如第 200 手的提,最終黑棋輸了 1/4 子。
回顧整盤棋,進(jìn)程和年初的 MASTER 贏棋的過(guò)程非常類似。如果說(shuō)年初下快棋,人類棋手來(lái)不及思考,犯了很多低級(jí)錯(cuò)誤導(dǎo)致輸棋,那么今天這盤棋,時(shí)間很充裕,可以說(shuō)沒(méi)有什么低級(jí)錯(cuò)誤了。筆者很難確定究竟哪幾步是壞棋,導(dǎo)致了棋局的落后,只能說(shuō)是 AlphaGo 憑借神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練出的棋感確實(shí)比人類選點(diǎn)更精確。
如果說(shuō)輸?shù)亩嗌俨荒苷J(rèn)為是實(shí)力的差距,那么從 ELO GO-RATINGS 等級(jí)分的差距可以大致的預(yù)測(cè)一下。等級(jí)分比對(duì)手高 300 分的話,每盤棋勝率在 85% 左右,比對(duì)手高 600 的話,勝率在 97% 左右??聺嵉牡燃?jí)分大約在 3600-3700 之間,去年戰(zhàn)勝李世石版本的 AlphaGo 自評(píng)等級(jí)分在 4500 左右。而經(jīng)過(guò)了一年多之后, AlphaGo 的等級(jí)分進(jìn)步到多少我們不得而知,但至少不會(huì)比去年的版本低。所以,如果找不到 AlphaGo 一些未知弱點(diǎn)的話,人類幾乎可以說(shuō)是一勝難求。
柯潔認(rèn)為,Alphago 的棋與去年完全是兩個(gè)人。第一次時(shí)它很接近人的,但現(xiàn)在越來(lái)越像「上帝」。所以,雖然只是 1/4 子,其實(shí)是人類棋手無(wú)法逾越的一條鴻溝。在冰冷的數(shù)據(jù)面前,再如何說(shuō)讓柯潔繼續(xù)努力的話,都顯得蒼白無(wú)力,接下來(lái)的比賽,讓我們就期待精彩的過(guò)程吧。
聯(lián)系客服