寫(xiě)在第五局之前
首先對(duì)我之前兩篇文章簡(jiǎn)單回顧,之后梳理李世石在第三局、第四局中的策略行為,最后,以自己職業(yè)棋士的立場(chǎng)看待此次人機(jī)對(duì)決
0 對(duì)前兩篇文章的回顧
第一篇《李世石的策略與AlphaGo的弱點(diǎn)》的開(kāi)頭,分析李世石第一次面對(duì)AlphaGo時(shí)所采用的試探和策略。然后指出傳統(tǒng)意義上AlphaGo下出的失誤和好棋。之后談到AlphaGo失誤在算法上的原因,以及人和AI對(duì)失誤的不同定義。第5節(jié),通過(guò)對(duì)棋譜和算法的分析明確提出AlphaGo的兩個(gè)弱點(diǎn):邏輯缺失、逃避劫爭(zhēng)。第6節(jié),針對(duì)這兩個(gè)弱點(diǎn)對(duì)李世石第二局的策略進(jìn)行了預(yù)測(cè)和建議:套路開(kāi)局、制造劫爭(zhēng)。
在第二篇《這兩盤棋,沒(méi)人比李世石做得更好》,首先分析了“協(xié)議禁劫”為什么不可能。
之后討論了AlphaGo的算法決定其落子的決策基于“勝率”而不是“最優(yōu)”,并分析了李世石在第一局的策略和表現(xiàn)。在此基礎(chǔ)上,分析了李世石第二局的策略和行為,指出AlphaGo的強(qiáng)大(和不完美),以及誤判它實(shí)力的原因。之后,指出李世石面對(duì)AlphaGo所做出的種種努力,以及圍棋Ai作為參照者對(duì)于人類探索圍棋的重要意義。第5節(jié),分析了后三盤可能的情況。最后,由算法得出向AlphaGo學(xué)棋的陷阱和巨大價(jià)值。
1 第三局李世石的策略
讓我們進(jìn)入正題。我將AlphaGo為我們敞開(kāi)的新世界留在下一篇來(lái)描繪,在這一篇,我們還是切入李世石的視角,看看在第三局和第四局中他究竟做了什么,又是如何得到了第一次勝利。
在前兩局,李世石通過(guò)不同的策略得到了很多可以轉(zhuǎn)化為人類語(yǔ)言的信息,概述如下:
第一局
1,過(guò)“無(wú)譜布局”得知AlphaGo不依賴背譜
2,通過(guò)“避開(kāi)定式”得知AlphaGo選點(diǎn)基于全局
3,通過(guò)“開(kāi)放式復(fù)雜局面”得知AlphaGo不怕亂戰(zhàn)
4,通過(guò)“細(xì)棋局面”得知AlphaGo存在邏輯缺失導(dǎo)致局部虧損的弱點(diǎn)(因算法導(dǎo)致的優(yōu)勢(shì)退讓)
第二局:
1,通過(guò)“常規(guī)布局”得知AlphaGo會(huì)有“創(chuàng)新”下法
2,通過(guò)“均衡局面”得知AlphaGo此局面下后半盤極強(qiáng)
3,通過(guò)對(duì)手下法得知AlphaGo存在逃避劫爭(zhēng)的傾向(在第一局也能看到,但第二局更為明顯)。
如果你獲得了這些信息,你會(huì)如何面對(duì)第三局?
在上一篇文章的第五節(jié),我預(yù)測(cè)李世石會(huì)試一試劫爭(zhēng),雖然可能并沒(méi)有用。另外我認(rèn)為空中開(kāi)局會(huì)比較有趣,或許能見(jiàn)識(shí)到很多新東西。
從爭(zhēng)勝的角度,還是用“常規(guī)布局”優(yōu)于“無(wú)譜布局”。這是因?yàn)椋瑢?duì)于人而言,“常規(guī)布局”是歷史上棋手整體的經(jīng)驗(yàn)結(jié)果,而AlphaGo不背譜,常規(guī)與否對(duì)于它并無(wú)差異。
確定了布局方法之后,還要制定布局策略,才好最終選擇布局。在第二局中,李世石得知均衡局面下AlphaGo后半盤極強(qiáng),“失誤”減少。如果選擇均衡將很難取勝,因此寄希望于前半盤取得較大優(yōu)勢(shì)。
1,常規(guī)布局;2,爭(zhēng)取大優(yōu)…。。滿足這兩個(gè)條件最好的開(kāi)局是——大模樣!
李世石選擇了左下先掛的高中國(guó)流,這是現(xiàn)代最典型的大模樣開(kāi)局
大模樣開(kāi)局的特點(diǎn)是:一,容易形成攻殺局面;二,優(yōu)劣出入比較大。
果然,AlphaGo第12手掛入,給了黑棋開(kāi)局攻殺的機(jī)會(huì)。
李世石13、15兩手。都是在有兩種選擇的情況下選擇了最為兇狠的下法。
第二局結(jié)束之后,很多人質(zhì)問(wèn)李世石為什么失去了血性,為什么那么穩(wěn)健地輸了。在我看來(lái),這是李世石的策略而已,他在第一局找到的電腦可能的弱點(diǎn),在第二局中以這樣的方式來(lái)針對(duì)。即使他并不擅長(zhǎng)從頭到尾均衡平和的局面(那是李昌鎬所擅長(zhǎng)的),他仍然堅(jiān)定地貫徹了這一策略。當(dāng)然,針對(duì)性策略在某種程度上確實(shí)會(huì)束縛住他,加上心理上不可避免的壓力,在技術(shù)上難以發(fā)揮到極致,這是不應(yīng)苛責(zé)的。
也有一種觀點(diǎn)是,干嘛要去找電腦的弱點(diǎn),做好自己就行了。去找對(duì)手的弱點(diǎn)本身就做得不夠好。
的確,大部分棋手都不會(huì)考慮對(duì)面坐著的是AlphaGo,只要下好自己的棋。但是,每個(gè)棋手在每局棋中都會(huì)有面臨兩難選擇的時(shí)候,此時(shí)如何選擇,在我看來(lái)都是做自己。
《孫子兵法》云“知己知彼,百戰(zhàn)不殆?!绷私鈱?duì)手,既是為了更好地爭(zhēng)勝,也是對(duì)對(duì)手極大的尊重。
如前面所說(shuō),如果沒(méi)有李世石前三局根據(jù)AI的回應(yīng)而不斷變換的進(jìn)攻手法,我們就不可能如今天這般全面地了解AlphaGo在圍棋盤上的特點(diǎn),也難以取得第四局這樣艱難而酣暢的勝利。反過(guò)來(lái)想,即使真的在第一局就出現(xiàn)了第四局這樣的情況,我們對(duì)AlphaGo的誤判將會(huì)達(dá)到什么程度?
回到第三局,李世石布下了大模樣開(kāi)局,在對(duì)方深入之時(shí)選擇了最為強(qiáng)烈的攻殺手段,希望在棋局前期取得大優(yōu)。
但是,我們看到了AlphaGo近乎完美的處理。
白16,這手棋基本上否定了黑15的下法。過(guò)程中黑21應(yīng)有疑問(wèn),但這是作為對(duì)局者在實(shí)戰(zhàn)之前很難確認(rèn)的事情。
白32,基本上宣告了李世石此局策略的失敗。
對(duì)于AlphaGo而言,它本身并沒(méi)有“治孤”這樣的概念,但在第三局,它面對(duì)李世石選擇的這種局面時(shí),表現(xiàn)出強(qiáng)大的能力。
基本上所有的棋手在第三局之后都認(rèn)可了AlphaGo的實(shí)力在人類棋手之上,這是因?yàn)?,AlphaGo以所有棋手都看得懂的方式輕易地化解了李世石開(kāi)局的凌厲攻勢(shì),取得了完勝。
這局棋,白棋的反擊得手之后,已經(jīng)是李世石崩潰的局面。但李世石的強(qiáng)大之處在于,在這樣的局面下他仍然做出了新的試探。
黑77手,考驗(yàn)AlphaGo處理局部與全局關(guān)聯(lián)的能力。
黑115手以下,考驗(yàn)AlphaGo殺棋的能力。李世石在對(duì)陣人類選手時(shí)雖然也會(huì)有劣勢(shì)下考驗(yàn)對(duì)方的手段,但這一手顯然是只針對(duì)機(jī)器。
最終,李世石在下方做出了一個(gè)劫爭(zhēng),這一結(jié)果雖然與AlphaGo在優(yōu)勢(shì)下的退讓有關(guān),但也確實(shí)是李世石才能做到的事情。
某種意義上,當(dāng)我們見(jiàn)識(shí)了AlphaGo第三局這般漂亮的前半盤,就很難在同一盤棋中再見(jiàn)到AlphaGo第二局那般強(qiáng)大的后半盤。作為棋手,對(duì)這一點(diǎn)感到些許遺憾,這是它基于勝率的算法所決定的。
至于后面的劫爭(zhēng),對(duì)于很多人而言是證偽了“AlphaGo不會(huì)打劫”和“協(xié)議禁劫”這兩件事情,但在我看來(lái)不過(guò)是對(duì)邏輯推理得出的確定結(jié)論的一次事實(shí)呈現(xiàn)。
由于前二局的信息,這一局李世石制定了在前半盤爭(zhēng)勝的策略,采取了大模樣戰(zhàn)法。采用這一方法的原因其實(shí)有一點(diǎn)無(wú)奈,因?yàn)樵诘诙纸Y(jié)束之后李世石表示“沒(méi)有找到AlphaGo的弱點(diǎn)”。于是他只能從“均勢(shì)下AlphaGo后半盤極強(qiáng)”這件事來(lái)逆推,得出需在前半盤爭(zhēng)勝的結(jié)論。但是,在爭(zhēng)勝策略失敗之后,李世石在后半盤的努力卻為第四局的勝利埋下了伏筆。
2 第四局李世石的策略
籠統(tǒng)地說(shuō),李世石在前三局考驗(yàn)了AlphaGo面對(duì)亂戰(zhàn)、細(xì)棋、治孤時(shí)的能力,AlphaGo的應(yīng)對(duì)非常有說(shuō)服力。
但是,李世石在第三局賽后的感言中已經(jīng)不像第二局那般毫無(wú)頭緒。他找到了或許是最后一種針對(duì)AlphaGo的攻擊方式:讓AlphaGo攻殺。
也就是說(shuō),李世石選擇導(dǎo)入自己治孤的局面。
這策略是僅有的可選策略之一,第三局AlphaGo在下方的攻殺退讓也增強(qiáng)了施展這一策略的決心。
從計(jì)算的意義上,攻殺比治孤更難。
這是因?yàn)椋喂轮灰笞约鹤龌?,只要找到自己能活的圖就可以;
而攻殺要求殺死對(duì)方的棋,必須防范對(duì)方所有可能的反撲,對(duì)于AlphaGo而言,需要搜索的空間就大幅增加。
李世石找到這一策略,是相當(dāng)聰明的選擇。
也正是李世石出乎AlphaGo預(yù)料(在搜索樹(shù)排名靠后)的一手棋(78),使AlphaGo在優(yōu)勢(shì)下突然崩潰,一舉逆轉(zhuǎn)取得了勝利。
AlphaGo第23手在此時(shí)靠,對(duì)于職業(yè)棋手而言是不可思議的一手。我會(huì)在后一章描寫(xiě)我看到的圍棋新世界里詳細(xì)闡述這一手為何出乎預(yù)料,又有什么精妙的含義。
總之,李世石在左邊選擇了實(shí)地,任憑黑方筑起外勢(shì)。雖然左邊的下法在職業(yè)棋手看來(lái)是白棋過(guò)于忍讓,但考慮到李世石的策略,加上對(duì)23手的認(rèn)知,就會(huì)明白李世石為什么這么下。
白40,進(jìn)入“先撈后洗”的局面,逼迫AlphaGo攻殺。
黑47-51——又是非常值得學(xué)習(xí)的新穎下法,具體的解析我想放在下一篇文章。
“神之一手”,白78挖!
很多棋手已經(jīng)解釋過(guò),這手棋原本并不足以逆轉(zhuǎn),黑棋有數(shù)種應(yīng)對(duì)可保優(yōu)勢(shì)。
比如1位頂吃,白棋并無(wú)生路。
另一種下法是在1位拐吃,如此則白棋可以通過(guò)打劫聯(lián)絡(luò),但黑21跳出后形成轉(zhuǎn)換,仍然是黑方勝勢(shì)。
雖然第78手本身不足以逆轉(zhuǎn)局勢(shì),但無(wú)法抹殺這一手的閃耀光芒!
這是人類思維靈感涌動(dòng)的時(shí)刻!
這一手很可能滿足了如下幾個(gè)條件:
1, 跳出了AlphaGo之前的搜索范圍
2,使變化更多,增加了局面的分支
3,涉及到可能的劫爭(zhēng)
同時(shí)滿足這三個(gè)條件,非常不容易。
,
至于AlphaGo為何會(huì)出現(xiàn)實(shí)戰(zhàn)那樣的失誤,大家可以參考Facebook田淵棟博士的分析,以及期待Deepmind五局賽后的官方回應(yīng)。
在上一篇文章里,我這樣評(píng)價(jià)李世石前兩盤的表現(xiàn):
“李世石面對(duì)AlphaGo,并未因五個(gè)月之前的棋譜而有絲毫輕視,他做了非常充分的準(zhǔn)備。他拋開(kāi)人類的偏見(jiàn)和自負(fù),試圖理解AlphaGo運(yùn)算的機(jī)理,并找出其中可能存在的弱點(diǎn)。在比賽伊始,他就對(duì)AlphaGo可能存在的弱點(diǎn)進(jìn)行了直指要害的攻擊,并且在失敗后迅速調(diào)整,繼而展開(kāi)了第二次、第三次針對(duì)性攻擊。正是他的策略針對(duì)性,使人們更好地理解了AlphaGo的強(qiáng)度和特點(diǎn),以及不同于人類的決策模式。他在第二局中就已經(jīng)找到了足以在中盤接近甚至抗衡AlphaGo的布局策略,使人類第一次見(jiàn)識(shí)到AlphaGo夢(mèng)幻般的后半盤?!?/p>
在第四局之后,相信會(huì)有更多人理解我當(dāng)時(shí)對(duì)李世石的這一評(píng)價(jià)。
而對(duì)于李世石在第三、四局里的表現(xiàn),我想這樣評(píng)價(jià):
“李世石在找不到AlphaGo弱點(diǎn)的情況下,仍然繼續(xù)尋找策略展開(kāi)進(jìn)攻。經(jīng)過(guò)前三局不同方式的失敗,李世石在第四局又找到了新的策略,并非常好地執(zhí)行了策略。這一次,他成功了。AlphaGo在面對(duì)“神鬼莫測(cè)”的第78手時(shí),終于展現(xiàn)出足以被人類擊敗的弱點(diǎn)。雖然這一突破所需的條件目前尚不能完全肯定,但無(wú)疑李世石已經(jīng)成功。這場(chǎng)勝利,是對(duì)他前三場(chǎng)努力的最佳回報(bào)?!?/p>
3 作為職業(yè)棋士如何看待人機(jī)之戰(zhàn)
對(duì)于我而言,這一場(chǎng)人機(jī)之戰(zhàn)給我最大的震撼來(lái)自于棋譜。AlphaGo下出了許多完全在人類棋手經(jīng)驗(yàn)之外的著法,這些著法在目前尚不能得到人類棋手統(tǒng)一的理解。
但是,我隱隱讀到了這些著法背后壯美的天地,這壯美天地當(dāng)然不是AlphaGo所創(chuàng)造,而是有四千多年歷史的圍棋本身所自有的豐富與遼闊。
AlphaGo并不是解開(kāi)了圍棋之謎,它離窮盡圍棋還有非常遠(yuǎn)的距離,它只是向我們展開(kāi)了這樣一個(gè)新世界。
我們需要用多久才能理解?或許一年、五年、十年……但我相信,人類一定能夠用理性的方式去不斷地理解這些數(shù)據(jù)給出的信息,AlphaGo的出現(xiàn)恰恰證明了人類理性的重要價(jià)值。
由于圍棋是一個(gè)封閉空間,其變化數(shù)雖然巨大,但仍然是有限的、在理論上可窮盡的。如上一篇里談到的,如果把窮盡看做天,把入門看做地,人類在圍棋的天地之間到底處于什么位置,這是值得每一個(gè)對(duì)圍棋有感情的人去認(rèn)真思考的問(wèn)題。而AlphaGo的出現(xiàn)既使我們有了一個(gè)參照者,使我們居于這天地之間不再孤獨(dú);又使我們能夠更好地接近圍棋真理哪怕一點(diǎn)點(diǎn)。
這是我在第二局后喜極而泣、心生無(wú)限歡喜的根本原因。
感謝李世石,感謝AlphaGo。
在第一篇文章的結(jié)語(yǔ),我說(shuō)
“如果我們只用人類思考圍棋的方式來(lái)理解AlphaGo,或許我們將永遠(yuǎn)都不知道是怎么輸?shù)??!?/p>
現(xiàn)在更多的職業(yè)棋手已經(jīng)知道AlphaGo在棋盤上做出決策的方式特點(diǎn)。接下來(lái),要做的事情是:
“將AlphaGo展現(xiàn)出的新世界以人類理性的方式來(lái)理解,這是作為棋士對(duì)圍棋和人類理性最好的致意。”
讓我們共同期待傳世的第五局!
聯(lián)系客服