一本大道香蕉中文日本不卡高清二区,一区二区三区免费电影,天天噜噜揉揉狠狠夜夜

韓國(guó)棋手李世石

寫(xiě)在第五局之前

首先對(duì)我之前兩篇文章簡(jiǎn)單回顧，之后梳理李世石在第三局、第四局中的策略行為，最后，以自己職業(yè)棋士的立場(chǎng)看待此次人機(jī)對(duì)決

0 對(duì)前兩篇文章的回顧

第一篇《李世石的策略與AlphaGo的弱點(diǎn)》的開(kāi)頭，分析李世石第一次面對(duì)AlphaGo時(shí)所采用的試探和策略。然后指出傳統(tǒng)意義上AlphaGo下出的失誤和好棋。之后談到AlphaGo失誤在算法上的原因，以及人和AI對(duì)失誤的不同定義。第5節(jié)，通過(guò)對(duì)棋譜和算法的分析明確提出AlphaGo的兩個(gè)弱點(diǎn)：邏輯缺失、逃避劫爭(zhēng)。第6節(jié)，針對(duì)這兩個(gè)弱點(diǎn)對(duì)李世石第二局的策略進(jìn)行了預(yù)測(cè)和建議：套路開(kāi)局、制造劫爭(zhēng)。

在第二篇《這兩盤棋，沒(méi)人比李世石做得更好》，首先分析了“協(xié)議禁劫”為什么不可能。

之后討論了AlphaGo的算法決定其落子的決策基于“勝率”而不是“最優(yōu)”，并分析了李世石在第一局的策略和表現(xiàn)。在此基礎(chǔ)上，分析了李世石第二局的策略和行為，指出AlphaGo的強(qiáng)大（和不完美），以及誤判它實(shí)力的原因。之后，指出李世石面對(duì)AlphaGo所做出的種種努力，以及圍棋Ai作為參照者對(duì)于人類探索圍棋的重要意義。第5節(jié)，分析了后三盤可能的情況。最后，由算法得出向AlphaGo學(xué)棋的陷阱和巨大價(jià)值。

1 第三局李世石的策略

讓我們進(jìn)入正題。我將AlphaGo為我們敞開(kāi)的新世界留在下一篇來(lái)描繪，在這一篇，我們還是切入李世石的視角，看看在第三局和第四局中他究竟做了什么，又是如何得到了第一次勝利。

在前兩局，李世石通過(guò)不同的策略得到了很多可以轉(zhuǎn)化為人類語(yǔ)言的信息，概述如下：

第一局

1，過(guò)“無(wú)譜布局”得知AlphaGo不依賴背譜

2，通過(guò)“避開(kāi)定式”得知AlphaGo選點(diǎn)基于全局

3，通過(guò)“開(kāi)放式復(fù)雜局面”得知AlphaGo不怕亂戰(zhàn)

4，通過(guò)“細(xì)棋局面”得知AlphaGo存在邏輯缺失導(dǎo)致局部虧損的弱點(diǎn)（因算法導(dǎo)致的優(yōu)勢(shì)退讓）

第二局：

1，通過(guò)“常規(guī)布局”得知AlphaGo會(huì)有“創(chuàng)新”下法

2，通過(guò)“均衡局面”得知AlphaGo此局面下后半盤極強(qiáng)

3，通過(guò)對(duì)手下法得知AlphaGo存在逃避劫爭(zhēng)的傾向（在第一局也能看到，但第二局更為明顯）。

如果你獲得了這些信息，你會(huì)如何面對(duì)第三局？

在上一篇文章的第五節(jié)，我預(yù)測(cè)李世石會(huì)試一試劫爭(zhēng)，雖然可能并沒(méi)有用。另外我認(rèn)為空中開(kāi)局會(huì)比較有趣，或許能見(jiàn)識(shí)到很多新東西。

從爭(zhēng)勝的角度，還是用“常規(guī)布局”優(yōu)于“無(wú)譜布局”。這是因?yàn)椋瑢?duì)于人而言，“常規(guī)布局”是歷史上棋手整體的經(jīng)驗(yàn)結(jié)果，而AlphaGo不背譜，常規(guī)與否對(duì)于它并無(wú)差異。

確定了布局方法之后，還要制定布局策略，才好最終選擇布局。在第二局中，李世石得知均衡局面下AlphaGo后半盤極強(qiáng)，“失誤”減少。如果選擇均衡將很難取勝，因此寄希望于前半盤取得較大優(yōu)勢(shì)。

1，常規(guī)布局；2，爭(zhēng)取大優(yōu)…。。滿足這兩個(gè)條件最好的開(kāi)局是——大模樣！

李世石選擇了左下先掛的高中國(guó)流，這是現(xiàn)代最典型的大模樣開(kāi)局

大模樣開(kāi)局的特點(diǎn)是：一，容易形成攻殺局面；二，優(yōu)劣出入比較大。

果然，AlphaGo第12手掛入，給了黑棋開(kāi)局攻殺的機(jī)會(huì)。

李世石13、15兩手。都是在有兩種選擇的情況下選擇了最為兇狠的下法。

第二局結(jié)束之后，很多人質(zhì)問(wèn)李世石為什么失去了血性，為什么那么穩(wěn)健地輸了。在我看來(lái)，這是李世石的策略而已，他在第一局找到的電腦可能的弱點(diǎn)，在第二局中以這樣的方式來(lái)針對(duì)。即使他并不擅長(zhǎng)從頭到尾均衡平和的局面（那是李昌鎬所擅長(zhǎng)的），他仍然堅(jiān)定地貫徹了這一策略。當(dāng)然，針對(duì)性策略在某種程度上確實(shí)會(huì)束縛住他，加上心理上不可避免的壓力，在技術(shù)上難以發(fā)揮到極致，這是不應(yīng)苛責(zé)的。

也有一種觀點(diǎn)是，干嘛要去找電腦的弱點(diǎn)，做好自己就行了。去找對(duì)手的弱點(diǎn)本身就做得不夠好。

的確，大部分棋手都不會(huì)考慮對(duì)面坐著的是AlphaGo，只要下好自己的棋。但是，每個(gè)棋手在每局棋中都會(huì)有面臨兩難選擇的時(shí)候，此時(shí)如何選擇，在我看來(lái)都是做自己。

《孫子兵法》云“知己知彼，百戰(zhàn)不殆?！绷私鈱?duì)手，既是為了更好地爭(zhēng)勝，也是對(duì)對(duì)手極大的尊重。

如前面所說(shuō)，如果沒(méi)有李世石前三局根據(jù)AI的回應(yīng)而不斷變換的進(jìn)攻手法，我們就不可能如今天這般全面地了解AlphaGo在圍棋盤上的特點(diǎn)，也難以取得第四局這樣艱難而酣暢的勝利。反過(guò)來(lái)想，即使真的在第一局就出現(xiàn)了第四局這樣的情況，我們對(duì)AlphaGo的誤判將會(huì)達(dá)到什么程度？

回到第三局，李世石布下了大模樣開(kāi)局，在對(duì)方深入之時(shí)選擇了最為強(qiáng)烈的攻殺手段，希望在棋局前期取得大優(yōu)。

但是，我們看到了AlphaGo近乎完美的處理。

白16，這手棋基本上否定了黑15的下法。過(guò)程中黑21應(yīng)有疑問(wèn)，但這是作為對(duì)局者在實(shí)戰(zhàn)之前很難確認(rèn)的事情。

白32，基本上宣告了李世石此局策略的失敗。

對(duì)于AlphaGo而言，它本身并沒(méi)有“治孤”這樣的概念，但在第三局，它面對(duì)李世石選擇的這種局面時(shí)，表現(xiàn)出強(qiáng)大的能力。

基本上所有的棋手在第三局之后都認(rèn)可了AlphaGo的實(shí)力在人類棋手之上，這是因?yàn)?，AlphaGo以所有棋手都看得懂的方式輕易地化解了李世石開(kāi)局的凌厲攻勢(shì)，取得了完勝。

這局棋，白棋的反擊得手之后，已經(jīng)是李世石崩潰的局面。但李世石的強(qiáng)大之處在于，在這樣的局面下他仍然做出了新的試探。

黑77手，考驗(yàn)AlphaGo處理局部與全局關(guān)聯(lián)的能力。

黑115手以下，考驗(yàn)AlphaGo殺棋的能力。李世石在對(duì)陣人類選手時(shí)雖然也會(huì)有劣勢(shì)下考驗(yàn)對(duì)方的手段，但這一手顯然是只針對(duì)機(jī)器。

最終，李世石在下方做出了一個(gè)劫爭(zhēng)，這一結(jié)果雖然與AlphaGo在優(yōu)勢(shì)下的退讓有關(guān)，但也確實(shí)是李世石才能做到的事情。

某種意義上，當(dāng)我們見(jiàn)識(shí)了AlphaGo第三局這般漂亮的前半盤，就很難在同一盤棋中再見(jiàn)到AlphaGo第二局那般強(qiáng)大的后半盤。作為棋手，對(duì)這一點(diǎn)感到些許遺憾，這是它基于勝率的算法所決定的。

至于后面的劫爭(zhēng)，對(duì)于很多人而言是證偽了“AlphaGo不會(huì)打劫”和“協(xié)議禁劫”這兩件事情，但在我看來(lái)不過(guò)是對(duì)邏輯推理得出的確定結(jié)論的一次事實(shí)呈現(xiàn)。

由于前二局的信息，這一局李世石制定了在前半盤爭(zhēng)勝的策略，采取了大模樣戰(zhàn)法。采用這一方法的原因其實(shí)有一點(diǎn)無(wú)奈，因?yàn)樵诘诙纸Y(jié)束之后李世石表示“沒(méi)有找到AlphaGo的弱點(diǎn)”。于是他只能從“均勢(shì)下AlphaGo后半盤極強(qiáng)”這件事來(lái)逆推，得出需在前半盤爭(zhēng)勝的結(jié)論。但是，在爭(zhēng)勝策略失敗之后，李世石在后半盤的努力卻為第四局的勝利埋下了伏筆。

2 第四局李世石的策略

籠統(tǒng)地說(shuō)，李世石在前三局考驗(yàn)了AlphaGo面對(duì)亂戰(zhàn)、細(xì)棋、治孤時(shí)的能力，AlphaGo的應(yīng)對(duì)非常有說(shuō)服力。

但是，李世石在第三局賽后的感言中已經(jīng)不像第二局那般毫無(wú)頭緒。他找到了或許是最后一種針對(duì)AlphaGo的攻擊方式：讓AlphaGo攻殺。

也就是說(shuō)，李世石選擇導(dǎo)入自己治孤的局面。

這策略是僅有的可選策略之一，第三局AlphaGo在下方的攻殺退讓也增強(qiáng)了施展這一策略的決心。

從計(jì)算的意義上，攻殺比治孤更難。

這是因?yàn)椋喂轮灰笞约鹤龌?，只要找到自己能活的圖就可以；

而攻殺要求殺死對(duì)方的棋，必須防范對(duì)方所有可能的反撲，對(duì)于AlphaGo而言，需要搜索的空間就大幅增加。

李世石找到這一策略，是相當(dāng)聰明的選擇。

也正是李世石出乎AlphaGo預(yù)料（在搜索樹(shù)排名靠后）的一手棋（78），使AlphaGo在優(yōu)勢(shì)下突然崩潰，一舉逆轉(zhuǎn)取得了勝利。

AlphaGo第23手在此時(shí)靠，對(duì)于職業(yè)棋手而言是不可思議的一手。我會(huì)在后一章描寫(xiě)我看到的圍棋新世界里詳細(xì)闡述這一手為何出乎預(yù)料，又有什么精妙的含義。

總之，李世石在左邊選擇了實(shí)地，任憑黑方筑起外勢(shì)。雖然左邊的下法在職業(yè)棋手看來(lái)是白棋過(guò)于忍讓，但考慮到李世石的策略，加上對(duì)23手的認(rèn)知，就會(huì)明白李世石為什么這么下。

白40，進(jìn)入“先撈后洗”的局面，逼迫AlphaGo攻殺。

黑47-51——又是非常值得學(xué)習(xí)的新穎下法，具體的解析我想放在下一篇文章。

“神之一手”，白78挖！

很多棋手已經(jīng)解釋過(guò)，這手棋原本并不足以逆轉(zhuǎn)，黑棋有數(shù)種應(yīng)對(duì)可保優(yōu)勢(shì)。

比如1位頂吃，白棋并無(wú)生路。

另一種下法是在1位拐吃，如此則白棋可以通過(guò)打劫聯(lián)絡(luò)，但黑21跳出后形成轉(zhuǎn)換，仍然是黑方勝勢(shì)。

雖然第78手本身不足以逆轉(zhuǎn)局勢(shì)，但無(wú)法抹殺這一手的閃耀光芒！

這是人類思維靈感涌動(dòng)的時(shí)刻！

這一手很可能滿足了如下幾個(gè)條件：

1，跳出了AlphaGo之前的搜索范圍

2，使變化更多，增加了局面的分支

3，涉及到可能的劫爭(zhēng)

同時(shí)滿足這三個(gè)條件，非常不容易。

，

至于AlphaGo為何會(huì)出現(xiàn)實(shí)戰(zhàn)那樣的失誤，大家可以參考Facebook田淵棟博士的分析，以及期待Deepmind五局賽后的官方回應(yīng)。

在上一篇文章里，我這樣評(píng)價(jià)李世石前兩盤的表現(xiàn)：

“李世石面對(duì)AlphaGo，并未因五個(gè)月之前的棋譜而有絲毫輕視，他做了非常充分的準(zhǔn)備。他拋開(kāi)人類的偏見(jiàn)和自負(fù)，試圖理解AlphaGo運(yùn)算的機(jī)理，并找出其中可能存在的弱點(diǎn)。在比賽伊始，他就對(duì)AlphaGo可能存在的弱點(diǎn)進(jìn)行了直指要害的攻擊，并且在失敗后迅速調(diào)整，繼而展開(kāi)了第二次、第三次針對(duì)性攻擊。正是他的策略針對(duì)性，使人們更好地理解了AlphaGo的強(qiáng)度和特點(diǎn)，以及不同于人類的決策模式。他在第二局中就已經(jīng)找到了足以在中盤接近甚至抗衡AlphaGo的布局策略，使人類第一次見(jiàn)識(shí)到AlphaGo夢(mèng)幻般的后半盤?！?/p>

在第四局之后，相信會(huì)有更多人理解我當(dāng)時(shí)對(duì)李世石的這一評(píng)價(jià)。

而對(duì)于李世石在第三、四局里的表現(xiàn)，我想這樣評(píng)價(jià)：

“李世石在找不到AlphaGo弱點(diǎn)的情況下，仍然繼續(xù)尋找策略展開(kāi)進(jìn)攻。經(jīng)過(guò)前三局不同方式的失敗，李世石在第四局又找到了新的策略，并非常好地執(zhí)行了策略。這一次，他成功了。AlphaGo在面對(duì)“神鬼莫測(cè)”的第78手時(shí)，終于展現(xiàn)出足以被人類擊敗的弱點(diǎn)。雖然這一突破所需的條件目前尚不能完全肯定，但無(wú)疑李世石已經(jīng)成功。這場(chǎng)勝利，是對(duì)他前三場(chǎng)努力的最佳回報(bào)?！?/p>

3 作為職業(yè)棋士如何看待人機(jī)之戰(zhàn)

對(duì)于我而言，這一場(chǎng)人機(jī)之戰(zhàn)給我最大的震撼來(lái)自于棋譜。AlphaGo下出了許多完全在人類棋手經(jīng)驗(yàn)之外的著法，這些著法在目前尚不能得到人類棋手統(tǒng)一的理解。

但是，我隱隱讀到了這些著法背后壯美的天地，這壯美天地當(dāng)然不是AlphaGo所創(chuàng)造，而是有四千多年歷史的圍棋本身所自有的豐富與遼闊。

AlphaGo并不是解開(kāi)了圍棋之謎，它離窮盡圍棋還有非常遠(yuǎn)的距離，它只是向我們展開(kāi)了這樣一個(gè)新世界。

我們需要用多久才能理解？或許一年、五年、十年……但我相信，人類一定能夠用理性的方式去不斷地理解這些數(shù)據(jù)給出的信息，AlphaGo的出現(xiàn)恰恰證明了人類理性的重要價(jià)值。

由于圍棋是一個(gè)封閉空間，其變化數(shù)雖然巨大，但仍然是有限的、在理論上可窮盡的。如上一篇里談到的，如果把窮盡看做天，把入門看做地，人類在圍棋的天地之間到底處于什么位置，這是值得每一個(gè)對(duì)圍棋有感情的人去認(rèn)真思考的問(wèn)題。而AlphaGo的出現(xiàn)既使我們有了一個(gè)參照者，使我們居于這天地之間不再孤獨(dú)；又使我們能夠更好地接近圍棋真理哪怕一點(diǎn)點(diǎn)。

這是我在第二局后喜極而泣、心生無(wú)限歡喜的根本原因。

感謝李世石，感謝AlphaGo。

在第一篇文章的結(jié)語(yǔ)，我說(shuō)

“如果我們只用人類思考圍棋的方式來(lái)理解AlphaGo，或許我們將永遠(yuǎn)都不知道是怎么輸?shù)??！?/p>

現(xiàn)在更多的職業(yè)棋手已經(jīng)知道AlphaGo在棋盤上做出決策的方式特點(diǎn)。接下來(lái)，要做的事情是：

“將AlphaGo展現(xiàn)出的新世界以人類理性的方式來(lái)理解，這是作為棋士對(duì)圍棋和人類理性最好的致意。”

讓我們共同期待傳世的第五局！

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区