當 AI 稱霸國際象棋時我保持沉默,因為我不是象棋手;當 AI 稱霸圍棋時我保持沉默,因為我不是圍棋手;當 AI 進入《星際爭霸》時我保持沉默,因為我不是星際玩家;當 AI 戰(zhàn)勝 DotA2 世界冠軍 Dendi 時,作為一個 DotA 玩家,我終于跪下了。
DotA2 年度最重要的賽事 The International DOTA2 Championships(簡稱 Ti)每年都會有彩蛋使全球玩家眼前一亮,這兩年尤其貼近最新科技。比如去年的 Ti 6 上,DotA2 官方 V 社就在比賽現(xiàn)場采用了類AR的全息投影,至少從轉(zhuǎn)播畫面來看,可以說是非??褡Э犰诺跽ㄌ炝恕?/p>
而到了今年,全世界都在談?wù)摗⒀芯繒r下最流行的人工智能,Google 用 AlphaGo 這個科技概念普及到了幾乎所有領(lǐng)域。DotA2 今年的比賽彩蛋也與人工智能(AI)直接相關(guān)。
在美西時間 8 月 11 日的正式比賽結(jié)束后,表演項目開始了。
首先,在現(xiàn)場一片歡呼聲中,DotA2 的第一個戰(zhàn)隊和 Solo 雙料世界冠軍獲得者,傳奇中單 Dendi 身著拳擊手的服裝入場。當 Dendi 走到賽場中央,所有人都在好奇 Dendi 的對手將會是誰時,主持人突然出人意料地宣布,Dendi 的對手是一段程序,來自 OpenAI。
中央被高高舉起的U盤里就是 OpenAI 的程序,身著白色拳擊手袍的就是 Dendi。
OpenAI是一家不以盈利為目的的人工智能研究公司,由“鋼鐵俠”Elon Musk 聯(lián)合 Y Combinator 的 CEO Sam Altman、LinkedIn 創(chuàng)始人 Reid Hoffman、暢銷書《從零到一》的作者 Peter Thiel 等硅谷科技界的大佬們發(fā)起,背景即使在人工智能界也是“又紅又?!薄?/p>
盡管 Dendi 獲得世界冠軍已經(jīng)是 6 年前的事,并且今年也沒有進入正賽圈,但作為烏克蘭老司機,Dendi 的個人實力仍然毋庸置疑,任何職業(yè)中單選手在面對 Dendi 時必須要全力以赴。
但是,另一邊的 OpenAI 也絲毫不弱。在賽場播放的宣傳片中可以看到,OpenAI 在此之前已經(jīng)戰(zhàn)勝了現(xiàn)役的 Arteezy、SumaiL 等多個世界冠軍級的 Solo 選手,它與我們在 DotA2 里常見的電腦 Bot 機器人按程序按部就班地供玩家凌虐完全不同。包括 OpenAI CTO Greg Brockman 在內(nèi)的核心團隊成員也來到了現(xiàn)場。
被 OpenAI 擊敗時不敢相信的 SumaiL(右)。
比賽的規(guī)則設(shè)定是,不能出瓶子、不能出凝魂之淚、不能出靈魂之戒、不能使用神壇,并且沒有中立生物、沒有神符,雙方選手都使用同一個英雄影魔(Shadow Fiend)。這些規(guī)則減少了游戲中的隨機性,選手實力的因素將更加重要。
比賽開始,Dendi(天輝方,綠色)與 OpenAI(夜魘方,紅色) 的出門裝備完全一樣,這倒沒什么。開始出兵了,DotA2 的 Solo 比賽第一項要考驗的就是雙方對己方小兵的卡位能力,卡兵卡得位置好,對線期的補刀就會比較順手。但是,在這一項技能中,OpenAI 就小勝一籌。
因為卡兵更加出色,OpenAI 能夠在己方高地補刀。
隨后,雙方開始你來我往的補刀。但基本上很明顯地,Dendi 一直被 OpenAI 按在地上摩擦,OpenAI 的補刀數(shù)一直領(lǐng)先于 Dendi。每次對點,OpenAI 也總能消耗掉 Dendi 更多生命值。并且,OpenAI 總能占據(jù)最有利的位置,讓 Dendi 很難受。
Dendi 被消耗掉了更多生命值,吃下了第一個大藥,但剛回復(fù)了四分之一左右,恢復(fù)效果就被 OpenAI 技能打斷了。
OpenAI 對距離和時機的把控非常精準,總能以極限距離消耗或攻擊到 Dendi,這也正是電腦程序的優(yōu)勢所在。但實際上根據(jù) Brockman 的說法,OpenAI 在 DotA2 里的每分鐘操作數(shù)僅相當于人類玩家的平均水平。
但同時令人沒想到的是,OpenAI 會像人類高手一樣,使用一些唬騙的假動作(釋放技能,在技能前搖的短時間內(nèi)按 S 鍵停止釋放),干擾對手的判斷力。這種欺騙性的“花招”技能一直被認為是人類面對人工智能時最大的優(yōu)勢,不過顯然,OpenAI 至少在 DotA2 里也已經(jīng)學(xué)會了。
“在 Dota 中取勝需要玩家基于對對手的直覺而采取相應(yīng)操作。在上面的視頻中你可以看到我們的 bot 已經(jīng)學(xué)會了——完全通過自我對弈——預(yù)測其他玩家的下一步操作,在陌生的環(huán)境中隨機應(yīng)變,以及通過對其他玩家的友軍施加影響而幫助前者成功?!盉rockman 在 OpenAI 官方博客里寫道。
隨著細微的優(yōu)勢積累越來越大,OpenAI 最終戰(zhàn)勝了 Dendi。
OpenAI 拿下了第一滴血,隨后的比賽也失去了懸念。此時,OpenAI 的補刀數(shù)是 27/10,Dendi 則只有11/2。
此前,AlphaGo 戰(zhàn)勝李世乭、柯杰稱霸圍棋項目時,還有相當多的電競玩家認為,DotA2 或 LOL 這類游戲,即時性、隨機性、策略性的特點,仍然是 AI 程序無法輕易模擬的。而圍棋那種回合制的模式,拼計算可能性的時間快慢,人類當然會比不上 AI。幾個月之前,開發(fā) AlphaGo 的人工智能公司 DeepMind 選擇了《星際爭霸 2》作為圍棋之后的下一個測試對象。
但事實證明,至少在 DotA2 的 1 對 1 的比賽上,OpenAI 可以說已經(jīng)不輸人類選手。
Brockman 說,OpenAI 下一步是明年將在 DotA2 的 5 對 5 團隊模式中作戰(zhàn)。屆時,OpenAI 將會發(fā)布該 bot,從而人人可以與其對決,并且 V 社將為擊敗該 bot 的第一個人類玩家提供游戲幣獎勵。
賽后,Elon Musk 在推特上發(fā)布了這條消息,“OpenAI 第一次打敗了世界上最好的電競選手。電競比象棋、圍棋這樣的傳統(tǒng)棋盤游戲要復(fù)雜得多。”
中國電競選手們不知道認不認可這個說法。然而,如果 OpenAI 明年真的做出了可以參加 5 VS 5 比賽的 AI,并且規(guī)則與人類比賽規(guī)則相同,AI 可以與人類作對手,也可以與人類作隊友…那我真的不知道這個游戲該怎么玩了。
聯(lián)系客服