5月23日下午,上午10點半開始的人機大戰2.0,在持續四個多小時后終于落幕,柯潔0:1敗于AlphaGO。
這一版本的AlphaGo進行了大量的“自我對弈棋局”,這一過程循環往復,積累了大量的數據。
柯潔苦笑著搖了搖頭,不時和坐其對面、代AlphaGO執子的黃士杰博士談兩句。隨后,他將眼前的黑棋子全部收攏,裝進棋盒后,起身離開了座位。
這原本是一場五至六個小時的圍棋對決,但由于AlphaGO異于人類的落子速度,時間得以大大縮短。
柯潔賽后坦承,輸給AlphaGO在意料之中,但其意料之外的是,新版本的AlphaGO和去年戰勝韓國頂級棋手李世石的版本,幾乎是兩個完全不同的“人”。
AI再下一城
柯潔的“悲情”在比賽前一天晚上已有顯露,22日晚上,柯潔通過個人微博發文稱,“AI進步之快遠超我們的想象”,其相信“未來是屬于人工智能”的。
今年年初,柯潔已同AlphaGO扮演的馬甲“Master”有過交手,柯潔均以落敗而告終。“第一盤不知對手是誰,心態還好,后面因為知道對手不是人,心態就壞了。當時也吃不下飯,后來就住院了。”柯潔在采訪中稱,人機對決給了他更大壓力。
多位業內人士認為,柯潔在當天的比賽中發揮出了正常水平。圍棋專業人士潘達告訴記者,當天“柯潔發揮還可以,布局有備而來,前半盤基本達成先撈實地的預定目標”。但是AlphaGo整盤棋表現得相當穩定。
最終,柯潔以約四分之一子的劣勢輸給了AlphaGo。盡管AlphaGo是以微弱優勢取勝,但柯潔在陷入逆境之后,即知道對于不會犯錯的AlphaGo而言,拿下勝利只是時間的問題。
賽后,柯潔在接受媒體采訪時也表示,此前其總結AlphaGo的弱點在于,“非常貪戀實地”,因此其制定的策略是“貫穿先撈后起”,但開局后在有些地方反而被阿爾法狗先撈實地,導致一下陷入了被動。柯潔稱,通過第一局比賽,未能找出AlphaGo的破綻。
潘達告訴記者,目前版本的AlphaGo穩定性明顯好于對戰李世石的版本,但“具體實力進步了多少,一盤棋不能說明問題”。
柯潔坦承,輸掉比賽在其意料之中。賽前,包括聶衛平在內的重量級棋手均預測,柯潔取勝AlphaGo的概率在10%左右,此外大家認為,若柯潔能夠贏下一場比賽,則可作為載入圍棋歷史的事件。
兩天之后,柯潔將再度迎戰AlphaGo。柯潔則早已在賽前宣布,同AlphaGO的三場對決,也將是其最后三場人機大戰。
人機對決無懸念?
盡管輸棋在意料之中,但柯潔仍驚異于一年以后AlphaGo發生的變化。
恰如DeepMind創始人兼CEO哈薩比斯在當天所說,AlphaGo不是一個預編程的圍棋程序,而是采用人類相似的方式進行學習。據悉,AlphaGo所采用的機器學習,結合了監督學習和強化學習。首先,AlphaGo搭建了一個策略網絡(policynetwork),對所有可落子區域進行概率分布,并且訓練出一個價值網絡(valuenetwork)對自我對弈進行預測。
早期AlphaGo仍通過學習六段以上的圍棋選手下法來進行學習,但如今版本的AlphaGo可怕之處在于,強大的自我迭代和更新能力。
上述基礎上,這一版本的AlphaGo進行了大量的“自我對弈棋局”,這一過程循環往復,積累了大量的數據。當天比賽的解說嘉賓華以剛,在白棋的一個落子后,也忍不出感嘆“AlphaGo對于落子效率的高度重視”。
如果說在AlphaGo、李世石的對決中,外界仍以支持人類和支持機器形成兩大派別,那么在AlphaGo和柯潔的對決中,這幾乎已經是一個失去了懸念的答案。“很榮幸和AlphaGo對決,接下來我仍將全力以赴。”柯潔在賽后說。
他在賽后再度表示,當天比賽讓他發現了圍棋下法的更多可能性。數千年以來,歷史留下了關于圍棋的無數玩法和總結,但AlphaGo的出現使得不少固有的觀念被打破。不少棋手在當天觀棋時感嘆,AlphaGo的下法突破了個人對于圍棋的理解。
此次圍棋峰會上,還將開展多位棋手對決AlphaGo的“群戰”,以及“棋手+AlphaGo”的混搭對決。施密特將這場峰會定義為“人機合作時代的開啟”。“去年我在韓國就說,不管勝負如何,人性終將獲勝。電腦有自己擅長的事情,人類有自己的專長。”谷歌母公司Alphabet執行董事長施密特在當天賽前的致辭上稱。
早在AlphaGo對決韓國棋手李世石時,即有不少業內人士向記者評述:谷歌通過AlphaGo完成了一起全球性的AI普及,并且樹立了谷歌之于AI在普羅大眾心目中的地位。而通過AlphaGo和柯潔的對決,谷歌再度深化了這一過程。
更多資訊請關注工業機器人頻道