在韓國李世石與谷哥阿爾法狗(alphago)對(duì)戰(zhàn)三連敗后,終于在第四局中扳回一城,那知他們究竟是個(gè)什么樣的棋局呢?東坡小編帶來了李世石alphago人機(jī)大戰(zhàn)第四局棋譜完整版下載,想看李世石是怎樣贏alphago的趕緊看看吧!
李世石alphago人機(jī)大戰(zhàn)第四局賽況
第四局比賽中,AlphaGo執(zhí)黑先手,李世石執(zhí)白。開局階段雙方就形成星小目對(duì)星小目的局面,但之后李世石會(huì)并未走出模仿棋,而是打出了自己的風(fēng)格。
和前幾局對(duì)決相比,李世石今天更多次陷入“長(zhǎng)考”,導(dǎo)致耗時(shí)太多,在比賽進(jìn)行到2個(gè)半小時(shí)后,李世石僅剩下17分鐘,比AlphGo剩余時(shí)間足足少了1個(gè)小時(shí)。
隨后,李世石白78挖,下出一招妙手,成為本場(chǎng)比賽的轉(zhuǎn)折點(diǎn)。AlphaGo黑93立,下出一步常理上的廢棋,令所有人大惑不解,F(xiàn)場(chǎng)英文解說員麥克雷蒙九段表示,AlphaGo后面跟的這步一下子把局面弄復(fù)雜了。
李世石alphago人機(jī)大戰(zhàn)第四局結(jié)局
雖然AlphaGo出現(xiàn)了一次“bug”,但李世石仍然不敢松懈,在打吃右側(cè)黑子時(shí)還是非常謹(jǐn)慎。在比賽進(jìn)行到3小時(shí)20分鐘時(shí)。李世石計(jì)時(shí)全部用完,進(jìn)入讀秒落子階段。
此后Alpha由于判斷局面對(duì)自己不利,每步耗時(shí)明顯增長(zhǎng),都超出了3分鐘。到3小時(shí)40分鐘時(shí),比賽大局已定,AlphaGo(白)投子認(rèn)輸只剩時(shí)間問題,李世石只需要冷靜收官即可獲得勝利。
收官階段,左下角AlphaGo黑159扳再次出現(xiàn)漏洞,黑子沒有繼續(xù)在此處落子,而是到左邊立,導(dǎo)致上一步棋成為“無用功”。
最終,李世石在收官階段發(fā)揮穩(wěn)定,沒有讓AlphaGo占到便宜。李世石獲得對(duì)AlphaGo的第一場(chǎng)勝利,雙方總比分變?yōu)?:1。
李世石第四局賽后說:
在賽后的記者招待會(huì)上,李世石談到了AlphaGo的兩個(gè)弱點(diǎn):一個(gè)是AlphaGo執(zhí)黑棋時(shí)似乎掙扎比較多,相較執(zhí)白棋時(shí)更難贏。另一個(gè)是,當(dāng)它遇到出其不意的招數(shù)時(shí),有可能會(huì)導(dǎo)致失誤,未必是失誤,就是bug。
谷歌阿爾法狗(alphago)為什么會(huì)贏
舉世矚目的“阿爾法狗”和李世石對(duì)戰(zhàn),并不是歷史上第一次人機(jī)對(duì)戰(zhàn)的棋類運(yùn)動(dòng)。1997年,IBM的“深藍(lán)”戰(zhàn)勝了俄羅斯國際象棋大師卡斯帕羅夫。當(dāng)時(shí),“深藍(lán)”2勝1負(fù)3平的戰(zhàn)績(jī)讓卡斯帕羅夫深受打擊。后來,IBM還拒絕了卡斯帕羅夫的再戰(zhàn)請(qǐng)求,拆卸了“深藍(lán)”,讓給他至今無法找“深藍(lán)”復(fù)仇。
卡斯帕羅夫的遺憾并不無理由——今天,“深藍(lán)”的確算不上“聰明”的電腦!吧钏{(lán)”主要依靠強(qiáng)大的計(jì)算能力窮舉所有路數(shù)來選擇最佳策略。依靠硬算,“深藍(lán)”可以預(yù)判12步棋,而卡斯帕羅夫可以預(yù)判10步,二者勢(shì)均力敵。
當(dāng)然,“深藍(lán)”必須具有相當(dāng)?shù)挠?jì)算速度。據(jù)認(rèn)為,“深藍(lán)”實(shí)際上是一臺(tái)超算機(jī),有480顆特別制造的象棋芯片,下棋程序以C語言寫成,運(yùn)行AIX操作系統(tǒng),其計(jì)算能力在世界超級(jí)電腦中排名第259位。
然而,圍棋在復(fù)雜程度和組成數(shù)量上遠(yuǎn)超國際象棋,是目前最復(fù)雜的博弈類封閉游戲。2015年1月28日,Nature雜志在封面論文中稱,圍棋是人工智能領(lǐng)域一個(gè)具有標(biāo)志性的“大挑戰(zhàn)”,源于圍棋“巨大的搜索空間、很難估計(jì)局面和下子”。圍棋棋盤上每一點(diǎn),都有黑、白、空三種情況,棋盤上共有361個(gè)點(diǎn)(19乘19),理論上可能產(chǎn)生的局?jǐn)?shù)為3的361次方種。這個(gè)數(shù)字大概是10的170次方,比已觀測(cè)到的宇宙中原子數(shù)量還多。國際象棋只有10的46次方。
除了棋盤大,圍棋在下棋過程中還會(huì)出現(xiàn)“吃子”的情況,更加劇了其復(fù)雜性。曾任職谷歌公司的李開復(fù)說,當(dāng)年“深藍(lán)”與卡斯帕羅夫的對(duì)局,實(shí)際上使用的是人工調(diào)整的評(píng)估函數(shù),并用特殊設(shè)計(jì)的硬件和“暴力”(brute-force)的搜索征服了國際象棋級(jí)別的復(fù)雜度。
圍棋則不行!耙?yàn)樗乃阉魈珡V,每步的選擇有幾百而非幾十。也太深,一盤棋有幾百步而非幾十步!崩铋_復(fù)在知乎上回答稱。
所以,只靠算,計(jì)算機(jī)恐怕無法學(xué)會(huì)下圍棋。在“阿爾法狗”問世前,最成功的圍棋計(jì)算機(jī)程序能達(dá)到業(yè)余人類選手的程度,但還不能和專業(yè)選手在不讓子的情況下平局。2014年初,圍棋程序“瘋狂的石頭(Crazy stone)”在一次比賽中戰(zhàn)勝九段棋手依田紀(jì)基。但是當(dāng)時(shí)是在人類棋手讓出4子的情況下贏得比賽。
開發(fā)這款程序的法國程序員Rémi Coulom在得知李世石將在不用讓子的情況下對(duì)戰(zhàn)谷歌公司的“阿爾法狗”時(shí),感到既興奮,又有些難以置信。他表示,這是人工智能巨大的進(jìn)步,而他原本以為這一天將在十年后到來。
在“瘋狂的石頭”的設(shè)計(jì)中,Coulom使用了被稱為“蒙特卡洛樹”的搜索技術(shù)。這種算法對(duì)大量隨機(jī)過程進(jìn)行統(tǒng)計(jì)評(píng)估,得出一個(gè)最優(yōu)的解法。也就是說,蒙特卡羅算法對(duì)計(jì)算進(jìn)行了篩選,數(shù)據(jù)庫中的低勝率選擇直接拋棄,放棄了窮舉法中那些大量消耗計(jì)算資源,但卻沒有意義的計(jì)算,使其對(duì)具有高勝率的選擇有更加精確的計(jì)算和分析。
加拿大艾伯塔大學(xué)計(jì)算機(jī)科學(xué)家喬納森·謝弗曾設(shè)計(jì)程序提高計(jì)算機(jī)的國際跳棋水平,試圖遇到了瓶頸。他發(fā)現(xiàn),就算使用了蒙特卡洛樹算法簡(jiǎn)化了運(yùn)算,計(jì)算機(jī)依然無法獲得人類高手擁有的“棋感”。
作為一名圍棋愛好者,Deep Mind公司的CEO哈薩比斯也表示,人類頂級(jí)大師中,走法很多時(shí)候依靠直覺。在他的理解中,“棋感”是指棋手能夠根據(jù)形勢(shì)分析攻防線路,還需要對(duì)棋形進(jìn)行審美,這也是圍棋幾千年來讓人著迷的原因。所以,從2014年開始,包括臉書(Facebook)、谷歌的Deep Mind等人工智能研究團(tuán)隊(duì)都將使程序模仿人類的直覺作為圍棋人工智能的突破方向。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版