編者按:本文作者為亮風(fēng)臺(tái)首席科學(xué)家凌海濱。
近日來,國際頂級(jí)科學(xué)期刊《自然》(Nature)[1]上關(guān)于電腦戰(zhàn)勝職業(yè)圍棋選手的報(bào)道引起了人們對(duì)人工智能的廣泛關(guān)注,這是歷史上電腦首次在公平競賽的條件下戰(zhàn)勝職業(yè)圍棋選手。即將到來的AlphaGo和李世石九段的大賽更多是讓人聯(lián)想起當(dāng)年深藍(lán)和卡斯特羅夫的對(duì)奕。
那么,既然已經(jīng)有了電腦戰(zhàn)勝國際象棋冠軍的先例,為什么在圍棋這個(gè)領(lǐng)域還會(huì)引起這么大的關(guān)注呢?其根本原因在于,從計(jì)算的角度來看,圍棋比國際象棋難的遠(yuǎn)遠(yuǎn)不止是一兩個(gè)數(shù)量級(jí)。象棋的棋盤上的位置只有圍棋的大約六分之一,這就決定了圍棋的計(jì)算復(fù)雜度(簡單說來就是可能出現(xiàn)的不同棋局的總數(shù))遠(yuǎn)超國際象棋,從目前人類實(shí)用中接觸的數(shù)字來看,幾乎是一個(gè)無窮大數(shù)。不太理解的朋友可以參考“一張紙如果能對(duì)折64次可以從地球伸到月球”的傳說。
換個(gè)角度來說,以目前計(jì)算機(jī)的能力而言,想窮舉搜索或者嘗試所有可能的棋局變化是完全不可能的?;谶@個(gè)原因,雖然計(jì)算機(jī)已經(jīng)在國際象棋領(lǐng)域戰(zhàn)勝了人類,計(jì)算機(jī)在圍棋上戰(zhàn)勝人類一直被認(rèn)為是一個(gè)尚需時(shí)日的事情。包括學(xué)術(shù)界和圍棋界在內(nèi)的大部分專業(yè)人士都沒有想到這么快計(jì)算機(jī)就可以和專業(yè)棋手一決高下了。
從目前的趨勢(shì)看,無論這次AlphaGo能否戰(zhàn)勝李世石,計(jì)算機(jī)戰(zhàn)勝國際頂尖圍棋選手只是早晚的事情。而這次舉世矚目的比賽其成敗具有的更多的是象征性的意義。
AlphaGo能夠匹敵或戰(zhàn)勝職業(yè)選手這一事實(shí),對(duì)于人工智能乃至整個(gè)科技的發(fā)展,都是一個(gè)極為重要的標(biāo)志和鼓舞。由此帶來的技術(shù)突破和信心必將進(jìn)一步推動(dòng)人工智能尤其是機(jī)器學(xué)習(xí)在很多領(lǐng)域的應(yīng)用。事實(shí)上,除了DeepMind的AlphaGo以外,其他的一些研究組也在計(jì)算機(jī)圍棋方向取得了令人期待的進(jìn)展,比如來自卡內(nèi)基梅隆大學(xué)最近的工作[2]。
不出大家的意外,這次使AlphaGo大放光彩的核心技術(shù)是近年來蒸蒸日上的深度學(xué)習(xí)技術(shù)。自2006年Hinton再度引爆深度神經(jīng)網(wǎng)絡(luò)的熱潮之后,深度學(xué)習(xí)在十年間幾乎橫掃所有人工智能相關(guān)的領(lǐng)域,在語音和視覺等領(lǐng)域的眾多問題中頻頻取得突破性的進(jìn)展。很多學(xué)者和工業(yè)界研發(fā)人員也從最初的謹(jǐn)慎懷疑態(tài)度轉(zhuǎn)向積極跟進(jìn),進(jìn)而推動(dòng)了深度學(xué)習(xí)在理論和實(shí)踐兩方面的迅猛發(fā)展。就亮風(fēng)臺(tái)在增強(qiáng)現(xiàn)實(shí)領(lǐng)域的經(jīng)驗(yàn)而言,盡管深度學(xué)習(xí)在實(shí)用時(shí)還需要克服一些諸如實(shí)時(shí)性的挑戰(zhàn),但我們亮風(fēng)臺(tái)已經(jīng)在一些實(shí)際應(yīng)用中(比如大規(guī)模圖片識(shí)別和人臉分析)成功的使用了深度學(xué)習(xí)技術(shù),并且期待在不久的將來會(huì)取得更好的結(jié)果和推廣。
下面就我個(gè)人的理解來對(duì)這次比賽下注。首先聲明,雖然我們?cè)诳蒲泻蛻?yīng)用上都在使用深度學(xué)習(xí)的技術(shù)(如今想不用都難啊),我本人對(duì)于深度學(xué)習(xí)研究有限,所以下面觀點(diǎn)僅僅是很主觀的個(gè)人觀點(diǎn)??偟膩碚f,這次人機(jī)大賽,我覺得AlphaGo的勝率不高,感覺在30%以下。下面就幾個(gè)方面解釋一下我的理由。
一、AlphaGo之前戰(zhàn)勝的歐洲圍棋冠軍樊麾是職業(yè)二段,棋力和世界冠軍的九段李世石有很大的差距。
李世石本人認(rèn)為“AlphaGo和我約差2子”[4],也是符合圍棋段位之間的基本差距的[5]。這一觀點(diǎn)得到了棋界諸多當(dāng)前頂尖棋手的認(rèn)同,參見[6]。當(dāng)然,由于機(jī)器學(xué)習(xí)的強(qiáng)大學(xué)習(xí)能力,AlphaGo是有可能在這次比賽前的時(shí)間內(nèi)得到棋力上的飛速提高,理論上是有可能進(jìn)步到頂尖棋手的能力。但是,這種提高并不是能夠輕而易舉實(shí)現(xiàn)的,參加下面的解釋。
二、深度學(xué)習(xí)畢竟還是要學(xué)習(xí)的,而學(xué)習(xí)是要樣本和訓(xùn)練的。
盡管AlghaGo可以很容易的獲取大量歷史上的棋局資料,但是李世石這樣的頂尖棋手的棋局資料還是有限的。更重要的是,計(jì)算機(jī)棋手和頂尖專業(yè)棋手的對(duì)局資料非常稀少。之前零星的幾次疑似AlphaGo和高手在弈城圍棋網(wǎng)上的比賽和即將進(jìn)行的比賽差距還是太大,應(yīng)該不足以彌補(bǔ)這個(gè)訓(xùn)練樣本上的缺陷。
三、反過來從棋手的角度來看,頂尖的專業(yè)棋手對(duì)于機(jī)器棋手的行棋方式和漏洞可能更為敏感也有更強(qiáng)的應(yīng)對(duì)方式。
比如,很多高手都指出了在AlphaGo-樊麾棋局中的一個(gè)明顯失誤[6](這個(gè)嘛,只有業(yè)余11級(jí)水平的我其實(shí)沒有看懂),這樣的漏洞相信不會(huì)被李這樣的高手放過的。當(dāng)然,人也有狀態(tài)不穩(wěn)定和犯糊涂的時(shí)候,不過高手發(fā)生這種狀況的概率是很低的。
四、確實(shí)存在一種可能:AlphaGo可以通過頭一局或兩局迅速學(xué)習(xí)和調(diào)整。不過我個(gè)人感覺即使如此也不太容易達(dá)到擊敗李世石的水平,中間差距還是有些大,更多的樣本才會(huì)更可靠一些。一個(gè)參考是當(dāng)年深藍(lán)和卡斯特羅夫的第一次比賽[7]。
總結(jié)一下來說,基于深度學(xué)習(xí)的技術(shù)使得計(jì)算機(jī)戰(zhàn)勝專業(yè)棋手,雖然比大多數(shù)人預(yù)料的要早,并不是完全意外的。作為人工智能領(lǐng)域的從業(yè)者,我們應(yīng)該更多的感到鼓舞,并期望從相應(yīng)的技術(shù)泛化中汲取指引我們前進(jìn)的知識(shí)和經(jīng)驗(yàn),使我們能在具體的應(yīng)用領(lǐng)域上不斷前進(jìn)。(文|凌海濱)
如果您對(duì)您所在行業(yè)有很深認(rèn)知,也想在我們的平臺(tái)上說點(diǎn)什么,我們歡迎您來投稿!
{{item.content}}