編者按:本文作者為亮風臺首席科學家凌海濱。
近日來,國際頂級科學期刊《自然》(Nature)[1]上關(guān)于電腦戰(zhàn)勝職業(yè)圍棋選手的報道引起了人們對人工智能的廣泛關(guān)注,這是歷史上電腦首次在公平競賽的條件下戰(zhàn)勝職業(yè)圍棋選手。即將到來的AlphaGo和李世石九段的大賽更多是讓人聯(lián)想起當年深藍和卡斯特羅夫的對奕。
那么,既然已經(jīng)有了電腦戰(zhàn)勝國際象棋冠軍的先例,為什么在圍棋這個領(lǐng)域還會引起這么大的關(guān)注呢?其根本原因在于,從計算的角度來看,圍棋比國際象棋難的遠遠不止是一兩個數(shù)量級。象棋的棋盤上的位置只有圍棋的大約六分之一,這就決定了圍棋的計算復(fù)雜度(簡單說來就是可能出現(xiàn)的不同棋局的總數(shù))遠超國際象棋,從目前人類實用中接觸的數(shù)字來看,幾乎是一個無窮大數(shù)。不太理解的朋友可以參考“一張紙如果能對折64次可以從地球伸到月球”的傳說。
換個角度來說,以目前計算機的能力而言,想窮舉搜索或者嘗試所有可能的棋局變化是完全不可能的?;谶@個原因,雖然計算機已經(jīng)在國際象棋領(lǐng)域戰(zhàn)勝了人類,計算機在圍棋上戰(zhàn)勝人類一直被認為是一個尚需時日的事情。包括學術(shù)界和圍棋界在內(nèi)的大部分專業(yè)人士都沒有想到這么快計算機就可以和專業(yè)棋手一決高下了。
從目前的趨勢看,無論這次AlphaGo能否戰(zhàn)勝李世石,計算機戰(zhàn)勝國際頂尖圍棋選手只是早晚的事情。而這次舉世矚目的比賽其成敗具有的更多的是象征性的意義。
AlphaGo能夠匹敵或戰(zhàn)勝職業(yè)選手這一事實,對于人工智能乃至整個科技的發(fā)展,都是一個極為重要的標志和鼓舞。由此帶來的技術(shù)突破和信心必將進一步推動人工智能尤其是機器學習在很多領(lǐng)域的應(yīng)用。事實上,除了DeepMind的AlphaGo以外,其他的一些研究組也在計算機圍棋方向取得了令人期待的進展,比如來自卡內(nèi)基梅隆大學最近的工作[2]。
不出大家的意外,這次使AlphaGo大放光彩的核心技術(shù)是近年來蒸蒸日上的深度學習技術(shù)。自2006年Hinton再度引爆深度神經(jīng)網(wǎng)絡(luò)的熱潮之后,深度學習在十年間幾乎橫掃所有人工智能相關(guān)的領(lǐng)域,在語音和視覺等領(lǐng)域的眾多問題中頻頻取得突破性的進展。很多學者和工業(yè)界研發(fā)人員也從最初的謹慎懷疑態(tài)度轉(zhuǎn)向積極跟進,進而推動了深度學習在理論和實踐兩方面的迅猛發(fā)展。就亮風臺在增強現(xiàn)實領(lǐng)域的經(jīng)驗而言,盡管深度學習在實用時還需要克服一些諸如實時性的挑戰(zhàn),但我們亮風臺已經(jīng)在一些實際應(yīng)用中(比如大規(guī)模圖片識別和人臉分析)成功的使用了深度學習技術(shù),并且期待在不久的將來會取得更好的結(jié)果和推廣。
下面就我個人的理解來對這次比賽下注。首先聲明,雖然我們在科研和應(yīng)用上都在使用深度學習的技術(shù)(如今想不用都難啊),我本人對于深度學習研究有限,所以下面觀點僅僅是很主觀的個人觀點??偟膩碚f,這次人機大賽,我覺得AlphaGo的勝率不高,感覺在30%以下。下面就幾個方面解釋一下我的理由。
一、AlphaGo之前戰(zhàn)勝的歐洲圍棋冠軍樊麾是職業(yè)二段,棋力和世界冠軍的九段李世石有很大的差距。
李世石本人認為“AlphaGo和我約差2子”[4],也是符合圍棋段位之間的基本差距的[5]。這一觀點得到了棋界諸多當前頂尖棋手的認同,參見[6]。當然,由于機器學習的強大學習能力,AlphaGo是有可能在這次比賽前的時間內(nèi)得到棋力上的飛速提高,理論上是有可能進步到頂尖棋手的能力。但是,這種提高并不是能夠輕而易舉實現(xiàn)的,參加下面的解釋。
二、深度學習畢竟還是要學習的,而學習是要樣本和訓練的。
盡管AlghaGo可以很容易的獲取大量歷史上的棋局資料,但是李世石這樣的頂尖棋手的棋局資料還是有限的。更重要的是,計算機棋手和頂尖專業(yè)棋手的對局資料非常稀少。之前零星的幾次疑似AlphaGo和高手在弈城圍棋網(wǎng)上的比賽和即將進行的比賽差距還是太大,應(yīng)該不足以彌補這個訓練樣本上的缺陷。
三、反過來從棋手的角度來看,頂尖的專業(yè)棋手對于機器棋手的行棋方式和漏洞可能更為敏感也有更強的應(yīng)對方式。
比如,很多高手都指出了在AlphaGo-樊麾棋局中的一個明顯失誤[6](這個嘛,只有業(yè)余11級水平的我其實沒有看懂),這樣的漏洞相信不會被李這樣的高手放過的。當然,人也有狀態(tài)不穩(wěn)定和犯糊涂的時候,不過高手發(fā)生這種狀況的概率是很低的。
四、確實存在一種可能:AlphaGo可以通過頭一局或兩局迅速學習和調(diào)整。不過我個人感覺即使如此也不太容易達到擊敗李世石的水平,中間差距還是有些大,更多的樣本才會更可靠一些。一個參考是當年深藍和卡斯特羅夫的第一次比賽[7]。
總結(jié)一下來說,基于深度學習的技術(shù)使得計算機戰(zhàn)勝專業(yè)棋手,雖然比大多數(shù)人預(yù)料的要早,并不是完全意外的。作為人工智能領(lǐng)域的從業(yè)者,我們應(yīng)該更多的感到鼓舞,并期望從相應(yīng)的技術(shù)泛化中汲取指引我們前進的知識和經(jīng)驗,使我們能在具體的應(yīng)用領(lǐng)域上不斷前進。(文|凌海濱)
{{item.content}}