創(chuàng)新工場創(chuàng)始人李開復在7月16日召開的2016硅谷高科技創(chuàng)新創(chuàng)業(yè)高峰會暨全球產(chǎn)業(yè)互聯(lián)網(wǎng)大會上發(fā)表主旨演講時表示,公司正在對人工智能做一個非常大的布局,迄今為止已投資近1億美金,接近25家公司。他認為,很多工作在未來的十年都會被人工智能取代。
以下為李開復大會當天的發(fā)言全文:
李開復:尊敬的胡部長、仇部長,各位嘉賓,今天有幸跟大家分享一下我們對于一個特別特別重要的研發(fā)和投資的趨勢的看。創(chuàng)新工場成立于2009年,過去七年我們專注所有中國創(chuàng)業(yè)者需要的服務(wù)和投資。我們今天管理大約12億美金的基金,投了接近300個項目,包括好幾家獨角獸。但是今天我想特別講的是我們投資的一個專門的方向和趨勢。
創(chuàng)新工場的特色是做技術(shù)型的投資。我們自認為最專長的是看到一個趨勢的崛起,并對這個趨勢做深度的分析,而且非常早期的布局。比如說在2009年我們對移動互聯(lián)網(wǎng)的投資,在2011年左右我們對娛樂內(nèi)容的投資,而我們今天正在對人工智能做一個非常大的布局。到今天已經(jīng)投資了接近1億美金,接近了25家公司。我們今天想分享一下為什么我們會特別的看重這個領(lǐng)域?
最近人工智能得到全球關(guān)注主要是因為阿爾法狗擊敗了李世石。在很多的世界媒體上我們看到的,就是機器是否會取代人腦?我個人認為沒有足夠的科學根據(jù),讓我們想那么多,擔心那么多。而短期讓我們更應(yīng)該觀者的是怎么用人工智能,我們的工具,我們的奴隸來為社會創(chuàng)造價值,來為創(chuàng)業(yè)者創(chuàng)造機會。
為什么人工智能會這么強大呢?
因為今天人類做的大部分工作是重復性的,是基于一個有限的領(lǐng)域的,是基于可以客觀思考甚至窮舉的。這些工作在未來的十年都會被人工智能取代。這些工作我這里列了一些,如果你們不太相信的話,我們可以舉幾個例子。今天美國的美聯(lián)社90%的稿件已經(jīng)是機器人取代了。在過去的十年華爾街交易員已經(jīng)一半下崗離職了。未來我們肯定會看到無人駕駛的車,當這一天來到的時候,世界上大約9%的人他們部分或者全部的工作就即將被取代。當然無人駕駛可能還需要十年的時間,但是十年不是很久。
怎么能做到呢?
其實在這些領(lǐng)域里,人工智能不是模仿人類,也不僅僅是取代人類,所謂的人工智能就是用特別巨大的數(shù)據(jù)集看到一個人一生,甚至一百個人一生,也不能看到那么多的數(shù)據(jù),然后用數(shù)個數(shù)據(jù)推算出邏輯、判斷和推測,來做比人好的判斷。阿爾法狗就是研究了幾百萬的棋譜和花無數(shù)小時的時間來打敗人類專家的。有人說這個公平,一個棋手不可能花一百萬個小時研究棋譜。這不是公平不公平的問題,而是我們?nèi)绾斡萌斯ぶ悄茏龀鋈瞬荒茏龅牡?。最近特斯拉出了一個問題,大家可以想想它有幾億小時在車的進行中,這些數(shù)據(jù)來難道不會做比人更好的司機嗎?這一天還沒有到,但是如果有一個司機做十億小時的練習,哪怕他開始像個孩子,學完以后難道不會超過人類嗎?
我們可以想像,如果有一個人臉識別的機器,它把全世界罪犯的臉都背下來了,有人能夠做到這一點嗎?所以從這個例子可以看到,我們不用絲毫的懷疑人工智能會全方面的超越人類。但是這不是在所有的領(lǐng)域里,是在一些領(lǐng)域可以窮舉的領(lǐng)域,或者可以客觀分析的領(lǐng)域,或者有正確答案的領(lǐng)域,有大數(shù)據(jù)的領(lǐng)域,而且是有專家參與的領(lǐng)域,所以它會逐漸的發(fā)生,不會一次到位的發(fā)生。
我個人有幸在三十年前開始做人工智能,但是可惜的是當時數(shù)據(jù)不夠,所以并沒有做太多超越人類的事情。所以各方面我們可以看到對弈只是游戲的領(lǐng)域,它本身并不帶來巨大的商業(yè)價值。更多我們在業(yè)界會看到的可能是感知,就是用算法,人工智能來做判斷或者反饋,這個時候機器就要動起來了。我們可以看到過去七八年來有特別大的進步,這是為什么呢?這是因為在機器學習的領(lǐng)域有一套技術(shù)叫做深度學習。它是帶來了巨大的變革,今天可能沒有時間太解釋這套算法。但是簡單來說,就是過去人是需要一步一步地告訴電腦你該怎么走,該怎么做,之后人可能說我一步一步來教你可能會犯錯,可能不全面,可能也不適合計算機的結(jié)構(gòu),更適合人腦的結(jié)構(gòu),但是是不是就是人來說,就先對人臉找眼睛、找鼻子、找耳朵,但是這個大概是所謂的專家系統(tǒng),就是人告訴機器一切,然后機器來計算,這個大概是三十年前的技術(shù)。
大概十五年前的技術(shù)是人落找特征,機器學參數(shù)。這里就是人告訴他識別人的時候找眼睛、嘴巴,然后你再來計算。這個有一個提升,這是人機結(jié)合的學習。
深度學習的技術(shù)應(yīng)該算是最近五年推出的技術(shù),這個技術(shù)幾乎人都不參與了,特別神奇的地方,給看一億張臉,你自己看,該學習眼睛、嘴巴,還是別的事情,也許法令紋更重要,也許耳朵的大小更重要。我們不要假設(shè)人比機器更重要,我就把大量數(shù)據(jù)給你,讓你收取你認為重要的特征。而且這些特征只有機器懂,人都聽不懂的。這就是阿爾法狗戰(zhàn)李達以后世石的時候,下出了人類頂尖棋手都沒有辦法看懂的步驟。這就是深度學習,它能自我學習,抽象的概念。而且這個抽象概念超越了人類的想象,因為它用的數(shù)據(jù)集比人更大。它就像一個孩子,能夠自我學習,而且數(shù)據(jù)量夠大的時候,什么都學的會。所以這大概解釋了什么是深度學習。
深度學習,這是一個識別物體的領(lǐng)域,而且是有人標注的數(shù)據(jù)庫。我們可以看到大概僅僅在五年前,一個機器跟人的差別還是一個74%對94%的差別。如果算錯誤率的話,可能是六七倍的差別了,所以不太能夠用到實際的場景里。但是每一年都在快速的進步著,我們可以看到在2014、2015年的時候已經(jīng)超越人類,而且差距越來越大。就是說當機器識別人臉,比人更厲害的時候,那些以識別人臉工作的人就要下崗了。同樣的,識別也超過了人,語音識別超過了人,像客服,比如每天打電話賣房地產(chǎn)產(chǎn)品的人,以后打電話的不是人了,因為機器比人更聽的懂。所以當每個技術(shù)超越人的時候,它帶來的機會是巨大的。所以我們要認為下一個階段,未來的五年什么東西產(chǎn)生巨大的價值,可能有這些領(lǐng)域,當然這些領(lǐng)域包括了高科技,用麥克風,用攝像頭等等的,這些會產(chǎn)生很大的價值。但是還有另外一個領(lǐng)域,就是如果一個領(lǐng)域有特別大的數(shù)據(jù)了,只是這個數(shù)據(jù)沒做挖掘,沒有產(chǎn)生價值,比如說商業(yè)化的流程,比如說互聯(lián)網(wǎng)的數(shù)據(jù)。所以今天誰最適合做大數(shù)據(jù)人工智能呢,其實就是BAT,在美國就是Google、微軟和FB,因為他們已經(jīng)有互聯(lián)網(wǎng)大數(shù)據(jù)。
這些怎么做到呢?
像百度搜索的十個結(jié)果,我一個都沒有點,這暗示這十個都不好,但是這不是絕對的暗示,但是數(shù)據(jù)足夠多,是可以充分的學習。其實這些BAT走在使用,滴滴、美團都在使用,只是在創(chuàng)業(yè)領(lǐng)域大家還沒有足夠的機會。
這個世界上還是Google做的最好,因為它有世界最大的數(shù)據(jù)集,它使世界上做人工智能做的最早,然后再加上Google多年累計了大浪的技術(shù)人才,還有特別快的機器。所以為什么Google做出來阿爾法狗,而不是BAT,美團和小米。但是Google的野心不僅僅是阿爾法狗。前幾年我們看到Google自我命名為Alphabet,是互聯(lián)網(wǎng)的一家公司,它可能還有做醫(yī)學的公司,可能還要做基因檢測的公司,可能做汽車等等領(lǐng)域。Google做智能產(chǎn)品的過程中發(fā)展了一套Google大腦。其實Google里有兩套大腦,這個可以用到各個領(lǐng)域。發(fā)現(xiàn)這個大腦,其實才是它的最大價值。在其他的領(lǐng)域,只要有數(shù)據(jù)就可以啟動。所以Google擁有了巨大的數(shù)據(jù)量,它們啟動了數(shù)十個不同的項目。在美國有一些機構(gòu),比如OpenAI,也擔心,Google如果這么多數(shù)據(jù),還有沒有機會跟它競爭,它歸不會人類知道的太多了。我覺得這類的問題對Google,對FB,BAT,我們作為消費者和媒體都要擔心他們。當然的最好的辦法是讓更多的人參與到這個領(lǐng)域來創(chuàng)業(yè),這樣就不會被某一個壟斷了。
Google有這么大的野心,我們怎么知道是深度學習呢?這是Google用深度學習的數(shù)量,在過去的三年可以一看到深度學習的數(shù)量和應(yīng)用的領(lǐng)域在大大提升。所以剛才講的并不是空穴來風。
這么好的機會我們怎么捕捉這個機會呢?
講了這么多樂觀的事情,我要稍微保守地告訴大家說,這并不是人人能做,做起來也不是很簡單的。第一,有些領(lǐng)域是要平臺,比如開發(fā)一個蘋果APP,或者安卓的APP,使要有平臺的。你只要是計算機程序員就可以學會開發(fā)一個安卓APP。但是你即便是一個優(yōu)秀的程序員也沒法兒用深度學習,因為這個還沒有平臺化,你還要知道進去很多微調(diào)的東西。這方面的專家可能只有幾百個人,所以這樣的人才很稀缺。第二,需要海量的數(shù)據(jù)。說一千萬的數(shù)據(jù)就是大數(shù)據(jù),其實那是小數(shù)據(jù)。真的要機器學習要用用武之地,要有更巨大的量。第三,這些數(shù)據(jù)儲存,還有存儲量。第四,我們都認為這個超越人了,可以倒過來解釋給我們聽,但是機器學習沒有辦法告訴你怎么決定的,你要相信就相信,按照結(jié)果說話,回來說怎么打贏李世石的,說不出來。
怎么做呢?
買這個數(shù)據(jù),標注這個數(shù)據(jù),不要浪費錢,GPU可能比CPU好用。找專家,這樣的專家真的不多。Google已經(jīng)開出九位數(shù)的代價挖這樣的專家。這是我們過去不能夠想象的,在國內(nèi)我們也看到,比如說看到投資的Face++,最近也是努力挖到了華人在深度學習的研究員,這些人才的價值使特別巨大的,因為非常稀缺。但是話說回來,這個稀缺也是未來兩三年的現(xiàn)象,之后我覺得會有很多聰明人,尤其在中國會涌入這個領(lǐng)域。因為重賞之下必有勇夫。
最后,是學怎么調(diào)這些參數(shù)了。但是有這些東西還不夠,深度學習說實在的還會有一些挑戰(zhàn),最后貼貼補補還不能完成你的應(yīng)用該怎么辦呢?就要用巧妙的,非技術(shù)的方法,就是不要取代人,而是輔助人就好了。比如做安防的人,他不一定帶著槍的機器人,他只要帶著攝像頭,拍出來的東西告訴人,這邊動靜,那邊的窗子壞了,其實就夠了,所以輔助人就夠了。還有輔助醫(yī)學,我們不是說取代醫(yī)生,但是可以給醫(yī)生做一些工具是完全可以的。第二,我們有容錯的界面,其實搜索引擎就是容錯的界面,界面設(shè)計的好也能彌補人工智能的不足。
第三,怎么用草船借箭的方法,從用戶那邊拿多數(shù)據(jù)。我沒有數(shù)據(jù),就像當年孔明沒有箭就是借來的。所以不一定是要買或者數(shù)據(jù)在有些例子是可以創(chuàng)造的。
最后,我們不要解決最大的AI問題,而是我們是不是能局限于領(lǐng)域一領(lǐng)域和場景?比如為什么要全天候無人駕駛,為什么在可控的領(lǐng)域做好無人駕駛呢?現(xiàn)在特斯拉的車,我們看到這次出車禍,就是它分不清巨大的卡車和天空的顏色。我們就找一個領(lǐng)域不會有巨大卡車出。而且阿爾法狗怕的是天黑、下大雪,我們就找一個不一樣的場景。像在智能倉儲里做一個插車機器人,這個倉庫里燈光和環(huán)境是可控的,這里不會下雨和夏雪,不會有卡車出來。所以用一個聰明的局限領(lǐng)域來創(chuàng)造價值。
這是今天一張重要的PPT,但是我也能保證這張是有錯的,因為沒有人可以預(yù)測未來。我們相當看好大數(shù)據(jù),尤其是剛才談的金融領(lǐng)域,因為它有最大的黑盒,能夠產(chǎn)生最大的效應(yīng),也能吸引最大的應(yīng)用。在感知方面有一個誤解,就是自然語言理解。就是聽到語音了,變成字了,我就懂了。因為人是很容易懂的。但是聽,識別你講的字,和懂你的意思還是有一個特別大的鴻溝。這點我覺得至少五年,甚至十年的時間才能突破。機器人方面都想做家庭機器人,我們認可是有商業(yè)價值,能掙錢,省錢的,而不是家里有兩條腿、兩個手的人在家里跟你打打招呼的,這樣是不能滿足家庭期望值的,這個在日本可能是可以的,但是我不認為有一定的代表性。這樣的機器人好玩兒,可以做老人陪伴,可以做小孩的玩偶,但是就是這么多了。要期待它幫你炒菜、掃地,成為家庭主婦,或者家庭的新的一員或者新的電器,這個還是一個天方夜譚。當然你很聰明的把這個機器人做成了一個音響,或者做成了陪伴老人的小機器,像我們投資的小魚在家,當然也是可以做的。但是我們?nèi)怂胂蟮臋C器人一定會先在商業(yè)領(lǐng)域出現(xiàn),之后才會在家庭有希望。
最后關(guān)于無人駕駛,就是怎么樣去應(yīng)用我們的約束,讓它在有些場景可以有用,先幫助人,人幫助它,最后才是無人,而是這還是在十年以后。
創(chuàng)新工場過去兩三年在悄悄的耕耘這個領(lǐng)域,因為有些領(lǐng)域投資一對外公布,這個領(lǐng)域很快就被玩壞了,現(xiàn)在我們投資了20家公司,我們愿意和大家分享投資的兩家公司,就是Face++ ,還有駕勢科技,這兩個項目應(yīng)該在國際上達到了很高的知名度。除此之外,我們還投了很多公司,像地平線機器人,它是硬件平臺來打通這個領(lǐng)域,而且它會用大家電來做它的第一步的切入。或者我們投的第四范式,它在銀行和保險業(yè)做了非常大的突破。我們將在下個禮拜做非常大的發(fā)布會,讓大家知道它做的事情,怎么改變了中國的金融領(lǐng)域。還有很多中國和美國的投資。因為深度學習需要非常大的數(shù)據(jù)量。我們跟像富士康這樣的公司有很深度的合作。所以這個領(lǐng)域我們是特別特別的看好,希望今天的演講對大家有些啟發(fā)。謝謝。
{{item.content}}