三十年前,美國政府開啟了人類基因組計劃,然后經(jīng)過十三年的努力,終于完成了人類這一物種的所有基因組測序,并繪制了人類基因圖譜。盡管起初遭遇了懷疑甚至反對,但該計劃自此改變了遺傳學領域,而且如今仍被視為歷史上最成功的科學事業(yè)之一。
現(xiàn)在高級智慧研究計劃( IARPA )—— Intelligence Advanced Research Projects Activity,它在命名上模仿了國防部門下屬的著名的美國國防部高級研究計劃局( DARPA )——是一家針對智能社區(qū)而建立的研究機構,已投入一億美元用于類似的雄偉計劃。大腦皮層網(wǎng)絡的機器智能( MICrONS )項目旨在反向設計一立方毫米的大腦,研究大腦的計算方式,并運用這些研究發(fā)現(xiàn)去更好地影響機器學習和人工智能算法。
IARPA 已經(jīng)招募了三個團隊,領頭人分別是哈佛大學的生物學家、計算科學家 David Cox ,卡內(nèi)基梅隆大學的計算科學家 Tai Sing Lee 和貝勒醫(yī)學院的神經(jīng)科學家 Andreas Tolias 。每個團隊都為這個難題提出了自己的五年研究規(guī)劃。
“這是一次巨大的投資,因為我們認為這是一個重要的挑戰(zhàn),它將對智能社區(qū)和整個世界產(chǎn)生非常廣泛的革命性影響。” IARPA的Jacob Vogelstein 是 MICrONS 項目的管理者,如此說到。
MICrONS 是奧巴馬總統(tǒng)大腦計劃(BRAIN Initiative)的一部分,試圖將類腦計算的現(xiàn)狀向前推進。很多技術如今都依賴于一套叫做人工神經(jīng)網(wǎng)絡的算法。人工神經(jīng)網(wǎng)絡,顧名思義,就是從大腦的組織結構(至少是我們已了解到的組織結構)受到啟發(fā)而構建的。由于計算能力顯著增長和網(wǎng)上的大量可用數(shù)據(jù), Facebook 能識別面孔, Siri 能分辨聲音,汽車可以自動駕駛,計算機可以在像象棋這樣的游戲中擊敗人類(現(xiàn)在甚至是在圍棋這種號稱人類堡壘的游戲中也能擊敗人類了)。
然而,這些算法依賴于高度簡化的模式分析信息過程,發(fā)展水平仍然很低?;?9世紀80年代的模型,神經(jīng)網(wǎng)絡在雜亂的環(huán)境中往往表現(xiàn)得很糟糕。在那種環(huán)境中,計算機試圖辨別的物體隱藏在眾多物體之中,而且許多物體是重疊的或模糊的。這些算法并不具備很好的概括能力,例如,計算機看到一兩條狗,并不能教會計算機辨識所有的狗。
另一方面,人類似乎能毫不費力地應對這些挑戰(zhàn)。我們可以在人群中找出朋友,可以在喧鬧的環(huán)境中注意到熟悉的聲音,還可以根據(jù)一個或少數(shù)幾個例子推斷出聲音或圖像的模式。我們不需要任何指導就能持續(xù)不斷地學會歸納概括。所以, MICrONS 的研究轉而求助大腦,以期發(fā)現(xiàn)計算機模型缺少什么。“那就是鐵證。” Cox 說。
盡管神經(jīng)網(wǎng)絡是大腦組織結構中的基本要素,然而他們所使用的計算方法并沒有直接模仿神經(jīng)元用來處理信息的算法。換言之,當前各種算法描述、變換數(shù)據(jù)并從數(shù)據(jù)中學習的方法,在很大程度上是由試錯決定的工程方案。神經(jīng)網(wǎng)絡能起作用,但科學家不是真的知道其中奧妙——當然也就不能很好地找到一條設計神經(jīng)網(wǎng)絡的途徑。“所以,如果我們更進一步,從計算角度而不是組織結構角度理解大腦,我們就能改進那些算法,并讓計算機的性能更接近人腦。” Vogelstein 說。
不同團隊將盡力繪制出嚙齒動物一立方毫米大腦皮層中的所有神經(jīng)回路
一立方毫米不足人腦的百萬分之一,可能看上去太小了。但是迄今為止,科學家們只能在同一時間測量少數(shù)神經(jīng)元的活動,或者用功能性核磁共振獲得復合圖片來觀測數(shù)百萬神經(jīng)元?,F(xiàn)在, MICrONS的成員打算在嚙齒動物進行視覺感知和學習任務的過程中記錄十萬神經(jīng)元的活動和連接,這是相當偉大的壯舉,因為這需要具有納米分辨率的成像技術,并且影像中曲折彎轉的線全長只有幾毫米。“這就像是一英寸一英寸地測量來繪制美國的公路交通圖。” Vogelstein 說。
然而, Vogelstein 是樂觀的,因為最近的技術支持為大規(guī)模的神經(jīng)科學研究提供了方便。“隨著大腦計劃的降臨,大量的新工具出現(xiàn)在了網(wǎng)上,能夠在重構詳盡的神經(jīng)回路圖譜所要求的分辨率和尺度上探詢大腦,”他說,“所以,這是歷史上獨一無二的時刻,我們擁有了恰當?shù)墓ぞ摺⒎椒ê图夹g,可以讓我們第一次在單個神經(jīng)元和單個突觸水平上揭示大腦的線路圖。”
每個團隊打算分別記錄大腦的路線圖。 Cox 的團隊將使用名為雙光子顯微技術( two-photon microscopy )的工具測量老鼠的大腦活動,這些老鼠被訓練去辨識電腦屏幕上的物體。研究員們將一種改良過的對鈣很敏感的熒光蛋白導入老鼠。當一個神經(jīng)元興奮時,鈣離子就蜂擁進入細胞,引起熒光蛋白發(fā)光,因此研究員們使用激光掃描顯微鏡就能觀看到神經(jīng)元爆發(fā)動作電位。“這有點像電線輕敲大腦,” Cox 說,“類似于你可能通過收聽電話呼叫里的信息來弄明白發(fā)生了什么,我們也可以在動物活潑亂跳的時候收聽到它們大腦內(nèi)部的重要信息。”
然后,一立方毫米的老鼠大腦將被送到 Jeffrey Lichtman 手上,他是哈佛大學的一位生物學家和神經(jīng)科學家。在他的實驗室,大腦將被切成極其細薄的片,并在先進的具備足夠分辨率的電子顯微鏡下成像,研究員們就能看到腦細胞彼此連接而形成的所有的線狀延伸。 Tolia 的團隊正采取相似的名叫三光子顯微技術( three-photon microscopy )的方法,來深入窺探老鼠大腦中更深處的皮層,而不僅是 Cox 和他的同事們檢測的頂部皮層。
與此同時, Lee 的團隊打算走得更遠,想尋找到描繪神經(jīng)連接組的更根本的方法。他們與哈佛醫(yī)學院的遺傳學家 George Church 合作,打算使用DNA條形碼:他們將用獨特的核苷酸序列給每個神經(jīng)元打上標簽(條形碼),并用化學方法連接突觸之間的條形碼來改造神經(jīng)回路。盡管這種方法不能像顯微技術那樣提供同樣水平的空間信息, Lee 希望它能更快,更準確——也就是說希望它在各方面發(fā)揮作用。這種方法在以前從未成功過。“但是,倘若這種條形碼技術發(fā)揮了作用,就將革新神經(jīng)科學和連接組學。” Lee 說。
以上所說的一切僅僅構成 MICrONS 項目的前半部分??茖W家們接下來必須找到一條路徑讓所有這些信息能夠用于機器學習算法。他們大致上知道如何去做。比如說,許多研究員相信大腦是貝葉斯式的——神經(jīng)元以概率分布的形式表征感官信息, 基于先前的經(jīng)驗對事件計算得出最可能的解釋。這種假設主要是基于大腦中的反饋回路這一想法,即信息不僅向前流動,還通過更多連接反向流動。
換言之,研究員們假設感知絕不是簡單的從輸入到輸出的映射。更準確地說,存在一個“通過合成進行分析”的建設性過程,大腦維持并創(chuàng)造對世界的內(nèi)部表征,產(chǎn)生期待和預測,這讓它可以解釋和計劃如何使用輸入的數(shù)據(jù)。“這是我們最近非常關注的指導性原則——是這個合成過程的標志,” Cox 說,“在這里我們設想在這世界上什么是可能的,驗證那些不符合我們實際所見的設想,并用那些設想驅動我們的認知。”
例如,視網(wǎng)膜對光做出反應,產(chǎn)生電脈沖,傳遞到視神經(jīng)然后到大腦,實際上視網(wǎng)膜是二維結構。因此當人們看一個物體時,大腦可能使用了這樣一個基于概率的模型從光刺激視網(wǎng)膜的二維平面去推導立體世界。僅以此為例,大腦已經(jīng)找到一個更好的方法對環(huán)境中的變量進行估算和推論,超過了我們當前的數(shù)學模型所能做到的。畢竟,如果你觀察一個有一百個物體的場景,僅僅考慮物體是向前還是向后,這僅僅是諸多因素中的兩個因素,結果就有2100種可能的模式。計算出所有的可能情況來得到答案,不是切實可行的。然而大腦能輕松地做到,即使有無限多種可能的條件取向:不同的距離,不同的旋轉角度,不同的光照條件等。“大腦要做的是顯示數(shù)據(jù)點的匯集情況,并讓混在一起的數(shù)據(jù)輕易的分隔開。” Tolias 說。
這三個團隊都各自招募了計算機科學家來將這些理論提煉成模型,然后他們將測試這些模型是否與反向設計的大腦數(shù)據(jù)相抵觸。“對于任何給定描繪的算法,如基于概率的算法,你都有數(shù)百萬種可以實施的選項將理論翻譯成可執(zhí)行的代碼,” Vogelstein 說,“在這些大約百萬中的選項中,某些參數(shù)和特征的結合將形成好的算法,而另外一些結合將造成無效的或糟糕的算法。通過從大腦研究中提取這些參數(shù)設置,這與我們一直在做的那樣在電腦軟件上猜測那些參數(shù)相反,我們有希望將研究空間縮小到實現(xiàn)一小部分符合大腦實際情況。”
有了這些內(nèi)部模型, MICrONS 打算讓機器更自動化,尤其是當談及訓練機器去辨認物體并且不需要事先讓機器通過成千上萬的、物品被明確命名的例子進行學習。 Vogelstein 想要將無監(jiān)督式學習技術應用于協(xié)助美國智能。 “我們可能只有一張圖片,或者一個我們想要阻止的網(wǎng)絡攻擊的例子,或者一份金融危機或災害性天氣的記錄,”他說,“我們需要推廣到更廣泛的、相同模式可能出現(xiàn)的環(huán)境中去。所以這就是我們希望達到的:更好的概括推廣,更強的抽象能力,更好的稀疏數(shù)據(jù)使用。”
研究員們認為從大腦推導這樣的算法將是 MICrONS 面臨的最困難的部分,他們將不得不確定一種方法去編譯大腦是如何加工信息和形成新連接的。
然而,在這個研究項目的初期也存在一些挑戰(zhàn)
舉例來說,他們對大腦的測量將產(chǎn)生大約兩千兆兆字節(jié)的數(shù)據(jù),這個數(shù)量等于 250,000 臺筆記本電腦的內(nèi)存量,或者 250個 CD 的存儲量。存儲如此巨量的數(shù)據(jù)是困難的, IARPA 已經(jīng)與 Amazon 合作尋找解決方案。
另外,數(shù)據(jù)全是圖象式的。挖掘數(shù)據(jù)以得到有用信息將需要一個叫做分隔的過程,在這個過程中,研究員用不同的顏色區(qū)分神經(jīng)元的結構基礎和神經(jīng)連接,這樣計算機就可以更好地理解共同特征和模式。“即使對你來說全世界都是染有顏色的,” Lichtman 說,“要為一立方米的大腦染色也需要耗費終生光陰。”相反,研究員們將致力于創(chuàng)造出更復雜巧妙的計算機視覺技術來劃分數(shù)據(jù)。
Lichtman 已經(jīng)懂得成功存儲100萬億字節(jié)的數(shù)據(jù)(這是 MICrONS 計劃收集的數(shù)據(jù)的二十分之一),這些數(shù)據(jù)產(chǎn)生于傳遞感官信息的中轉站——丘腦。他的團隊的成果將在3月發(fā)表在《 Cell 》上。“我們了解到有時候同一軸突會從一個細胞跳去另一個細胞來連接不同神經(jīng)細胞的同一位置,這意味著丘腦的組織方式并不人們預料的那樣。” Lichtman 說。也許,這些成果將擴展至他們剛剛開始測評的一立方毫米的大腦皮層。“我們知道我們可以測評更大的體積,但是目前一立方毫米對我們來說就是巨大的體積,”他說,“這是一次巨大的飛躍。我們認為我們已經(jīng)準備好走下一步了。”
David Mumford 是一位數(shù)學大師,菲爾茲獎得主,也是 Lee 的博士導師,卻不是 MICrONS 的成員。他稱贊這個項目。“這是真正的進步,”他說,“一旦這種數(shù)量級的數(shù)據(jù)集可供使用,我們能更深入地理解神經(jīng)元彼此互動的方式,但是要弄清你能應用這些技術知識做什么將是巨大的挑戰(zhàn)。我的夢想是這一巨量數(shù)據(jù)的記錄在某一時刻能成為可能,而且我認為這個研究組可能是能很好地做成這件事的組。”
“但是我稍微有點懷疑將這些信息轉換成人工神經(jīng)網(wǎng)絡的可能性,”他補充到,“那稍微有些不同尋常。”
即使這樣,三個團隊都信心滿滿,認為他們的工作將產(chǎn)生成果。 不管研究結果是什么,結果都不是失敗,” Lichtman 說,“結果可能并不符合你們的預期,但這是一個機會。我不會為我們的觀點是否錯誤而失眠。還有我們未知的東西。事實是大腦是真實存在的,也確實是復雜的,從沒有人看透大腦,所以讓我們關注研究進展。研究中的風險是什么?”
他們還希望在耗資 20 億美元的人腦計劃陷入困境的地方取得勝利。 Cox 解釋說他們的研究方法是與人腦計劃有根本區(qū)別的,既體現(xiàn)在技術上也表現(xiàn)在邏輯上。事實上,首先從本質上看,在努力嘗試模仿大腦之前,兩者在本質上就相反。 MICrONS 的基于團隊的方式將有望引起必要的合作與競爭,最終獲得重大進展。 IARPA 意欲公布它收集的數(shù)據(jù),以便其他科學家貢獻思想觀點和科研力量。“即使這就像是在看一粒沙子,”Lee 說,“就像我的大學教授告訴我的,你也可以在一粒沙子中看見上帝。”(來源|機器之心 編譯|孫閏松、柒柒)
{{item.content}}