前不久,美國研究人員訓練出一個深度學習算法,用以識別"東亞某國"地空導彈基地。
就在我們的頭頂之上,各種衛(wèi)星(包括間諜衛(wèi)星)像狗仔隊一樣,每天都圍著地球瘋狂拍下數(shù)十TB的照片。這個數(shù)量可以說是泛濫了。
每個情報機構(gòu)都有一批訓練有素的分析師,負責搜尋隱藏在海量衛(wèi)星圖像中未申報的核設(shè)施或秘密軍事基地。
但面對如此海量的數(shù)據(jù),據(jù)說美國的情報機構(gòu)已經(jīng)被錯失恐懼癥(FOMO)所籠罩。因為人類分析員能處理的圖像數(shù)量有限,很可能錯失真正重要的關(guān)鍵信息。
于是,AI來了。而且來得很恐怖。
前不久,美國研究人員訓練出一個深度學習算法,用以識別"東亞某國"地空導彈基地。
這些算法比人類的速度快幾百倍,高效找出分布在一塊近9萬平方公里區(qū)域內(nèi)的地空導彈發(fā)射場。這種人工神經(jīng)網(wǎng)絡(luò)基于能夠過濾和學習大量數(shù)據(jù)的人工神經(jīng)元層,達到人類圖像分析專家90%的準確率。
令人震驚的是,這種方法還將發(fā)現(xiàn)潛在導彈基地的時間從60小時(2.5天)減少到42分鐘。
可怕之處在于,這只是公開的"民間"研究。
"用算法發(fā)現(xiàn)潛在的導彈基地位置,據(jù)我所知,這為人類節(jié)省了很多時間" 密蘇里大學電氣工程和計算機科學教授Curt Davis談了談他們的研究方向。
這個研究發(fā)表在10月的《應(yīng)用遙感》雜志上,展示了一種用于大量衛(wèi)星圖像分析的深度學習模型,能夠識別情報機構(gòu)和國家安全專家可能感興趣的目標。
美國愛國者地空導彈系統(tǒng)運輸起豎發(fā)射車(TEL)
挑戰(zhàn)
在衛(wèi)星圖像分析中應(yīng)用深度學習AI的挑戰(zhàn)通常很難解決。
與人臉、地點或者物體識別相比,衛(wèi)星圖像對深度學習算法提出了更大的挑戰(zhàn)。因為衛(wèi)星圖像會從多個角度進行拍攝,同一地點的建筑物可能在照片上是顛倒的,另外同一地點的不同時間里云層的變化也很不一樣。
另一個主要問題是相對缺乏大型訓練數(shù)據(jù)集,包括用于訓練深度學習算法的手工標記的示例,需要用它來準確識別衛(wèi)星圖像的特征。
對此,Davis團隊將全球約2200個地點的公共數(shù)據(jù)與影響解決方案商DigitalGlobe衛(wèi)星圖像結(jié)合在一起,創(chuàng)建自己的訓練數(shù)據(jù),然后通過測試四種深度學習模型找到最佳測試數(shù)據(jù)。
但研究人員手中確認的地空導彈基地圖片只有90個。這樣一個小型訓練數(shù)據(jù)集通常無法產(chǎn)生準確結(jié)果。為了解決這個問題,Davis等人將原始圖像稍微改變了方向,把90多個訓練樣本轉(zhuǎn)換成大約893000個訓練樣本。
這項研究中的成績很可能得益于導彈發(fā)射基地占地很大,在衛(wèi)星圖像上看也有獨特的圖案。
兩類常見的原型/對稱地空導彈發(fā)射場
挑戰(zhàn)接踵而至。
衛(wèi)星圖像之間的分辨率也差異很大。這讓問題進一步變得復(fù)雜,想要深度學習算法效果最好,通常需要給定相同大小的圖片。另外,除了可見光圖像之外,不少衛(wèi)星拍攝的還是紅外或者其他光譜波段的圖像。
在試圖分析諸如移動導彈發(fā)射裝置、雷達天線、移動雷達系統(tǒng)和軍用車輛等較小的物體時,深度學習算法面臨著一個更大的挑戰(zhàn),因為可用的衛(wèi)星圖像數(shù)據(jù)在提取識別特征時像素會減少。
"在我們的大腦中,CNN如何處理這樣的小尺寸物體是一個懸而未決的問題,尤其是在大型數(shù)據(jù)集的測試中,就像我們在這次研究中所做的那樣。"Davis說。
未來
種種的不完善,讓深度學習面臨巨大障礙。即使算法能夠達到80%或90%的精度,專家仍然認為AI不具備接管整個工作的能力。
今年7月以來,各路高手紛紛開始在全球最大的衛(wèi)星圖像公開數(shù)據(jù)集上訓練機器學習算法。這個數(shù)據(jù)集包含100萬個帶標簽的對象,包括不同的建筑和設(shè)施。
這個數(shù)據(jù)集的提供者,是美國情報高級研究計劃局(IARPA)。他們贊助舉辦的這次大賽,就是想找到一個更好的AI解決方案,分擔人類分析員75%的工作。
共有10個團隊進入到這次挑戰(zhàn)的決賽階段,整個比賽要下個月結(jié)束。
IARPA的項目經(jīng)理Hakjae Kim說:"美國情報機構(gòu)的手里已經(jīng)有了一些方案,但速度和方法總是有提升的余地"。
"現(xiàn)在的技術(shù)狀態(tài),只有人與機器合作才能真正找到答案",笛卡爾實驗室CTO麥克·沃倫(Mike Warren)說。笛卡爾實驗室已經(jīng)把深度學習用于分析商業(yè)衛(wèi)星圖像,對美國玉米和大豆的收成進行預(yù)測。
即使不完美的AI工具也會有助于情報收集工作。
例如,國際原子能組織(IAEA)的任務(wù)是監(jiān)測所有已申報的核設(shè)施,并在近200個國家中尋找未申報的設(shè)施。
加州的米德爾伯里國際研究所研究員Melissa Hanham表示,深度學習工具可以幫助IAEA和其他獨立組織利用衛(wèi)星圖像監(jiān)測發(fā)展核勢力和大規(guī)模殺傷性武器的發(fā)展。
"我們就處于這樣一個世界,"Hanham說,"我期待自動化將工作中乏味而多余的部分取代。"
{{item.content}}