編者按:
6月14日至15日,由泰伯網(wǎng)主辦的第七屆全球地理信息開(kāi)發(fā)者大會(huì)(WGDC 2018),以“空間智能驅(qū)動(dòng)萬(wàn)物互聯(lián)”為主題,在北京的國(guó)家會(huì)議中心召開(kāi)。來(lái)自測(cè)繪地理信息、人工智能、空間大數(shù)據(jù)的專家學(xué)者、企業(yè)代表、高校師生、行業(yè)從業(yè)者等參加了本次大會(huì),現(xiàn)場(chǎng)人次過(guò)萬(wàn)。大會(huì)舉辦了多場(chǎng)行業(yè)峰會(huì),展現(xiàn)了大數(shù)據(jù)與人工智能在地理空間上的各項(xiàng)應(yīng)用。大會(huì)期間還頒發(fā)了Best of WGDC獎(jiǎng)項(xiàng)。
在本次大會(huì)中,大地量子憑借產(chǎn)品“空間數(shù)據(jù)引擎”,在14日下午獲得了Best of WGDC獎(jiǎng)的“2018年年度最佳口碑產(chǎn)品獎(jiǎng)”。
獲獎(jiǎng)獎(jiǎng)杯
領(lǐng)獎(jiǎng)合照,左起第二位是大地量子創(chuàng)始人兼COO呂童博士。大地量子從參與評(píng)選的數(shù)百家企業(yè)中脫穎而出,成為46家獲獎(jiǎng)企業(yè)之一。圖片來(lái)源:泰伯網(wǎng)
了解榜單更多詳情,請(qǐng)點(diǎn)擊:http://t.cn/RBWglw6
同時(shí),大地量子出席了15日下午的智慧農(nóng)業(yè)峰會(huì),并為大家?guī)?lái)了精彩的演講,分享了關(guān)于目前時(shí)空大數(shù)據(jù)在基于農(nóng)業(yè)又廣于農(nóng)業(yè)上的各類應(yīng)用前景和存在問(wèn)題。
以下是演講全文。
王馳:
尊敬的汪院士、各位前輩、各位專家,大家好!我是王馳,是大地量子的創(chuàng)始人。我們公司是成立于去年年初的創(chuàng)業(yè)公司,現(xiàn)在主要做空間大數(shù)據(jù)應(yīng)用。公司位于成都,目前是十幾個(gè)人的規(guī)模,其中有5位博士,而我自己在博士期間是做量子計(jì)算的。以上是我們公司基本的情況。
今天想在此作一些關(guān)于時(shí)空大數(shù)據(jù)結(jié)合農(nóng)業(yè)大問(wèn)題的分享。時(shí)空大數(shù)據(jù)是關(guān)于時(shí)間和空間的大數(shù)據(jù),在座都是專家,我就不再班門弄斧,只是分享一下自己對(duì)于這個(gè)問(wèn)題的感受。
時(shí)空大數(shù)據(jù)最大的問(wèn)題是“大”
相比于其它大數(shù)據(jù)比起來(lái),特點(diǎn)是大。例如遙感行業(yè)的朋友們會(huì)了解到,它每天的新增數(shù)據(jù)量是20T,每年新增數(shù)據(jù)量是7PB。7PB是是什么樣的概念呢?以家用的100M帶寬,要連續(xù)下載19年,才把這些數(shù)據(jù)下載完。然而,這樣大的數(shù)據(jù)并沒(méi)有很好地利用起來(lái),利用率非常低,這就是時(shí)空大數(shù)據(jù)很大的挑戰(zhàn)。光是為了儲(chǔ)存這些數(shù)據(jù),每年都要買上1000張左右的硬盤(pán)。
演講中的王馳(趙盈 攝)
回顧全球人造衛(wèi)星,總共發(fā)射了963顆。隨著美國(guó)政策的不斷開(kāi)放,美國(guó)FAA預(yù)計(jì)在未來(lái)十年,再發(fā)射2619顆衛(wèi)星,差不多是過(guò)去十年的三倍。這意味著,數(shù)據(jù)質(zhì)量會(huì)不斷上升,數(shù)據(jù)成本會(huì)不斷下降,也意味著數(shù)據(jù)總量會(huì)大幅度增加。
我們拿著這些數(shù)據(jù)干什么?怎么做我們想做的事情?
我認(rèn)為有兩點(diǎn)至關(guān)重要:
1、算法;好比系統(tǒng)的大腦
2、算力;好比肌肉
算法的創(chuàng)新可以帶來(lái)更多的應(yīng)用,比如說(shuō)可以去監(jiān)測(cè)海浪的能量來(lái)幫助潮汐發(fā)電站正確的選址;算力則可以讓?xiě)?yīng)用得到更好的發(fā)展。
關(guān)于算力
在實(shí)際應(yīng)用過(guò)程中,會(huì)發(fā)現(xiàn)算力的提升比算法的創(chuàng)新更困難,且并不意味著多買一些CPU、一些硬盤(pán),就可以提高算力,實(shí)際上整個(gè)過(guò)程相當(dāng)復(fù)雜,而有些時(shí)候量變會(huì)導(dǎo)致質(zhì)變。對(duì)于我們來(lái)講,要兩手抓兩手硬——既要在算法上創(chuàng)新,也要在算力上提升,這樣才可以拓寬應(yīng)用面。
舉例,我們拿著一個(gè)玉米的模型,想要去計(jì)算北京周邊種了多少玉米,可這樣的數(shù)據(jù)誰(shuí)會(huì)關(guān)心?似乎沒(méi)有人關(guān)心北京周邊種了多少玉米。但如果把數(shù)據(jù)擴(kuò)展到全球或者是中國(guó),像中國(guó)種了多少的玉米,或是全球種了多少玉米,這樣的問(wèn)題就有很多公司關(guān)心,例如期貨、基金、農(nóng)糧公司。不斷提高算力,會(huì)帶來(lái)更大的應(yīng)用面,而這些應(yīng)用面在小范圍內(nèi)是無(wú)法挖掘到的,這就是量變到質(zhì)變。
關(guān)于算法
在遙感衛(wèi)星數(shù)據(jù)的基礎(chǔ)上能開(kāi)發(fā)出很多的算法,有些算法甚至是以前從來(lái)沒(méi)想過(guò)的。例如滑雪——通過(guò)遙感衛(wèi)星監(jiān)測(cè)雪的厚度,并把這個(gè)數(shù)據(jù)交給滑雪愛(ài)好者,讓他們?cè)诨┣翱梢韵瓤匆幌卵﹫?chǎng)的雪有多厚,幫助他們做出正確的決策。這說(shuō)起來(lái)挺簡(jiǎn)單的,而實(shí)際做起來(lái)時(shí),不僅有商業(yè)模式的問(wèn)題,也有技術(shù)上的問(wèn)題。而目前,更多的是技術(shù)問(wèn)題。
龐大的數(shù)據(jù)量(趙盈 攝)
從農(nóng)業(yè)延伸更廣闊的應(yīng)用
我們回到農(nóng)業(yè)大問(wèn)題。遙感在農(nóng)業(yè)中的應(yīng)用,其實(shí)在美國(guó)已經(jīng)做得比較成熟了,特別是美國(guó)比較代表性的公司Farmlogs ,基于NDVI指數(shù),在農(nóng)田領(lǐng)域做得比較成熟,在美國(guó)擁有三分之一以上的市場(chǎng)。
而這樣的應(yīng)用場(chǎng)景,中國(guó)是否可以復(fù)制?從衛(wèi)星遙感、衛(wèi)星時(shí)空大數(shù)據(jù)角度而言,它的優(yōu)勢(shì)在于大范圍地監(jiān)測(cè)、大范圍地去回答一些比較大的問(wèn)題。在農(nóng)場(chǎng)級(jí)別,能做,但不是一個(gè)優(yōu)勢(shì)點(diǎn)。
可能一提到農(nóng)業(yè),大家就想到農(nóng)場(chǎng),實(shí)際上農(nóng)業(yè)并不僅僅停留在農(nóng)場(chǎng),農(nóng)業(yè)有很多的產(chǎn)業(yè)。
比如,作為一個(gè)農(nóng)場(chǎng),要采購(gòu)農(nóng)藥、化肥和種子。我們是否可以把宏觀的數(shù)據(jù),比如說(shuō)作物分類的數(shù)據(jù)提供給這樣的農(nóng)資公司,讓他們進(jìn)行市場(chǎng)決策?買了農(nóng)資之后,他可能會(huì)去貸款,找農(nóng)村金融、農(nóng)村信貸,或者是流轉(zhuǎn)土地。而偏金融的行業(yè)(在拿到農(nóng)業(yè)相關(guān)的宏觀數(shù)據(jù)后)是否可以做一些跟風(fēng)控相關(guān)的東西?比如查看一個(gè)農(nóng)戶若干年的種植情況,判斷他是否認(rèn)真種地,從而推斷他的信用。
再比如,農(nóng)場(chǎng)發(fā)生災(zāi)害之后。大多數(shù)農(nóng)戶都購(gòu)買了農(nóng)業(yè)保險(xiǎn),而農(nóng)業(yè)保險(xiǎn)公司要去定損?,F(xiàn)在的方法是派人到地里面去,拿著GPS在地里測(cè)。那么,這個(gè)定損過(guò)程能否(通過(guò)衛(wèi)星遙感大數(shù)據(jù)產(chǎn)品來(lái))減少保險(xiǎn)公司的人力?是否可以通過(guò)更大范圍的數(shù)據(jù)洞察,幫助再保險(xiǎn)更好的服務(wù)于農(nóng)業(yè)保險(xiǎn),從而更好的服務(wù)農(nóng)戶?
?。ㄒ陨希┻@些是農(nóng)場(chǎng)的上游。在(農(nóng)業(yè))下游,東西種出來(lái)之后得賣,賣到哪里去?期貨市場(chǎng)就是比較好的利用領(lǐng)域。通過(guò)對(duì)產(chǎn)量的預(yù)測(cè),比如說(shuō)對(duì)全美玉米的產(chǎn)量或大豆產(chǎn)量進(jìn)行預(yù)測(cè),可以很好地幫助期貨、基金來(lái)預(yù)判一些風(fēng)險(xiǎn)。同樣,對(duì)于大宗貿(mào)易商或飼料廠商等會(huì)從期貨市場(chǎng)購(gòu)買很多農(nóng)產(chǎn)品的公司,通過(guò)產(chǎn)量預(yù)測(cè)或者是作物的種植面積,能幫助他們減少一些風(fēng)險(xiǎn)。
比如種植面積,這是我們的一個(gè)案例:
作物分類識(shí)別案例
通過(guò)底層技術(shù)結(jié)合一些業(yè)務(wù)邏輯,可以開(kāi)發(fā)出比較有意思的模塊。其中一個(gè)底層技術(shù)是,針對(duì)地球上面每一個(gè)像素來(lái)判斷它上面種的是什么作物。這個(gè)技術(shù)沒(méi)有我現(xiàn)在說(shuō)的這么成熟,但它是現(xiàn)在我們研發(fā)的方向。如果可以把所有的像素點(diǎn)全部加起來(lái)的話,就可以得到美國(guó)全國(guó)的玉米種植面積。這個(gè)種植面積如果可以比美國(guó)農(nóng)業(yè)部USDA(United States Department of Agriculture)提前發(fā)布的話,那就是對(duì)市場(chǎng)而言很有價(jià)值的信息。
那么,通過(guò)作物識(shí)別和作物分類模塊,是否也可以結(jié)合其它的模塊(拓展新的應(yīng)用領(lǐng)域)?比如通過(guò)作物識(shí)別,結(jié)合衛(wèi)星來(lái)監(jiān)測(cè)洪水。
如果可以把水稻的種植分布和洪水結(jié)合起來(lái)的話,(這些價(jià)值數(shù)據(jù))可以提供給農(nóng)資企業(yè),讓他們知道這里水稻受災(zāi)之后可能需要補(bǔ)種,是不是要往這些地方銷售一些產(chǎn)品;或者提供給保險(xiǎn)公司,(讓他們)在這些方面進(jìn)行比較精準(zhǔn)的洪水定保。
這是我們想要做的方向和創(chuàng)新,通過(guò)底層技術(shù)和其它技術(shù)結(jié)合起來(lái),然后結(jié)合業(yè)務(wù)邏輯,做有意思的事情。
關(guān)于算力方面,也有兩個(gè)比較簡(jiǎn)單的案例。這是我們處理的10m分辨率的全國(guó)耕地分布圖:
耕地分布圖
在這上面可以在10m分辨率下清楚地看到鄉(xiāng)間的小路。中國(guó)有19億畝耕地,每個(gè)像素是100平方米,有興趣可以簡(jiǎn)單算下需要對(duì)多少像素進(jìn)行計(jì)算才可以得到這樣一張圖。
這是美國(guó)地區(qū)產(chǎn)量的預(yù)測(cè):
做這張圖差不多需要處理60億個(gè)像素。即使在里面用到AI的模型,如果一秒鐘可以計(jì)算一個(gè)像素今年的產(chǎn)量是多少,那么對(duì)于20多億個(gè)像素,計(jì)算時(shí)間也會(huì)超過(guò)60年,這是算力的問(wèn)題。很多時(shí)候,會(huì)忽略了算力對(duì)于整個(gè)空間大數(shù)據(jù)產(chǎn)業(yè)在應(yīng)用時(shí)的重要性。
歸根結(jié)底都是技術(shù)的問(wèn)題
回歸到時(shí)空大數(shù)據(jù)的應(yīng)用,我們認(rèn)為,和用戶業(yè)務(wù)場(chǎng)景、業(yè)務(wù)邏輯結(jié)合過(guò)程中,要深入的理解(用戶所在的)這個(gè)行業(yè)——(如何深入另一個(gè)行業(yè))這是很大的問(wèn)題。同樣,算法和算力的創(chuàng)新,也是很大的問(wèn)題。但歸根到底,在目前階段,用戶的需求其實(shí)是相對(duì)比較清晰的。往往很多時(shí)候是技術(shù)上的無(wú)法實(shí)現(xiàn)——要么是因?yàn)樗惴ㄗ霾坏?,要么因?yàn)樗懔Σ恍?,無(wú)法做到大規(guī)模的實(shí)現(xiàn)。目前遇到的問(wèn)題,歸根到底都是技術(shù)問(wèn)題。經(jīng)常有朋友跟我說(shuō),在這個(gè)行業(yè)市場(chǎng)是需要被教育的,但我并不是這樣認(rèn)為的。我覺(jué)得需要被教育的我們自己,我們需要更深入了解行業(yè),以更虔心的研發(fā)技術(shù)。比如用戶提出要95%的精度,我們不可能教育用戶說(shuō)你其實(shí)需要90%就行了,(反而是)我們要力爭(zhēng)做到95%以上。要在這個(gè)行業(yè)建立認(rèn)知,在技術(shù)上不停發(fā)展的話,我們是為整個(gè)行業(yè)提供基于時(shí)空大數(shù)據(jù)的基礎(chǔ)數(shù)據(jù),為其它行業(yè)進(jìn)行賦能,而不是取代其它的行業(yè)去做(那些行業(yè))它們本身做的事情。要么幫助他們(其它行業(yè)的從業(yè)者)做市場(chǎng)的決策,要么增加一種新特性吸引更多的C端用戶,要么提供市場(chǎng)的洞察,獲取更多的leads。這是時(shí)空大數(shù)據(jù)產(chǎn)業(yè),去做的事情。
以上就是一些不成熟的分享意見(jiàn),希望各位專家多多指正,這是我們的公眾號(hào),歡迎關(guān)注:
時(shí)空大數(shù)據(jù)——物理世界的數(shù)據(jù)引擎
盡在“大地量子”
歡迎長(zhǎng)按二維碼關(guān)注我們喲~
{{item.content}}