中國(guó)測(cè)繪地理信息學(xué)會(huì)2017年學(xué)術(shù)年會(huì)暨第十二次全國(guó)會(huì)員代表大會(huì)今日在南京舉辦。本次大會(huì)以“創(chuàng)新驅(qū)動(dòng),跨越發(fā)展”為主題,邀請(qǐng)測(cè)繪地理信息科技界專家、院士、學(xué)者齊聚一堂,呈現(xiàn)精彩特邀報(bào)告,并舉辦多個(gè)垂直領(lǐng)域分論壇。
會(huì)上,北京超圖軟件股份有限公司總裁宋關(guān)福先生作了題為《全面擁抱大數(shù)據(jù)的GIS基礎(chǔ)軟件技術(shù)》的報(bào)告。
以下為演講內(nèi)容(內(nèi)容未經(jīng)本人核實(shí)):
宋關(guān)福:謝謝主持人,各位同志,大家下午好!今天大會(huì)的航班已經(jīng)延誤了十幾分鐘了,剛才在陳總的努力下追回來(lái)一點(diǎn)。我剛才把電腦打開(kāi)刪了一些頁(yè)面,希望能夠稍微早一點(diǎn)結(jié)束。
今天我們有很多的院士專家進(jìn)行了很精彩的報(bào)告,其中有不少的報(bào)告已經(jīng)開(kāi)始在講人工智能,講深度學(xué)習(xí)了。接下來(lái)我今天的報(bào)告是跟大家講一個(gè)稍微有點(diǎn)過(guò)時(shí)的技術(shù)——大數(shù)據(jù)。為什么這么說(shuō)呢?這個(gè)數(shù)據(jù),我們這些技術(shù)的發(fā)展,我們看一個(gè)工具,經(jīng)常會(huì)用這個(gè)光環(huán)曲線來(lái)看它的發(fā)展所處在的階段,我們看到三維GIS已經(jīng)在復(fù)蘇期了,而云GIS也已經(jīng)在復(fù)蘇期,我們今天講的大數(shù)據(jù)GIS正在進(jìn)入低谷期,所以我說(shuō)它有點(diǎn)過(guò)時(shí),就是說(shuō)它已經(jīng)過(guò)了最熱的時(shí)候。
今天我們聽(tīng)到很多關(guān)于人工智能的故事,人工智能,在IT領(lǐng)域的人工智能已經(jīng)過(guò)了頂峰,但是GIS的人工智能剛剛進(jìn)入一個(gè)萌芽,可能在未來(lái)一到兩年會(huì)進(jìn)入一個(gè)探索的熱潮。
我們?cè)谧母魑欢家呀?jīng)知道海量的空間數(shù)據(jù)并不等于大數(shù)據(jù),大數(shù)據(jù)不是因?yàn)樗鼉H僅是大才是叫大數(shù)據(jù)。我們產(chǎn)生一個(gè)新的問(wèn)題,我們已有的海量的經(jīng)典的空間數(shù)據(jù),如果說(shuō)我把它用我們大數(shù)據(jù)相關(guān)的一些技術(shù),比如說(shuō)分布式存儲(chǔ)、分布式計(jì)算框架來(lái)管理、處理和分析,這些數(shù)據(jù)是不是就變成大數(shù)據(jù)了呢?我覺(jué)得也不是。你可以用大數(shù)據(jù)的技術(shù)去管理它們,但是這些數(shù)據(jù)的本身性質(zhì)還沒(méi)有改變,它還是我們經(jīng)典的空間數(shù)據(jù)。為什么呢?因?yàn)槲覀円髷?shù)據(jù)的幾個(gè)特征來(lái)看,這個(gè)是來(lái)自IBM的一個(gè)說(shuō)法,有五個(gè)V,我這里引用四個(gè)V,第一個(gè)是體量大、第二個(gè)是種類多,第三個(gè)是變化快,第四個(gè)是價(jià)值密度低。體量大、變化快意味著我們需要更快的軟件處理性能;種類多意味著我們的分析模型可能不夠,我們不光是廠商提供的模型,我們還要自己去定義更多的模型;而價(jià)值密度低意味著大數(shù)據(jù)是貧礦,就意味著冶煉的難度大,計(jì)算量大。
人家都講大數(shù)據(jù)有價(jià)值,你這里說(shuō)它是貧礦,貧礦有挖掘價(jià)值嗎?我覺(jué)得數(shù)據(jù)的價(jià)值可以有這樣的一個(gè)公式來(lái)計(jì)算,等于體量×價(jià)值密度-挖掘分析的成本,如果說(shuō)我們的體量夠大,價(jià)值密度就大,也能夠挖掘分析的成本,所以這樣大數(shù)據(jù)才有價(jià)值,所以大數(shù)據(jù)核心的價(jià)值在于計(jì)算,在于分析方法。當(dāng)方法提升了之后,大數(shù)據(jù)才有價(jià)值。
我們從IT的另外一個(gè)工具來(lái)看空間大數(shù)據(jù),DIKW金字塔,這個(gè)模型里面數(shù)據(jù)Data是最底層的,是記錄原始的素材。第二個(gè)是信息,將加工處理后得到的邏輯的數(shù)據(jù),第三個(gè)是數(shù)據(jù),原始素材進(jìn)行處理之后得到的一個(gè)記錄,就得到一個(gè)智慧,這個(gè)就是IDKW金字塔。我們空間大數(shù)據(jù)就是基本的原始素材,而我們管理好的測(cè)繪4D產(chǎn)品是信息了,是從原始數(shù)據(jù)當(dāng)中提煉出來(lái)的有組織的有邏輯的數(shù)據(jù)。所以說(shuō)我們大數(shù)據(jù)挖掘的意義就在于把它從DIKW金字塔底層往上移的過(guò)程,也就是從數(shù)據(jù)里面提煉知識(shí)的過(guò)程,這就是大數(shù)據(jù)挖掘的意義。所以我們千萬(wàn)不要把在家里服務(wù)器上存的數(shù)據(jù)庫(kù)貼上大數(shù)據(jù)的標(biāo)簽,因?yàn)樗稽c(diǎn)不增值,反而低估了你的價(jià)值。
空間大數(shù)據(jù)的內(nèi)涵,我們參考一下對(duì)大數(shù)據(jù)的定義,我們也可以定義一下,它就是帶有或者隱含有空間位置的,具有這四個(gè)價(jià)值特點(diǎn)的常規(guī)的軟件工具無(wú)法處理的,需要更先進(jìn)的技術(shù)才能夠讓它具有更強(qiáng)的決策力、洞察力、流程優(yōu)化能力的數(shù)字資產(chǎn),這就是空間大數(shù)據(jù)的內(nèi)涵和定義。
外延是什么呢?就包括我們看到的所謂擁有最多的手機(jī)信令的數(shù)據(jù),導(dǎo)航的軌跡、社交媒體,你發(fā)微博發(fā)微信后臺(tái)服務(wù)器也知道你大致的位置。我們?cè)诎俣人阉骼锩嫒ニ阉麝P(guān)鍵詞,比如說(shuō)“感冒藥”什么東西,后臺(tái)也知道你這個(gè)對(duì)應(yīng)的位置在什么位置發(fā)生的,等等等等。包括水電表數(shù)據(jù),這些都是我們的大數(shù)據(jù),而不是躺在家里面的測(cè)繪產(chǎn)品。
如何實(shí)現(xiàn)空間大數(shù)據(jù)的價(jià)值呢?我們有大數(shù)據(jù)還不夠,我們還需要有工具,有軟件。今天下午古德查德(Goodchild)教授也提到了GIS是工具,沒(méi)有這個(gè)工具這個(gè)數(shù)據(jù)也不能產(chǎn)生價(jià)值。同時(shí)我們還需要一些分析模型,只有這三個(gè)結(jié)合起來(lái),才能夠讓大數(shù)據(jù)去產(chǎn)生價(jià)值。
大數(shù)據(jù)GIS軟件,剛才提到了它的意義何在呢?我們研發(fā)一個(gè)這樣的軟件目的在于可以去降低大家挖掘大數(shù)據(jù)的技術(shù)門(mén)檻。在此之前能夠挖掘大數(shù)據(jù)的單位都是什么?百度、高德、騰訊,包括一些很有實(shí)力的單位或者一些比較有實(shí)力的大學(xué)研究機(jī)構(gòu)。我們很多單位有數(shù)據(jù)可能沒(méi)法讓它發(fā)揮價(jià)值,所以我們就需要研究這樣的一些工具軟件,把空間大數(shù)據(jù)的一些基本的算法、公共的這些功能都封裝好,讓更多的單位可以參與大數(shù)據(jù)的淘金。另外我們降低挖掘成本,我們有大數(shù)據(jù)的時(shí)候可以降低成本。剛才講數(shù)據(jù)的公式后面減掉的是成本,成本越低你的價(jià)值越大,這就是我們作為GIS軟件研發(fā)單位做這個(gè)工具的意義。
我們就提出全面擁抱大數(shù)據(jù)的GIS技術(shù),包括哪些內(nèi)容呢?包括這兩個(gè)柱子,一個(gè)是空間大數(shù)據(jù)技術(shù),這個(gè)是專門(mén)針對(duì)空間大數(shù)據(jù)的。另外一根柱子是傳統(tǒng)GIS傳統(tǒng)的功能進(jìn)行分布式重構(gòu),它重構(gòu)的目的是為了解決傳統(tǒng)的數(shù)據(jù)或者針對(duì)經(jīng)典的空間數(shù)據(jù)來(lái)的。同時(shí)我們還需要兩個(gè)支撐的技術(shù),一個(gè)是云GIS的技術(shù),因?yàn)闆](méi)有云的大數(shù)據(jù)是空中樓閣,還有需要一個(gè)跨平臺(tái)的GIS技術(shù)。
我們先來(lái)介紹一下,從底往上介紹,先介紹支撐技術(shù)云GIS技術(shù),云計(jì)算作為計(jì)算資源層,可以支撐上面大數(shù)據(jù)的處理,所以云GIS也就是大數(shù)據(jù)GIS支撐技術(shù)。我們可以歸結(jié)為4+2,4是四大服務(wù)器軟件,基于微服務(wù)架構(gòu)的GIS應(yīng)用服務(wù)器,要有一個(gè)微服務(wù)的架構(gòu)去重新構(gòu)建它。這個(gè)不是整個(gè)軟件啟動(dòng)起來(lái),是每一個(gè)服務(wù)的模塊都可以單獨(dú)啟動(dòng),這樣可以節(jié)省更多的資源。
第二個(gè)是云GIS門(mén)戶;第三個(gè)是需要一個(gè)分布式加速器,叫GIS分發(fā)服務(wù)器,在一個(gè)多層級(jí)架構(gòu)的時(shí)候可以通過(guò)它前置來(lái)降低對(duì)網(wǎng)絡(luò)帶寬要求提高性能。第四個(gè)是云GIS服務(wù)管理器。
兩大技術(shù),一個(gè)是支持虛擬化,還有一個(gè)是支持容器技術(shù),這是最新云的技術(shù),Docker,這里今天沒(méi)有時(shí)間,可能就不講了。是性能更高,更節(jié)約資源的新一代云的技術(shù)。第二個(gè)是云端互聯(lián)技術(shù),可以把各端無(wú)縫連接起來(lái)的這樣一個(gè)技術(shù)。
大數(shù)據(jù)技術(shù)棧很多技術(shù)都原生于Linux,這些技術(shù)都在Linux社區(qū)里面去產(chǎn)生的,而且Linux具有更高性能更穩(wěn)定的效果,所以我們?cè)赪indows上研究只是做一個(gè)試用,可能真正生產(chǎn)的時(shí)候不會(huì)在Windows上做,否則的話效率可能不是更好。
我們講效率問(wèn)題,這個(gè)重構(gòu)是針對(duì)空間大數(shù)據(jù)的,不是大數(shù)據(jù)的。因?yàn)槲覀儌鹘y(tǒng)GIS應(yīng)用當(dāng)中的海量數(shù)據(jù)已經(jīng)對(duì)我們的GIS形成了很大的沖擊和挑戰(zhàn),現(xiàn)在我們都用瓦片形成用戶體驗(yàn),但是瓦片數(shù)量巨大,很難管理,復(fù)制重建要去分發(fā)非常痛苦。再一個(gè),我們矢量數(shù)據(jù)里面,當(dāng)單一一個(gè)表記錄數(shù)過(guò)億的時(shí)候,訪問(wèn)性能急劇下降。所以海量數(shù)據(jù)空間分析也非常費(fèi)時(shí)間,不是一個(gè)線性增長(zhǎng)的,它的數(shù)據(jù)量增長(zhǎng)一倍,它的時(shí)間可能要增加十倍,這是讓我們傳統(tǒng)的GIS應(yīng)用在數(shù)據(jù)量增長(zhǎng)的情況下面臨的一個(gè)新的挑戰(zhàn)。比如說(shuō)我們做了一個(gè)例子,我們做Overlay,當(dāng)有1億個(gè)的時(shí)候需要10個(gè)小時(shí)600多分鐘,這樣完成領(lǐng)導(dǎo)交給的一個(gè)任務(wù)就非常痛苦,10個(gè)小時(shí)。所以我們需要對(duì)傳統(tǒng)GIS已有的功能進(jìn)行分布式重構(gòu),就源于大數(shù)據(jù)??臻g數(shù)據(jù)處理進(jìn)行分布式存儲(chǔ),還有對(duì)空間數(shù)據(jù)算法進(jìn)行分布式改造等等。這是適用于經(jīng)典空間信息的分布式存儲(chǔ)技術(shù),包括Postgres—XL,包括MongoDB,還有HDFS,上面的查詢能力更強(qiáng),下面的分布式存儲(chǔ)能力更強(qiáng),這個(gè)我們要根據(jù)情況選擇使用。
分布式空間分析與數(shù)據(jù)處理有那些?我們進(jìn)行空間分析,疊加分析、緩沖區(qū)分析、空間查詢,包括數(shù)據(jù)處理,創(chuàng)建索引、復(fù)制數(shù)據(jù)集、數(shù)據(jù)集裁剪等等,我們需要改造它提高它的性能。
舉個(gè)例子,剛才那個(gè)傳統(tǒng)的算法要600分鐘,我們改造之后的分布式算法只要11分鐘,性能提高了10倍。這是以某省測(cè)繪局?jǐn)?shù)據(jù)疊加分析,用32CPU的一個(gè)很好的計(jì)算機(jī),用了4個(gè)節(jié)點(diǎn)的CPU,機(jī)器更差了,數(shù)據(jù)提高20倍,這就是可以讓我們性能提高這多。以前我們做算法的程序員很痛苦,提高15%就很痛苦了,現(xiàn)在提高10倍。
這個(gè)是空間大數(shù)據(jù)的存儲(chǔ),以前我們經(jīng)典的存儲(chǔ)引擎有文件類,有數(shù)據(jù)庫(kù)的,也可以有Web的,在新的情況下我們?cè)黾恿丝臻g大數(shù)據(jù)引擎,包括HDFS,MongoDB等等,以后還會(huì)有新的方法增加進(jìn)來(lái),這樣就可以管理原來(lái)我們無(wú)法管理的空間大數(shù)據(jù)。
第二個(gè)是數(shù)據(jù)的空間分析,我們這里提供了這樣的一些空間分析,包括模式分析、OD分析,熱點(diǎn)分析,密度分析。還有各種數(shù)據(jù)匯總,聚合分析等等,有18個(gè)框架來(lái)處理的。
舉三個(gè)例子來(lái)看,第一個(gè)是OD分析,計(jì)算各起點(diǎn)和終點(diǎn)間的通行量,比如說(shuō)住在北京天通苑的人都在哪兒上班去了,在國(guó)貿(mào)上班的人都是從哪個(gè)空間來(lái)的。這是在重慶做的一個(gè)例子,右下方的點(diǎn)這個(gè)地方住的人都去哪兒上班了,就知道在各個(gè)地區(qū)的量是多少。反過(guò)來(lái),從目的地的點(diǎn)也可以知道他是從哪兒來(lái)的,這就是OD分析。這種OD分析完了之后可以做什么呢?做交通規(guī)劃,道路的規(guī)劃。
這個(gè)是基于地鐵刷卡記錄的,天通苑早上都往上走,國(guó)貿(mào)往里走,這些從哪兒來(lái)的都可以分析出來(lái)。到了下午6點(diǎn)以后,天通苑往里走,國(guó)貿(mào)往里走,到了9點(diǎn)以后基本上差不多了,這是主要的流動(dòng)過(guò)程等等,都可以分析出來(lái)。
第二個(gè)介紹大數(shù)據(jù)空間分析之熱點(diǎn)分析,異常的東西都讓人感興趣,比如說(shuō)特別高的地方和特別低的地方,這里熱點(diǎn)分析就分析熱點(diǎn)和冷點(diǎn),對(duì)點(diǎn)要素進(jìn)行統(tǒng)計(jì)學(xué)計(jì)算,尋找熱點(diǎn)和冷點(diǎn)。
我們看它的一個(gè)分析結(jié)果,把全球的航班軌跡的熱點(diǎn)分析,我們可以看出經(jīng)濟(jì)最發(fā)達(dá)的地區(qū)在哪兒,美國(guó)的東海岸、歐洲,還有中國(guó),這是航班的熱點(diǎn)分析。
一個(gè)是密度分析,它不僅僅計(jì)算區(qū)域內(nèi)的影響,還考慮周邊的影響,它的算法就跟剛才有所不同。我們可以看這個(gè)例子,這是一個(gè)船,貨輪軌跡的密度分析,我們可以看到中國(guó)東部這個(gè)密度遠(yuǎn)遠(yuǎn)高于歐洲和美洲,所以中國(guó)崛起的速度還是蠻快的,從這個(gè)上面可以看出來(lái)。這是放大的一個(gè)情況,這是一些右邊性的質(zhì)量的多邊圖,不同的顏色是不同的值。
這是商業(yè)選址的分析,女人的衣柜里永遠(yuǎn)少一件衣服,所以買(mǎi)衣服是她們的天性。這是上海關(guān)心女裝的人在哪兒分布,你要賣女裝在哪兒開(kāi)店,這張圖可以告訴你,這是用上網(wǎng)的數(shù)據(jù)來(lái)分析的。
再有就是聚合分析,完全不考慮邊界外的影響,只考慮區(qū)域內(nèi)統(tǒng)計(jì)的情況。我們可以看到右邊是公安的戶籍人口,這個(gè)區(qū)域里面有多少戶籍人口。左邊是手機(jī)上網(wǎng)大數(shù)據(jù)挖掘,10點(diǎn)鐘的時(shí)候這個(gè)人口分布情況,這個(gè)是典型的。
我們看剛才有聚合分析、密度分析,看起來(lái)很像,其實(shí)它是有差別的,周圍有一個(gè)較高值包圍,而聚合分析沒(méi)有這個(gè)情況,是一個(gè)明顯的分散。這是天上飛的飛機(jī)在不同的格子里面有多少,這可以放大。
這是重慶的一個(gè)出租車早上早高峰出租車下車點(diǎn)的一個(gè)聚合分析結(jié)果圖,用三維來(lái)表達(dá),柱子高的地方是這個(gè)地方下車的人多。這個(gè)是大數(shù)據(jù)的空間分析。
我們?cè)賮?lái)看流數(shù)據(jù)的實(shí)時(shí)處理,其實(shí)大數(shù)據(jù)的很多特點(diǎn)就是數(shù)據(jù)像河流一樣流過(guò)來(lái),順序、快速、大量、持續(xù)到達(dá),我們需要用一個(gè)工具來(lái)處理它。我們上面一個(gè)基于空間位置的SupcrMap Streaming處理,這個(gè)我們非常關(guān)心時(shí)間。這個(gè)我們提出一些流數(shù)據(jù)實(shí)時(shí)處理的算法,實(shí)時(shí)動(dòng)態(tài)判定哪些目標(biāo)落入圍欄,實(shí)時(shí)判斷目標(biāo)有沒(méi)有進(jìn)入哪個(gè)范圍,比如航班有沒(méi)有離開(kāi)機(jī)場(chǎng),這是一個(gè)全球的航班,黃點(diǎn)就是進(jìn)入機(jī)場(chǎng)附近,藍(lán)色的點(diǎn)還在路上飛行,可以不斷地計(jì)算,不斷地輸出結(jié)果,高告警告警,該通知通知。
還有實(shí)時(shí)路況,你分析出來(lái)也可以發(fā)布實(shí)時(shí)路況。這是重慶綜合市情系統(tǒng)引用交通規(guī)劃院的實(shí)時(shí)路況的算法來(lái)進(jìn)行實(shí)時(shí)的處理,實(shí)時(shí)的分發(fā)結(jié)果。
最后一個(gè)是大數(shù)據(jù)空間可視化,其實(shí)前面我們已經(jīng)看到很多可視化,其實(shí)沒(méi)有可視化這些分析功能都是感覺(jué)不到的。左邊是我們剛剛提到一部分的大數(shù)據(jù)空間分析算法,右邊是空間可視化技術(shù),熱力圖可以表達(dá)聚合分析結(jié)果和熱點(diǎn)分析結(jié)合和密度分析結(jié)果,矢量也可以表達(dá)這三個(gè),不同的圖表達(dá)不同的分析結(jié)果。
我們還可以給大家展示一些更炫酷的連線圖,這是重慶出租車的流量圖,可以用這個(gè)來(lái)表達(dá)。也可以換一種方式來(lái)展示,這是在一個(gè)三維城市的里面去展示出租車實(shí)時(shí)的一個(gè)動(dòng)態(tài)的流動(dòng)的情況,我們甚至還可以放大,看到這些車流在樓宇之間去流動(dòng),這個(gè)技術(shù)發(fā)展很快。
這是北京T3航站樓飛機(jī)起飛降落的,飛機(jī)不是直線下來(lái),都是轉(zhuǎn)個(gè)彎,這都是連線圖的展示。還有一些高性能的目標(biāo)動(dòng)態(tài)可視化,比方說(shuō)我們要監(jiān)控天上幾千架飛機(jī),我們的程序員后來(lái)說(shuō)幾萬(wàn)架我們也可以,今年幾十萬(wàn)個(gè)動(dòng)態(tài)目標(biāo)也可以在屏幕上展示,當(dāng)然這個(gè)展示無(wú)意義,但這是程序員追求的目標(biāo),這是50萬(wàn)個(gè)目標(biāo)。
我們可以監(jiān)控全球貨輪實(shí)時(shí)運(yùn)行的情況,當(dāng)然這里可以看到亂碼,這是航海必須經(jīng)過(guò)的地方。這是高性能的一個(gè)可視化技術(shù),還有一些不介紹了,都刪掉了。
空間大數(shù)據(jù)技術(shù),我們簡(jiǎn)單介紹一下,大數(shù)據(jù)的空間分析技術(shù)、流數(shù)據(jù)實(shí)時(shí)處理技術(shù)以及大數(shù)據(jù)空間可視化技術(shù),這是針對(duì)空間大數(shù)據(jù)的這樣一些技術(shù)。還有一個(gè)是數(shù)據(jù)清洗,原始數(shù)據(jù)進(jìn)來(lái)有很多你不希望存儲(chǔ)的冗余數(shù)據(jù),還有一些范圍錯(cuò)誤數(shù)據(jù),還有一些飛點(diǎn)數(shù)據(jù)、道路外數(shù)據(jù)以及坐標(biāo)數(shù)據(jù)缺失的,不同數(shù)據(jù)源的清洗方法和算法也不一樣。清洗之后才可以進(jìn)行存儲(chǔ),進(jìn)行進(jìn)一步的精加工或者做挖掘分析。
大數(shù)據(jù)GIS架構(gòu),,最底層是來(lái)存儲(chǔ)數(shù)據(jù)。第二步是空間大數(shù)據(jù)組件,把空間大數(shù)據(jù)處理的這些算法和功能包了一個(gè)組件,包括數(shù)據(jù)處理,包括空間大數(shù)據(jù)分析的。在服務(wù)器端,去調(diào)用組件的功能來(lái)實(shí)現(xiàn),邊上是管理器,因?yàn)槲覀冃枰屗鼇?lái)調(diào)用這些計(jì)算和服務(wù)。上面就是各種端的軟件,都可以通過(guò)調(diào)用服務(wù)器功能來(lái)實(shí)現(xiàn)大數(shù)據(jù)可視化的能力,是在端內(nèi)來(lái)實(shí)現(xiàn)的。這是一個(gè)大數(shù)據(jù)GIS的一個(gè)粗略的框架。
但是大數(shù)據(jù)GIS系列軟件之間的關(guān)系,底下是云計(jì)算資源,中間是18個(gè)組件框架,上面是服務(wù)器GIS來(lái)調(diào)用這些組件來(lái)完成工作,是端去調(diào)用服務(wù)器來(lái)交付,實(shí)現(xiàn)可視化,邊上是這個(gè)管理器。這是大數(shù)據(jù)GIS幾個(gè)軟件之間的關(guān)系,核心的功能實(shí)際上在組件里實(shí)現(xiàn)的,而組件又跑到18個(gè)框架里去實(shí)現(xiàn)。
我們回顧一下全面擁抱大數(shù)據(jù)的GIS技術(shù),包括空間大數(shù)據(jù)存儲(chǔ)管理、大數(shù)據(jù)空間分析、六數(shù)據(jù)實(shí)時(shí)處理、大數(shù)據(jù)空間可視化。另外一個(gè)是傳統(tǒng)GIS的分布式重構(gòu),包括海量空間數(shù)據(jù)分布式存儲(chǔ)、空間數(shù)據(jù)處理分布式及改造和空間分析分布式計(jì)算改造。再有兩個(gè)是跨平臺(tái)GIS技術(shù),這是兩個(gè)技術(shù)框架。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于擁有大數(shù)據(jù),而在于我們有沒(méi)有擁有大數(shù)據(jù)挖掘和加工的能力,如果有這個(gè)技術(shù)別人的大數(shù)據(jù)你也可以去發(fā)揮價(jià)值。我沒(méi)有大數(shù)據(jù),別人的大數(shù)據(jù)不給我怎么辦?因?yàn)楹芏啻髷?shù)據(jù)涉及到隱私,比如打個(gè)電話到什么位置他可能不愿意給我們,這個(gè)時(shí)候怎么辦?我們就把冶煉的裝備拉到礦山里去。也就是說(shuō)你把這個(gè)數(shù)據(jù)分析的工具軟件開(kāi)發(fā)好,這個(gè)是我們追求不求所有,但求所用,這樣的一個(gè)目標(biāo)去協(xié)調(diào)數(shù)據(jù)資源的時(shí)候就好辦了。
舉個(gè)例子,在時(shí)空信息云與大數(shù)據(jù)平臺(tái),有些部門(mén)的數(shù)據(jù),比如說(shuō)自來(lái)水公司、燃?xì)夤?、公交公司、出租車公司,這些公司規(guī)模比較小,我們可以跟他協(xié)調(diào),我們把我們的地圖服務(wù)發(fā)給他,把他的數(shù)據(jù)交換出來(lái)處理,挖掘分析出結(jié)果再放到我們的平臺(tái)上再提供給其他部門(mén)。比如說(shuō)通訊運(yùn)營(yíng)商、電網(wǎng)、互聯(lián)網(wǎng)私有云,他們的數(shù)據(jù)不可以交給我們,我們可以把我們的服務(wù)提供給他,讓他進(jìn)行分析,用我們的地圖去換大數(shù)據(jù)或者大數(shù)據(jù)分析結(jié)果。
我們?cè)倩剡^(guò)頭來(lái)看這個(gè)光環(huán)曲線,不要再頂峰的時(shí)候因?yàn)闀r(shí)髦而加入,有可能投了很多錢(qián)沒(méi)有產(chǎn)生結(jié)果,因?yàn)槟莻€(gè)技術(shù)不成熟,大家期望又很高,結(jié)果達(dá)不到預(yù)期的期望,所以大家會(huì)失望,會(huì)進(jìn)入一個(gè)低谷期。同時(shí)也別因過(guò)時(shí)而錯(cuò)過(guò),這個(gè)時(shí)候我們才該搞大數(shù)據(jù),因?yàn)槲覀兪钱a(chǎn)業(yè)單位,我們是生產(chǎn)單位。所以我們?cè)诖髷?shù)據(jù)滑向低谷期的時(shí)候,就是該反彈了,就是在座的各位該介入大數(shù)據(jù)的時(shí)候了。
所以我們一起擁抱大數(shù)據(jù),擁抱新社會(huì)。謝謝大家!
{{item.content}}