777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

分享
Scan me 分享到微信

高峰對話:數(shù)據(jù)挖掘與可視化

在6月12日下午的位置大數(shù)據(jù)專場中,最后一個環(huán)節(jié)是高峰對話。主持人:3sNews中國地理信息產(chǎn)業(yè)網(wǎng)執(zhí)行主編張凱,嘉賓介紹:北京大學“百人計劃”研究員袁曉如、北京超圖軟件股份有限公司地圖匯業(yè)務部總監(jiān)王天寶,北京捷泰天域信息技術有限公司GeoQ位置智能咨詢部總監(jiān)陳建英。

  6月11日,北京國家會議中心,以“融合 開放 智能”為主題的2014地理信息開發(fā)者大會(WGDC2014)在此拉開帷幕。地理信息開發(fā)者大會自2012年起開始舉辦,三年時間里,伴隨著中國地理信息產(chǎn)業(yè)的快速發(fā)展,已經(jīng)成為地理信息領域最具影響力的技術創(chuàng)新盛會,與跨界融合、國際交流的重要平臺。

  在6月12日下午的位置大數(shù)據(jù)專場中,最后一個環(huán)節(jié)是高峰對話。主持人:3sNews中國地理信息產(chǎn)業(yè)網(wǎng)執(zhí)行主編張凱,嘉賓介紹:北京大學“百人計劃”研究員袁曉如、北京超圖軟件股份有限公司地圖匯業(yè)務部總監(jiān)王天寶,北京捷泰天域信息技術有限公司GeoQ位置智能咨詢部總監(jiān)陳建英。

  以下為實錄:(根據(jù)現(xiàn)場速記整理,未經(jīng)演講本人審核,如有疏漏,請諒解并及時與3sNews聯(lián)系)

  張凱:今天和三位嘉賓討論一下數(shù)據(jù)挖掘,都是帶有地理位置標簽的討論。我想問一下三位嘉賓,地理位置數(shù)據(jù)如果對它挖掘的話,可以有哪些有價值的信息?

  袁曉如:我們做數(shù)據(jù)挖掘,現(xiàn)在我們各種各樣的數(shù)據(jù)都可能獲得,我們在微博,或者是微信里發(fā)布一些信息的時候,同時不自覺或者自覺的把一些地理信息也放在上面,單個來說可能沒有意義,但是積少成多,它的信息可能描述你整個人的行為,甚至描述整個社會的行為。隨著數(shù)據(jù)越來越多,隨著分析能力越來越加強,我們一定會看到更多的東西??赡芪覀兏枰璧氖?,它也會帶來安全的問題,很可能你原來不想讓人知道,或者某一些不應該知道的信息,他能夠通過這些挖掘出來。所以這是一個充滿了各種希望,但是又充滿了各種陷井的地方。

  王天寶:我覺得先從數(shù)據(jù)源來講,包括我們傳統(tǒng)的空間,信息產(chǎn)業(yè)獲取的空間數(shù)據(jù),比如遙感衛(wèi)星,或者是無人機,包括各種數(shù)據(jù),這是一個傳統(tǒng)獲取數(shù)據(jù)的方式。為什么咱們圈里關注的分析,就是互聯(lián)網(wǎng)行為,比如你去搜索,你去發(fā)微博,用的微信,甚至可穿戴設備,都是地理位置信息,數(shù)據(jù)源越來越多樣,不管是傳統(tǒng)的衛(wèi)星,無人機,特別現(xiàn)在互聯(lián)網(wǎng)的行為分析數(shù)據(jù),原來大家說信息里面帶有位置,在有這么多數(shù)據(jù)之后,我覺得可能從地理位置把數(shù)據(jù)組織起來,從地理空間的角度來挖掘數(shù)據(jù)。你從不同的數(shù)據(jù)源疊加在一起,可以得出一些更明顯的特征。它同時也可以做一個交叉驗證。

  對于企業(yè),比如選址分析,銀行要開在哪里,連鎖店開在哪里,包括經(jīng)營分析,廣告往那里投放,策劃在哪里做更有效果,這也是我們做了很多年的事情。對于個人來講,交通大數(shù)據(jù)除了對政府部門做規(guī)劃有用,可能對個人出行也更有用,避開擁堵的路段,通過互聯(lián)網(wǎng)行為的數(shù)據(jù)分析,你可能會了解一些自己甚至都沒有洞察到的自己的一些特點行為。

  陳建英:其實數(shù)據(jù)源對我們可視化來說還是挺重要的。位置數(shù)據(jù)是一個信息,在我們看來,這種信息可以說是我們從中挖掘的一個最關鍵的途徑。比如現(xiàn)在我們服務的一些客戶,我們可以向一些商家,還有賣場的VIP數(shù)據(jù),可以上傳到地圖上面,如果之前這些賣場和商家沒有地理位置的數(shù)據(jù),他可以把數(shù)據(jù)上傳,以不同的方式反饋出來,他可以得到很多的信息。比如說可以做一個精準的營銷,我還可以做一些銷售的合理分析。在做廣告精準營銷的時候,其實位置數(shù)據(jù)是非常非常重要的。其實地理位置信息是一種關系網(wǎng)絡的數(shù)據(jù),如果要是我們將所有賣場和商家,這把些VIP數(shù)據(jù)一條直線連接起來,其實我們可以看到賣場所有的客戶在什么地方,如果知道這個客戶在什么地方,我會對所有的店面進行合理化布局的分析。另外還可以做一些,像一些大型商超會有一些班車,比如班車的路線合不合理,能不能覆蓋所有的客戶,這也是從地理位置信息挖掘其中的一個方面吧。

  張凱:今年百度推出的地圖,也是第一次讓很多的大眾,通過電視的手段,了解到分析的一些魅力。在你們看來,把數(shù)據(jù)進行可視化之后,到底對人們的生活和決策,能夠帶來什么幫助,我們?yōu)槭裁匆獙@些數(shù)據(jù)進行可視化的展示?

  袁曉如:現(xiàn)在可視化產(chǎn)品比較多??梢暦治鲞@個詞出現(xiàn)在2001年的九一一之后,是美國的西北太平洋國家實驗室的幾個人,再加上做情報分析的,做可視化的這些聯(lián)合起來提出這樣一個概念??梢暦治銎鋵嵤且环N推理分析的科學,但是它是通過交互的,可視界面,實際上它是把自動算法挖掘的方式,跟人通過可視交互的界面參與,相當于把人和機器結合起來,但是對于人來說,怎么樣才能理解周圍的世界,我們必須通過交互的界面,所以是這樣的工作。

  可視化相對來說發(fā)展得早一點,之前我們看到很多可視化,我們往往只看在它的表達、展示上。因為今天大家都在看到有很多的數(shù)據(jù),而這些數(shù)據(jù)如何進行分析,怎么樣讓人進入環(huán)境,可視化和可視分析扮演非常重要的角色。我們看到有的可視化非常漂亮,但是它未必是真正可視化的精髓。更多的我們看一些需要人做一些交互操作的時候,這些案例你會發(fā)現(xiàn)更有意思一點。因為在這個過程中,人可以扮演更重要的角色,不僅僅發(fā)一條命令,像我們發(fā)一條數(shù)據(jù)庫的查詢,我們更多的是通過發(fā)現(xiàn)了解的方式,在里面發(fā)現(xiàn)它的異常,或者發(fā)現(xiàn)原來意想不到的東西,這個會越來越多的被人所接受,并且這是計算機科學發(fā)展的過程。

  最開始的時候,我們做計算機科學,其實沒有人機交互這個概念,但是發(fā)展到一定程度的時候,我們發(fā)現(xiàn)人怎么樣跟計算機進行交流是非常重要的。所以說我們看到了成功,包括鼠標的裝置,可以幫助我們很好的跟計算機結合。就像今天拿到鼠標,大家會感到非常習慣。

  在后面我們來看將來對于數(shù)據(jù)分析,這個可視分析會扮演更多的角色。它恰恰就是像人機交互一樣,我們通過可視分析的方式,在數(shù)據(jù)之間打開這樣一個渠道。在交通上面,它非常直觀的,因為我們有利益的體系。但是我們怎么樣來觀察一個道路,它在一年之內它的變化,我們既希望看到它的細節(jié),又希望看到它的趨勢,這可能有一些很有意思的方式我們可以來進行,這時候就不是簡單的把原來采集到的原始數(shù)據(jù)把它直接劃分出來,我們要轉化。這方面我們感到現(xiàn)在是一個開始,將來會有更多更多的案例來去探討。當然現(xiàn)在最大的問題,可能還是來做可視化分析的人比較少,但是除此之外還有太多的東西值得我們去進行探索。它基本上是一個還沒有被開發(fā)的一塊,特別是相比國外來說,中國更加落后一點。所以我也希望感興趣的人可以去看一看,這里面有很多的機會。

  王天寶:你用可視化的方式展示它的體驗,體驗的好,可以造成傳播效應。比如百度遷徙在媒體上傳播很廣泛。用可視化的方式,你會洞察到一些原來沒有注意到的信息。第一可能有很好的宣傳效果,第二可以用可視化的方式去呈現(xiàn)。

  陳建英:通過這張遷徙地圖,我可以感受到來北京的人,基本上都是來自哪,是哪些地方。所以這個是一個我們可視化比較明顯的東西。去年的時候我的同事還發(fā)布了一張地圖,在微博上轉發(fā)了將近一萬次,他做了一件事情,就是把美國所有的麥當勞的數(shù)據(jù)放到地圖上,當時引起了一些轟動,大家沒有想到能夠把美國地圖勾勒了出來。我們這個數(shù)據(jù)庫的同事覺得挺有意思,然后就想有沒有這樣一個興趣點體現(xiàn)呢?后來我們把所有的數(shù)據(jù)過了一下,全國收費站的數(shù)據(jù)能夠把中國的全景勾勒出來。我覺得可視化讓我們能夠拋開表面,挖掘一些更深層次的概念和現(xiàn)象,幫助我們甚至一些客戶,把一些深層的信息挖掘出來。[page]

  張凱:像這些數(shù)據(jù)會非常多,人口數(shù)據(jù),經(jīng)濟數(shù)據(jù),地理數(shù)據(jù),你們怎么把數(shù)據(jù)整合起來,為客戶分析出合理的方案?在商業(yè)地理智能的發(fā)展如何?

  陳建英:地理位置數(shù)據(jù)和商業(yè)數(shù)據(jù)還是非常多的,這是很大的一塊數(shù)據(jù),可以說是一個大數(shù)據(jù)。我們在做這些數(shù)據(jù)處理的時候,我們會將數(shù)據(jù)先做分類,匯總,抽出數(shù)據(jù)的一些比較關聯(lián)的屬性。在這個過程中,還會做一些篩選、過濾,清洗,最后把所有的數(shù)據(jù)通過500米半徑的網(wǎng)格數(shù)據(jù)分割出去,展現(xiàn)給大家。

  另外因為這些數(shù)據(jù)比較復雜,我們可以要求客戶把他的數(shù)據(jù)先上傳到地圖上面,在他想要關注的一些,因為我們有很多分類的數(shù)據(jù),選擇他關心的數(shù)據(jù),這些客戶關心的不是所有的數(shù)據(jù),而是其中某組數(shù)據(jù),把他關心的數(shù)據(jù),和他自己的業(yè)務數(shù)據(jù)疊加起來。

  第二個問題就是發(fā)展,現(xiàn)在國內地理商業(yè)智能平臺可以從兩方面發(fā)展來說,第一方面就是平臺提供商,現(xiàn)在的一些服務平臺能夠提供的除了可視化,還有比較高深的分析。

  張凱:你們GeoQ是怎么把用戶的數(shù)據(jù)進行管理,又是怎么讓數(shù)據(jù)發(fā)揮更大的價值?

  王天寶:公開的一些數(shù)據(jù),我們現(xiàn)在做的主要就是來看一下這些用戶,他用地圖來做什么,他本身是哪個行業(yè)的,他從事什么行業(yè),從事什么工作,另外就是新聞,包括財經(jīng)網(wǎng),搜狐網(wǎng),他們可能都是用地圖的工具來展開他們的數(shù)據(jù)。所以從這個角度來講,我們更多是把一個工具和品牌開放出來,看看到底有哪些企業(yè)和客戶,個人類的用戶使用地圖,我們可以做針對行業(yè)推廣等其他的分析。

  張凱:現(xiàn)在有很多可視化的愛好者在地圖上做了一些呈現(xiàn),這些是不是比較初級的可視分析,我們可視分析的差距在哪里?怎么提高?

  袁曉如:也不能講是不是初級的,因為你有什么樣的數(shù)據(jù),你有什么目的,就會找到一個跟它相合適匹配的可視化方法。無論只是一個直接的可視化,還是一個比較復雜的設計。

  當然對于我們國家來說,我覺得這都是在逐漸發(fā)展的,因為我們的傳統(tǒng),我們是重硬輕軟,我們輕視這些軟的東西。但是我們會發(fā)現(xiàn),在隨著工作的進展到最后,非常重要的是你怎么樣修復好系統(tǒng),給用戶體驗好。今天我們看到有很多的人關心這些事情,這個過程怎么樣進步,對于學校來說,我們會開網(wǎng)絡公開課,再過一兩個月,就會上線。同時我們也有各種各樣的學術活動,像今天的會議我們可以交流討論,隨著越來越多的人加入,只要有需求,一定會有更多的人加入進來。我們需要正視和國外的差距,將來慢慢的我們無論在學術上,還是在應用上,都會看到一些東西。只要大家認識到它的重要性,并不是一個太遙遠的事情。所以我們還是可以多關注這些。

  張凱:謝謝袁老師。希望我們以后可以有更多的交流,共同討論可視化的發(fā)展。非常感謝三位嘉賓,也非常感謝在座的各位觀眾,和我們幾位嘉賓一起對數(shù)據(jù)挖掘和可視化進行了現(xiàn)場交流,謝謝大家!

喜歡您正在閱讀的內容嗎?歡迎免費訂閱泰伯每周精選電郵。 立即訂閱

參與評論

【登錄后才能評論哦!點擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復{{item.replynum}}
    {{child.username}} 回復 {{child.to_username}}:{{child.content}}

更多精選文章推薦

下一篇

韋克禮:LBS讓機器人更加智能