相信很多人都有過這樣的經(jīng)歷,個(gè)人還好,對于企業(yè),特別是某些行業(yè),非結(jié)構(gòu)化數(shù)據(jù)增長速度極快。例如,通信運(yùn)營商和媒體面對著無窮無盡的社交信息,而制造業(yè)和基礎(chǔ)設(shè)施運(yùn)營商則因物聯(lián)網(wǎng)和傳感器的發(fā)展而采集了多樣化的設(shè)備信息,這些信息,雖然有價(jià)值,但卻未被使用到,這就是“暗數(shù)據(jù)”。
“暗數(shù)據(jù)”是大數(shù)據(jù)中的一類,“大數(shù)據(jù)”作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點(diǎn)。
“暗數(shù)據(jù)”一詞最早由Gartner公司提出,是企業(yè)在正常業(yè)務(wù)流程中產(chǎn)生的信息資產(chǎn),但一般不用于其他目的(例如分析,業(yè)務(wù)關(guān)系等)。就像宇宙中的暗物質(zhì),它們代表了宇宙中90%以上的物質(zhì)含量,但自身不發(fā)射電磁輻射,也不與電磁波相互作用。“暗數(shù)據(jù)”的存在也會(huì)消耗比它能帶來的價(jià)值更高的費(fèi)用,比如存儲(chǔ)等。
這些暗數(shù)據(jù),沒準(zhǔn)哪一天你會(huì)用到它,所以你一直保存著它,卻一直束之高閣,食之無味,棄之可惜。比如醫(yī)療保險(xiǎn)機(jī)構(gòu)的暗數(shù)據(jù),如果進(jìn)行恰當(dāng)?shù)臍w類和存儲(chǔ),未來就有發(fā)揮價(jià)值的一刻,暗數(shù)據(jù)當(dāng)存儲(chǔ)到一定量的時(shí)候,并且和其他信息綜合分析時(shí),就能挖掘到它所反映的行業(yè)間的交叉信息,比如零售 、醫(yī)療、金融或者公共服務(wù)領(lǐng)域。一個(gè)企業(yè)或機(jī)構(gòu)的暗數(shù)據(jù),很可能成為另外一個(gè)企業(yè)或機(jī)構(gòu)的高價(jià)值數(shù)據(jù),在隱私和安全性的障礙被清除后,就是暗數(shù)據(jù)價(jià)值爆發(fā)之時(shí)。比如醫(yī)療機(jī)構(gòu)的一些不常用到的信息,將成為零售或者金融機(jī)構(gòu)的金礦。如果加以充分利用,暗數(shù)據(jù)將成為企業(yè)的第三類資產(chǎn),變作創(chuàng)造價(jià)值的源泉。
今年的雙十一來勢兇猛,雙十一開始后第一分鐘內(nèi),支付寶的交易額就達(dá)到了1.17億元,交易筆數(shù)接近34萬筆。隨后是交易額數(shù)字的持續(xù)刷新,最終全天成交額350億。這一天產(chǎn)生的暗數(shù)據(jù)也不少,它們存在于用戶在活動(dòng)期間關(guān)注、瀏覽、加購物車、收藏等行為的信息中;消費(fèi)者搶到的紅包、領(lǐng)到的優(yōu)惠券等相關(guān)信息中;物流配送位置信息、銀行交易信息等等所有的這些內(nèi)容,有的是被分析的有價(jià)值數(shù)據(jù),也有更多的是大家意識到有價(jià)值,但短時(shí)間內(nèi)還無法利用只能存儲(chǔ)的“暗數(shù)據(jù)”。
如果按數(shù)據(jù)類別兩兩或者三者關(guān)聯(lián),加以分析形成信息資產(chǎn),如果全部加以整合利用,就能爆發(fā)出暗數(shù)據(jù)的更大價(jià)值。比如一些暗數(shù)據(jù)可以揭示一個(gè)用戶的興趣改變,或購買習(xí)慣的漸變,這是真正的價(jià)值。
當(dāng)然,發(fā)現(xiàn)和使用暗數(shù)據(jù)有很高的風(fēng)險(xiǎn),因?yàn)樵噲D利用它可能會(huì)浪費(fèi)時(shí)間和精力,如果用得不好,則將一無所獲。這需要本身具有強(qiáng)大的處理數(shù)據(jù)的能力,暗數(shù)據(jù)需要的是強(qiáng)大數(shù)據(jù)庫管理工具的支撐,目前,還只有“高大上”的企業(yè)才能很好地利用暗數(shù)據(jù)。(文丨《3S新聞周刊》專欄作者 許泳)
{{item.content}}