2013年3月1日,EMC公司公布了由EMC贊助的IDC數(shù)字宇宙報告《大數(shù)據(jù),更大的數(shù)字身影,最大增長在遠東》。該報告顯示,盡管個人和機器每天產(chǎn)生大量數(shù)據(jù),使數(shù)字宇宙前所未有地不斷膨脹,但僅有0.4%的全球數(shù)據(jù)得到了分析。
隨著全球范圍內(nèi)個人電腦、智能手機等設備的普及,和新興市場內(nèi)不斷增長的互聯(lián)網(wǎng)訪問量,以及監(jiān)控攝像機或智能電表等設備產(chǎn)生的數(shù)據(jù)爆增,使數(shù)字宇宙的規(guī)模在最近兩年翻了一番,達到驚人的2.8 ZB。 IDC預計,到2020年,數(shù)字宇宙規(guī)模將超出預期,達到40 ZB。
僅就數(shù)量而言,40 ZB的數(shù)據(jù)相當于:
• 如果地球上所有海灘上的沙粒有700,500,000,000,000,000,000(即七萬零五億億)顆。40ZB相當于地球上所有海灘上的沙粒數(shù)量的57倍。
• 如果把40 ZB的數(shù)據(jù)全部存入現(xiàn)有的藍光光盤,這些光盤的重量(不帶盒子或包裝)相當于424艘尼米茲號航母。
• 2020年,40ZB相當于地球上人均5,247GB的數(shù)據(jù)。
• 今年的研究報告是IDC第一次顯示了數(shù)字宇宙中的信息來源地,即它們是在哪里被首次抓取或利用,并揭示出一些正在發(fā)生的重大轉(zhuǎn)變。六年來,該報告測量和預測每年產(chǎn)生和復制的數(shù)字信息,其中包含對“大數(shù)據(jù)鴻溝”的研究,即那些價值被隱藏的數(shù)據(jù)量和價值被真正挖掘的數(shù)據(jù)量之間的差距,和數(shù)據(jù)所需保護和實際交付水準之前的差距,以及全球數(shù)據(jù)的地理分布。
報告亮點:
快速膨脹的數(shù)字宇宙:IDC預計,到2020年,數(shù)字宇宙將超出預期達到40 ZB。
•從現(xiàn)在到2020年,數(shù)字宇宙將每兩年翻一番
•在2020年,地球上人均數(shù)據(jù)預計將達5,247GB
•數(shù)字宇宙膨脹的主要原因是機器生成的數(shù)據(jù)量的增長,由2005年占數(shù)字宇宙的11%,到2020年將超過40%。
[page]
大量有效數(shù)據(jù)正在丟失:大數(shù)據(jù)的前途取決于從大量未開發(fā)的數(shù)據(jù)中提取價值。然而,大多數(shù)新的數(shù)據(jù)是基于文檔未被標記的非結(jié)構(gòu)化數(shù)據(jù),人們對它們知之甚少。
•2012年,如果經(jīng)過標記和分析,數(shù)字宇宙中23%的數(shù)據(jù)(即643EB)將成為有效的大數(shù)據(jù)。然而目前只有3%的潛在有效數(shù)據(jù)被標記,而得到分析的數(shù)據(jù)量則更少。
•隨著數(shù)字宇宙的增長,有效的數(shù)據(jù)量正在不斷膨脹。到2020年,如果經(jīng)過標記和分析,33%的數(shù)字宇宙(即13,000EB)將具有大數(shù)據(jù)價值。
大部分的數(shù)字宇宙未受到保護:需要保護的數(shù)據(jù)量的增長超過數(shù)字宇宙自身的增長。
•2010年,數(shù)字宇宙中需要保護的數(shù)據(jù)不到三分之一,預計到2020年,這一比例將超過40%。
•2012年,大約35%的信息需要某種形式的數(shù)據(jù)保護,而實際只有不到20%的數(shù)據(jù)得到了保護。
•數(shù)據(jù)得到的保護級別因地區(qū)而異,在新興市場受到較少保護。
•高級威脅、安全技能的不足、消費者和企業(yè)忽視最佳安全實踐所帶來的挑戰(zhàn)使問題進一步惡化。
地理上的轉(zhuǎn)換即將到來:數(shù)字宇宙過去曾是發(fā)達國家的一種現(xiàn)象,這種情況將隨著新興市場上人口的數(shù)字影子的增長發(fā)生變化。
•2010年新興市場只占數(shù)字宇宙的23%,到2012年它的份額已高達36%。
•到2020年,IDC預測62%的數(shù)字宇宙將來源于新興市場。
•目前數(shù)字宇宙的全球比例:美國32%,西歐19%,中國13%,印度4%,其他國家32%。
•到2020年,預計僅中國將產(chǎn)生全球21%的數(shù)據(jù)。
其他主要研究成果:
•隨著云計算在大數(shù)據(jù)的管理中扮演越來越重要的角色,全球范圍內(nèi)服務器的數(shù)量將增長10倍,而由企業(yè)數(shù)據(jù)中心直接管理的信息量將擴大14倍。
•存儲在云中的數(shù)據(jù)類型也將在未來幾年內(nèi)經(jīng)歷重要變革。 IDC預測,到2020年,存儲在云中的46.7%的數(shù)據(jù)將涉及娛樂,而不是企業(yè)數(shù)據(jù),其余為監(jiān)控數(shù)據(jù),嵌入式以及醫(yī)療數(shù)據(jù),還有電腦、手機和消費電子產(chǎn)品產(chǎn)生的數(shù)據(jù)。
•儲存在數(shù)字宇宙中的個人用戶信息量將超過他們自己創(chuàng)建的數(shù)據(jù)量。
•西歐對數(shù)字宇宙的管理投入最多,每GB的投資額為2.49美元。美國排名第二,每GB投入 1.77美元,中國排名第三,每GB 1.31美元,然后是印度,每GB 0.87美元。
•隨著數(shù)字宇宙的基礎(chǔ)設施進一步互聯(lián)互通,信息將不會也無需停留在其被采用的位置。IDC預測,到2020年,近40%的信息將被云計算所“觸及”,也就是說,在一個字節(jié)從起源到被采用這一過程中,它將在某個位置,在云中被存儲或處理。
EMC公司高管引言:
EMC公司產(chǎn)品運營與市場營銷高級副總裁Jeremy Burton
“大量復雜的數(shù)據(jù)不斷地干擾業(yè)務運營,促使IT部門必須做出選擇:要么因信息過載而癱瘓,要么采取措施以利用這些數(shù)據(jù)流的巨大潛力。今年的研究報告強調(diào)了數(shù)據(jù)可以為企業(yè)帶來大量商機,它不僅發(fā)現(xiàn)了數(shù)字宇宙的潛在效益,而且強調(diào)了通過技術(shù)、安全實踐和IT技能的正確組合來駕馭數(shù)字宇宙的重要性。EMC擁有獨特的優(yōu)勢,能夠幫助客戶管理、保護和挖掘這些可以改變游戲規(guī)則的數(shù)據(jù)價值,并把它們直接轉(zhuǎn)化為競爭優(yōu)勢。”
{{item.content}}