此輪融資由Canaan Partners領(lǐng)投,原有投資者NEA及Google董事會主席施密特也有參與。
WibiData由大數(shù)據(jù)初創(chuàng)企業(yè)Cloudera的聯(lián)合創(chuàng)始人Christophe Bisciglia及Aaron Kimball創(chuàng)建。創(chuàng)建伊始他們并沒有什么大計劃,只是希望能成為最早為基于Hadoop的應用之商用套件提供商之一。
大數(shù)據(jù)的市場已經(jīng)十分擁擠,Hadoop的三巨頭(Cloudera、Hortonworks及MapR)牢牢占據(jù)了絕大部分的份額。但是大家用Hadoop絕不僅僅是為了將非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)(即ETL,數(shù)據(jù)析取),用戶開發(fā)自行的定制應用仍然是個難題。所以WibiData瞄準了這樣一個利基市場—做專業(yè)大數(shù)據(jù)軟件包。
能源管理初創(chuàng)企業(yè)Opower就是一個用戶案例。這家公司已經(jīng)是Cloudera的招牌客戶了,但是當他們想讓自己的SaaS工具超越批量分析和ETL處理時,還是得找WibiData。有了新應用的支持,現(xiàn)在這家公司已經(jīng)從晚間對用戶的能源使用進行數(shù)據(jù)比較分析提升到向用戶動態(tài)推薦了。
WibiData的核心技術(shù)是將后端的Hadoop環(huán)境與面向客戶的預測性應用連接到一起,包括一組HBase(Hadoop數(shù)據(jù)庫)、數(shù)據(jù)格式化工具以及機器學習算法(WibiData正在逐步將實現(xiàn)機器學習算法的Kiji開源)。此外,WibiData還在總結(jié)其為同一領(lǐng)域內(nèi)的客戶所開發(fā)的應用之相似性,以便找出可重用的東西。比方說,零售業(yè)要想開發(fā)推薦引擎的話,應該從何開始?
WibiData準備重點針對金融和零售業(yè)推進應用開發(fā)。預期的成型產(chǎn)品將會包括數(shù)據(jù)格式化的預定義模式、預置預測模型等。此外,軟件還將根據(jù)用戶角色的不同(數(shù)據(jù)科學家、系統(tǒng)工程師、業(yè)務用戶)而展現(xiàn)不同的界面,根據(jù)用戶需要來提供與數(shù)據(jù)的交互方式。
我們之前曾討論過,數(shù)據(jù)科學家無需太多,讓大數(shù)據(jù)好用就行了。WibiData的專業(yè)化軟件包顯然是一種循序漸進的解決方案。此外,像Cloudera這樣的Hadoop供應商則采取了另一種大數(shù)據(jù)應用通用化的路線,即將Hadoop集成到現(xiàn)有環(huán)境中。時間會證明WibiData的路線是否正確的。
{{item.content}}