3sNews訊 為期兩天的2012地理信息開發(fā)者大會(huì)(簡(jiǎn)稱:WGDC)在北京國(guó)家會(huì)議中心舉行,本次大會(huì)以“新技術(shù)、新模式、新商業(yè)”為主題,是地理信息領(lǐng)域最具影響力的技術(shù)性盛會(huì),其宗旨是不斷引領(lǐng)和促進(jìn)地理信息技術(shù)的創(chuàng)新與變革。在第二天的“Telematics與車載智能終端”分會(huì)場(chǎng),捷通華聲語(yǔ)音技術(shù)有限公司總經(jīng)理武衛(wèi)東發(fā)表了題為《靈云——感知Telematics服務(wù)》的演講。
以下為文字實(shí)錄:
大家下午好!今天非常有幸,能跟大家一起探討在智能人機(jī)交互技術(shù)與Telematics應(yīng)用的一些研究。今天在我前面有兩位都是從事語(yǔ)音行業(yè)的資深企業(yè),也是很有幸第一次同臺(tái)給大家展現(xiàn)國(guó)內(nèi)目前在語(yǔ)音領(lǐng)域里幾家技術(shù)的觀點(diǎn)和意見。但是我想大家的目的是一樣的,都是希望通過這樣一個(gè)同臺(tái)的交流,能夠在語(yǔ)音技術(shù)包括交互技術(shù)上,在Telematics上有共同的發(fā)展。
捷通華聲是專注于語(yǔ)音識(shí)別和手寫等技術(shù)的公司,目前經(jīng)過十幾年的發(fā)展,公司在語(yǔ)音行業(yè)和手寫行業(yè)已經(jīng)發(fā)展了上千家合作伙伴。目前,我們?cè)谡Z(yǔ)音技術(shù)市場(chǎng)已經(jīng)有50%市場(chǎng)占有率,手寫領(lǐng)域已經(jīng)有30%幾的市場(chǎng)占有率。同時(shí)公司不僅是在核心技術(shù)這塊,我們?cè)谝恍┰鲋捣?wù)方面,公司這么多年我們也有與中國(guó)電信、中國(guó)移動(dòng)、中國(guó)聯(lián)通建立了很好的合作。比如中國(guó)電信CDMA的業(yè)務(wù)的合作。公司經(jīng)過多年的發(fā)展,我們總結(jié)公司的使命和愿景就是我們希望通過智能人機(jī)交互技術(shù)能夠切實(shí)的使人與機(jī)器的交流向人與人交流一樣的簡(jiǎn)單起來(lái)。
下面是我們?cè)诟鞯氐囊恍┓止?這是一些有關(guān)鍵影響的事件。我給大家分享一下在這些事件中我們的語(yǔ)音合成技術(shù)所起的作用。第一個(gè)就是08年奧運(yùn)會(huì),我們參與了很多語(yǔ)音支撐服務(wù)平臺(tái)的項(xiàng)目,而且這個(gè)項(xiàng)目在奧運(yùn)會(huì)中實(shí)際的發(fā)生了作用。第二個(gè)就是高鐵,目前為止全國(guó)高體站立有2、3百個(gè)捷通華聲高鐵百分之百的站廳使用了我們的技術(shù),還有世博會(huì)的我們的語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用。還有廣州亞運(yùn)會(huì)的應(yīng)用。因?yàn)榻萃ㄈA聲本身這些年我們?cè)谶@個(gè)產(chǎn)業(yè)內(nèi)建立了很多合作伙伴,我們一直做的技術(shù)都是在背后,可能大家在生活中會(huì)聽到,比如銀行或者呼叫中心聽到過我們一些語(yǔ)音聲音的播報(bào),但是不知道是哪家公司。所以今天有機(jī)會(huì)跟產(chǎn)業(yè)界的同仁包括開發(fā)者有機(jī)會(huì)見面。
(這個(gè)片子)是我們這些年在汽車的前裝市場(chǎng)、后裝市場(chǎng)、地圖導(dǎo)航,包括手機(jī)終端這些廠商的一些導(dǎo)航應(yīng)用廠家的合作伙伴案例。隨著現(xiàn)在移動(dòng)互聯(lián)網(wǎng)包括云計(jì)算的發(fā)展,現(xiàn)在越來(lái)越多的設(shè)備比如手機(jī)也好、PAD也好,包括車載終端也好,等等這些設(shè)備,人跟設(shè)備之間的交互情況越來(lái)越多。人跟設(shè)備使用體驗(yàn)的要求越來(lái)越高。所以從捷通來(lái)講,我們也是總結(jié)多年以來(lái)做智能人機(jī)交互技術(shù)方面的經(jīng)驗(yàn),包括在產(chǎn)業(yè)上的一些案例。我們也切實(shí)感覺到,如果說(shuō)像過去的僅僅是提供一些核心技術(shù),像提供一些SDK,大家開發(fā),已經(jīng)無(wú)法滿足日益需要的人機(jī)交互的要求。所以在2011年捷通公司也是經(jīng)過長(zhǎng)時(shí)間的準(zhǔn)備,我們推出了在國(guó)內(nèi)第一個(gè)基于智能人機(jī)交互技術(shù)的全方位的云平臺(tái)—靈云”。因?yàn)楝F(xiàn)在設(shè)備,包括智能設(shè)備,包括智能手機(jī),我們也感覺信息量越來(lái)越大,要操作的東西越來(lái)越多,要找的東西越來(lái)越多。但是有時(shí)候感覺東西太多了,不知道怎么用。我們做這個(gè)靈云平臺(tái),希望通過靈云讓人能夠感知機(jī)器,同時(shí)機(jī)器也能夠感知人,切實(shí)的讓這些智能終端稱之為智能。所以靈云是讓機(jī)器和人之間能夠感知,這是我們開發(fā)這個(gè)靈云平臺(tái)的目的。靈云平臺(tái)不僅僅是人機(jī)智能交互技術(shù),其實(shí)還有一個(gè)一個(gè)RO系統(tǒng),因?yàn)楝F(xiàn)在大家都提倡個(gè)性化,這個(gè)個(gè)性和如何體驗(yàn)?其實(shí)云服務(wù)、云計(jì)算,這方面提供了一個(gè)非常好的通道,一個(gè)平臺(tái)。我們?cè)陟`云里設(shè)置了RO系統(tǒng),把人的一些行為和喜好和需求,通過你在跟系統(tǒng)進(jìn)行交互的時(shí)候,能夠把它記錄下來(lái),總結(jié)出來(lái)。形成一個(gè)個(gè)性化的系統(tǒng)。比如說(shuō)你喜歡經(jīng)常聽一聽NBA的消息,通過語(yǔ)音的方式或者其他的交互手段,你經(jīng)常喜歡的是體育類的消息,這樣后臺(tái)可以在RO系統(tǒng)里,把你的喜好記錄下來(lái)。將來(lái)會(huì)經(jīng)常的把有關(guān)這方面的消息給你從靈云互聯(lián)網(wǎng)上根據(jù)搜索,給你提供方便。
包括出行的時(shí)候可能經(jīng)常有一些常去的地方,這樣也會(huì)把你今后常去的地方的信息點(diǎn),包括周圍的一些服務(wù)等等記錄下來(lái),推送給你。這樣給人帶來(lái)一些個(gè)性化的變化,這個(gè)平臺(tái)實(shí)際上就是靈云平臺(tái)的核心點(diǎn)。
靈云的架構(gòu):這個(gè)平臺(tái)的作用已經(jīng)整合了,包括今后我們還會(huì)整合更多的成熟的核心人機(jī)交互技術(shù)的能力。比如說(shuō)手寫識(shí)別、包括機(jī)器翻譯、人臉識(shí)別、指紋、筆跡鑒定,我們靈云平臺(tái)都完全了整合。我們靈云平臺(tái)發(fā)布的時(shí)候,我們今后會(huì)把類似像腦波識(shí)別,為此還有一些爭(zhēng)議,其實(shí)現(xiàn)在腦波識(shí)別在美國(guó)加州已經(jīng)有一些地方在進(jìn)行,當(dāng)然這樣的技術(shù)還有待成熟,但是想我類似這樣的技術(shù)都是人和機(jī)器能夠交互的技術(shù)。我們捷通華聲公司除了自己擁有的核心技術(shù)放在上面之外,我們還會(huì)建立廣泛的合作,把這些真正能夠解決人們生活、工作中能夠提升人們的好的感知技術(shù)整合在一起,讓大家分享,讓大家去用。
剛才講了在我們的生活中人機(jī)交互技術(shù)無(wú)處不在,剛才大家也聽到了云本身就像自來(lái)水一樣,隨時(shí)開的?,F(xiàn)在人機(jī)智能交互技術(shù)已經(jīng)滲透到人的各個(gè)環(huán)節(jié)。比如我們現(xiàn)在靈云提供的,識(shí)別、合成、手寫包括OCR等等這些技術(shù),機(jī)械翻譯、指紋,這些技術(shù)目前從核心上來(lái)講,很多地方特定領(lǐng)域已經(jīng)有了很成熟的應(yīng)用。在今后,比如我們開發(fā)者做這方面的工作的時(shí)候應(yīng)該有更奪得創(chuàng)意和想法,能夠利用這些技術(shù)服務(wù)我們生活的各個(gè)方面。
其實(shí)靈云的應(yīng)用也是非常廣泛的,包括交通、金融、電信、能源這些行業(yè)都可以有廣泛的應(yīng)用。
中國(guó)的Telematics服務(wù)。說(shuō)實(shí)話我對(duì)Telematics服務(wù)這塊,我們不敢在眾多的專家和朋友中間“賣弄”,我們感覺Telematics服務(wù)作為一個(gè)新興事物,現(xiàn)在已經(jīng)有很多東西開始影響人們的生活。但是還有空間。我們認(rèn)為真正一個(gè)好的東西能夠達(dá)到好用和易用這個(gè)水平,還是要有一些關(guān)鍵地方的突破。這個(gè)關(guān)鍵地方的突破在哪兒,其中有一點(diǎn)我們認(rèn)為是,現(xiàn)在能提供的人機(jī)交互的感知能力相關(guān)。因?yàn)樘O果公司,喬布斯的偉大在于他把人的需求挖掘出來(lái)了。實(shí)際上從計(jì)算信息時(shí)代從鍵盤鼠標(biāo)到多點(diǎn)觸控,到現(xiàn)在的發(fā)展,人們感覺到不僅僅是設(shè)備,或者是一個(gè)應(yīng)用,更大的是一種感知,人對(duì)這個(gè)設(shè)備使用的快感的影響。所以開玩笑的講有時(shí)候蘋果的設(shè)備2歲的小孩子不用教他,讓他玩他就能玩兒,這很有意思。這是人潛能當(dāng)中存在的需求被挖掘出來(lái)了。那么靠什么,實(shí)際上人機(jī)交互技術(shù)起著非常關(guān)鍵的作用。
Telematics服務(wù)里面可以在導(dǎo)航方面利用這些人機(jī)交互去做比如做位置的搜索、路線的導(dǎo)航、路況信息的播報(bào),也可以在服務(wù)方面做一些呼叫中心的服務(wù)、包括車況、防盜的監(jiān)控。資訊方面,從整個(gè)車載終端角度來(lái)講,車載終端相當(dāng)于是一個(gè)跟人相關(guān)的功能化中心。這個(gè)中心可以集結(jié)很多來(lái)自于移動(dòng)互聯(lián)網(wǎng),包括各種各樣生活資訊的信息。從手段方面,比如車內(nèi)打電話或者發(fā)短信等等這些都可以利用人機(jī)交互技術(shù)去實(shí)現(xiàn)。
我剛才在臺(tái)下聽王總講結(jié)構(gòu)化思路的時(shí)候我也非常認(rèn)同,我們?cè)诮佑|一些國(guó)內(nèi)和國(guó)外的車廠方案的時(shí)候,他們也說(shuō),說(shuō)你們的手寫能不能提供,我們后來(lái)給他提供方案他們覺得技術(shù)不錯(cuò),但是應(yīng)用太過復(fù)雜。后來(lái)他們提出來(lái),開著車的時(shí)候,只要換檔的時(shí)候加一個(gè)觸屏是可以寫東西的,或者加強(qiáng)一個(gè)手勢(shì)可以做一些簡(jiǎn)單處理,甚至比人說(shuō)話還方便。甚至包括車的安全,比如能不能加一些人臉、或者指紋,等等這些東西不是我們提出來(lái)的,實(shí)際上目前應(yīng)用方面來(lái)講,切切實(shí)實(shí)是我們行內(nèi)的很多同仁、一般技術(shù)的牛人提出來(lái)這樣的設(shè)想。我們覺得這個(gè)確實(shí)有它可挖掘的空間。
智能助手—小唐龍:語(yǔ)音識(shí)別大家在理解SIR的時(shí)候,大家覺得語(yǔ)音識(shí)別真力求這個(gè)“小唐龍”,華人圈里第一個(gè)做語(yǔ)音識(shí)別的人,我們?cè)?jīng)拜訪過,也交流過,也算是一個(gè)泰斗機(jī)的人物,他說(shuō)現(xiàn)在看到的SIR有點(diǎn)太熱了,因?yàn)槭紫鹊谝滑F(xiàn)在還沒有來(lái)中國(guó),可能中國(guó)語(yǔ)言太復(fù)雜了。捷通華聲公司這么多年發(fā)展我們是腳踏實(shí)地的往前走,因?yàn)橛行?yīng)用不可能達(dá)到技術(shù)的高度。這個(gè)觀點(diǎn)我同意70%,在語(yǔ)音交互這個(gè)領(lǐng)域應(yīng)用中,其實(shí)語(yǔ)音識(shí)別所起的作用不足30%,這一點(diǎn)來(lái)講,剛才我看到王總也提了一些思路,我也非常認(rèn)同,這個(gè)觀點(diǎn)不是我的觀點(diǎn),這是觀點(diǎn)是我發(fā)現(xiàn)大家都有這樣的說(shuō)法。在實(shí)際應(yīng)用實(shí)踐中,其實(shí)應(yīng)用和技術(shù)之間的連接如果是簡(jiǎn)單的硬連接,往往有時(shí)候達(dá)不到實(shí)際好的效果。語(yǔ)音識(shí)別按照自然語(yǔ)言理解,實(shí)際上99年IBM就推出了一個(gè)語(yǔ)音識(shí)別,你正常說(shuō)話就能做的很好。大家覺得語(yǔ)音識(shí)別能解決很多問題,但是事實(shí)上語(yǔ)音識(shí)別的應(yīng)用你要把它用到一個(gè)特定的環(huán)境下,特定的語(yǔ)境下用特定的方式才能使用這個(gè)技術(shù),如果把這個(gè)技術(shù)用到各種領(lǐng)域有可能這個(gè)美麗的泡影還會(huì)倒推十年。我相信同行大家這樣的認(rèn)識(shí)。我們當(dāng)時(shí)做的時(shí)候也意識(shí)到這點(diǎn)了,所以我們是把人工智能、語(yǔ)音識(shí)別和各種人機(jī)交互手段來(lái)共同解決這個(gè)問題。我們小唐龍能夠做到人的體驗(yàn)的高度,我們做一些應(yīng)用的時(shí)候,尤其是在一些領(lǐng)域進(jìn)行應(yīng)用的時(shí)候,因?yàn)榻萃ㄈA聲商業(yè)模式業(yè)務(wù)模式中我們提供技術(shù)你去用,但是經(jīng)過十年甚至是十幾年的驗(yàn)證,我們?cè)趥鹘y(tǒng)的CPI行業(yè),上了這么多的語(yǔ)音識(shí)別,到現(xiàn)在沒有看到一家真正的脫離開人的方式,完全以語(yǔ)音方式實(shí)現(xiàn)的項(xiàng)目。甚至很多項(xiàng)目上了就下來(lái)了。所以我們做“小唐龍”的時(shí)候,希望在端上能給大家展現(xiàn)一個(gè)新的應(yīng)用。
我們“小唐龍”有九個(gè)變身,一個(gè)是汽車龍,我們希望跟專業(yè)的融合。另外就是導(dǎo)航龍,其實(shí)汽車龍和導(dǎo)航龍是一個(gè)龍,能夠結(jié)合導(dǎo)航類的和車內(nèi)娛樂的一些應(yīng)用。簡(jiǎn)單演示一下“小唐龍的案例”。這是自然語(yǔ)言的識(shí)別,不是基于語(yǔ)言的識(shí)別。實(shí)際上現(xiàn)在通過智能的人機(jī)交互技術(shù),真正能夠完成“一步式到位”。
我的演講就到這里,謝謝大家!
(以上內(nèi)容根據(jù)速記整理,未經(jīng)本人審核)
{{item.content}}