捷通華聲面向智能車載推出靈云遠(yuǎn)場語音交互解決方案

2016-05-17 09:14:48來源:威易網(wǎng)作者:

    靈云科技04月27日消息:近日,北京車展在京隆重開幕,智能語音交互作為一種安全、流暢、便捷的車載設(shè)備控制技術(shù),成為本次車展最為亮麗的風(fēng)景線。捷通華聲長期為國內(nèi)外汽車廠商等合作伙伴提供智能語音交互、智能圖像等全方位人工智能服務(wù)。

靈云科技04月27日消息:近日,北京車展在京隆重開幕,智能語音交互作為一種安全、流暢、便捷的車載設(shè)備控制技術(shù),成為本次車展最為亮麗的風(fēng)景線。捷通華聲長期為國內(nèi)外汽車廠商等合作伙伴提供智能語音交互、智能圖像等全方位人工智能服務(wù),為了更進(jìn)一步滿足市場對智能車載語音交互技術(shù)的需求,捷通華聲近期推出適應(yīng)于車載環(huán)境的專用語音識別技術(shù),并面向中國智能車載領(lǐng)域全面開放靈云遠(yuǎn)場語音交互解決方案。

靈云遠(yuǎn)場語音交互解決方案全面整合了捷通華聲最新推出的語音喚醒、聲源定向、遠(yuǎn)場降噪、回聲消除、語音打斷、語音糾錯、多輪對話等實(shí)用化語音、信號處理技術(shù),抗噪能力極強(qiáng),即使在80km/h的車速下也能準(zhǔn)確識別司機(jī)話語,保證語音交互的流暢自然,為國內(nèi)廣大智能終端設(shè)備廠商、解決方案提供商、軟件開發(fā)商等行業(yè)伙伴提供靈云麥克風(fēng)陣列、云+端語音交互、內(nèi)容服務(wù)等軟硬件一體的智能語音交互解決方案,打造“能聽會說、能理解、會思考”的各種智能車機(jī)、智能后視鏡、便攜式導(dǎo)航儀、HUD等車載設(shè)備。

\

抗噪型靈云語音識別+麥克風(fēng)陣列 輕松破解車內(nèi)噪音干擾

      面對行車過程中的車外胎噪、風(fēng)噪,車內(nèi)空調(diào)聲、引擎聲等行車環(huán)境噪音,捷通華聲靈云多麥克風(fēng)陣列能精準(zhǔn)拾取說話人的語音信號,抑制噪聲和混響,抗噪型靈云語音識別技術(shù),能對殘余的車載噪音進(jìn)行進(jìn)一步處理,準(zhǔn)確識別司機(jī)語音命令。

      多麥克風(fēng)陣列能根據(jù)聲音到達(dá)的時間差,準(zhǔn)確計(jì)算出聲源與陣列模塊之間的角度和距離,實(shí)現(xiàn)對目標(biāo)聲源的定位與跟蹤,并利用麥克風(fēng)陣列的空域?yàn)V波特性,在目標(biāo)說話人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲),同時,通過回聲消除技術(shù),過濾掉音頻設(shè)備發(fā)出的聲音,讓語音識別引擎獲取的用戶聲音更為清晰純凈。
 

\
 

由于麥克風(fēng)陣列會不可避免的拾取部分行車環(huán)境噪音,影響語音識別率,對此,捷通華聲綜合考慮車內(nèi)物理結(jié)構(gòu)和車速變化,對駕車過程中的車外胎噪、風(fēng)噪,車內(nèi)空調(diào)聲、引擎聲等車載環(huán)境噪音信息進(jìn)行建模,并用大量的實(shí)際行車噪音數(shù)據(jù)進(jìn)行訓(xùn)練,進(jìn)一步優(yōu)化語音識別引擎,推出了針對抗噪的深度學(xué)習(xí)算法和自適應(yīng)車內(nèi)噪音的聲學(xué)模型,讓靈云語音識別具備極強(qiáng)的抗噪性,輕松應(yīng)對常見車載環(huán)境噪音。同時,該技術(shù)采用深度神經(jīng)網(wǎng)絡(luò)算法(DNN)算法,可在用戶的使用過程中,通過利用積累的語音數(shù)據(jù)來訓(xùn)練、優(yōu)化算法,不斷提升語音識別率,讓司機(jī)與車載設(shè)備的語音交互越來越流暢。

靈云遠(yuǎn)場語音交互解決方案 全面滿足司機(jī)需求

      為了全面滿足司機(jī)駕駛途中的各種實(shí)際需求,靈云遠(yuǎn)場語音交互解決方案在實(shí)現(xiàn)打電話、發(fā)短信、聽音樂、地圖導(dǎo)航、設(shè)備控制等眾多語音控制的同時,為司機(jī)提供天氣、新聞、故事、股票、火車、航班、餐飲等30多種云端信息與內(nèi)容服務(wù)。

      在駕車過程中,司機(jī)只要說出喚醒詞,如“小靈開機(jī)”,車載設(shè)備便會開啟,并面向司機(jī)方向形成拾音波束。司機(jī)說“為我導(dǎo)航至天安門”,車載設(shè)備便會自動規(guī)劃路線并進(jìn)行導(dǎo)航,路上需要打電話時,司機(jī)可以說“給xx打電話”、“打電話給xx”,或者直接報(bào)出電話號碼,電話便會自動撥出,當(dāng)電話號碼識別有誤時,司機(jī)可通過多輪對話方便地進(jìn)行糾錯。打完電話,如果想聽首歌放松一下,可以直接說“放首青花瓷”、“來首周杰倫的歌”,或者“播放周杰倫的青花瓷”,車載設(shè)備都能輕松識別;如果想了解最新信息,無論是天氣、新聞,還是股票、航班信息,只要說出來,都可以從云端輕松獲;如果你想吹吹風(fēng)、透透氣,也無需親自動手,只需說“開窗”,車窗便會自動落下,真正實(shí)現(xiàn)語音控制,把司機(jī)的眼睛和雙手還給駕駛,為行車安全保駕護(hù)航。

\

除此之外,靈云遠(yuǎn)場語音交互解決方案具備獨(dú)特的優(yōu)點(diǎn):語音識別方面,捷通華聲通過用怠速、中速、高速、開窗、關(guān)窗以及空調(diào)弱風(fēng)、強(qiáng)風(fēng)等各種駕駛狀況下的海量真實(shí)錄音數(shù)據(jù)對ASR引擎經(jīng)行訓(xùn)練優(yōu)化,讓靈云語音識別技術(shù)能夠輕松應(yīng)對各種行車環(huán)境噪音,語音識別正確率和實(shí)時率已達(dá)行業(yè)領(lǐng)先水平;語音合成方面,靈云語音合成提供男聲、女聲、可愛童聲等多種音色供用戶選擇,滿足不同用戶的個性化需求。同時,捷通華聲充分考慮目前的網(wǎng)絡(luò)覆蓋狀況,為用戶提供本地與云端相結(jié)合的語音交互服務(wù),即使汽車行駛在沒有網(wǎng)絡(luò)的偏遠(yuǎn)地區(qū),也能使用語音交互來輕松控制車載設(shè)備。

捷通華聲堅(jiān)持合作共贏 與廣大合作伙伴共享產(chǎn)業(yè)機(jī)遇

       靈云遠(yuǎn)場語音交互技術(shù)源自于捷通華聲于2011年推出的首個全方位人工智能開放平臺——靈云平臺(hcicloud.com),靈云平臺面向產(chǎn)業(yè)全面開放,并以“云+端”方式,為產(chǎn)業(yè)界提供語音合成、語音識別、語義理解、機(jī)器翻譯、OCR、手寫識別、人臉識別、聲紋識別、指紋識別等全方位人工智能能力。

       通過完美整合靈云語音識別、語音合成、語義理解等核心技術(shù)以及靈云多麥克風(fēng)陣列,靈云遠(yuǎn)場語音交互解決方案有效克服了噪音干擾,徹底打破智能車載設(shè)備應(yīng)用語音交互技術(shù)的產(chǎn)業(yè)瓶頸,為國內(nèi)廣大智能車載設(shè)備廠商、解決方案提供商、軟件開發(fā)商等行業(yè)伙伴提供麥克風(fēng)陣列、云+端語音交互、內(nèi)容服務(wù)等軟硬件一體的智能語音交互解決方案。捷通華聲始終堅(jiān)持“合作共贏”的發(fā)展理念,堅(jiān)持不與合作伙伴爭利,通過與合作伙伴精誠合作,共同推動智能語音交互在中國智能車載領(lǐng)域的普及化應(yīng)用。

      未來發(fā)展,捷通華聲將繼續(xù)以清華大學(xué)人工智能研究力量為依托,更加專注智能語音等人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應(yīng)用,通過與產(chǎn)業(yè)內(nèi)合作伙伴的精誠合作,共同推動中國智能車載設(shè)備全面服務(wù)社會大眾,共同加快智能化生活時代到來的步伐!

關(guān)鍵詞:捷通華聲