VocalZoom與科大訊飛攜手打造中國最普及的語音識(shí)別系統(tǒng)在噪音環(huán)境方面取得突破性進(jìn)展
- 早期測(cè)試顯示:VocalZoom的光學(xué)傳感器能將科大訊飛的聲控平臺(tái)的自動(dòng)語音識(shí)別(ASR)性能平均顯著提高50%以上。
- 最明顯的性能增強(qiáng)體現(xiàn)在最高噪音級(jí)別環(huán)境中,例如:將車窗保持打開狀態(tài)時(shí)駕駛汽車所產(chǎn)生的噪音。
- 很多公司正在探索將VocalZoom的傳感器技術(shù)與科大訊飛的“語音云”結(jié)合起來,而“語音云”是中國領(lǐng)先的移動(dòng)云和嵌入式應(yīng)用程序的智能語音平臺(tái)。
作為人機(jī)交流(HMC)光學(xué)傳感器的主要供應(yīng)商--VocalZoom,其產(chǎn)品可以帶來一種更自然、更個(gè)性化的、安全的聲控體驗(yàn)。今天該公司宣布,它已經(jīng)與科大訊飛簽署了一項(xiàng)協(xié)議,將VocalZoom的人機(jī)交流(HMC)光學(xué)傳感器與科大訊飛的“語音云”智能語音技術(shù)平臺(tái)相結(jié)合,并進(jìn)行性能測(cè)試;該平臺(tái)是在中國應(yīng)用最為廣泛的解決方案,擁有數(shù)以百萬計(jì)的用戶。初步結(jié)果表明,通過向用戶耳機(jī)和汽車信息娛樂解決方案中加入VocalZoom傳感器,科大訊飛的自動(dòng)語音識(shí)別(ASR)功能可以平均得到50%的改善,尤其在嘈雜的噪音環(huán)境中得到更多的改善。
“隨著我們不斷探索將兩種技術(shù)融合到語音控制和身份驗(yàn)證的革命性解決方案中,VocalZoom 和科大訊飛打算在本月完成聯(lián)合測(cè)試。我們通過使用更小、更時(shí)尚的耳機(jī)以及在各種各樣的應(yīng)用程序中的其他解決方案來共享更好的聲控體驗(yàn)。”
科大訊飛高級(jí)研究員王海坤(Haikun Wang)表示“根據(jù)全球主要基準(zhǔn)測(cè)試的標(biāo)準(zhǔn),科大訊飛已經(jīng)成為最好的聲控解決方案,但是當(dāng)前面臨的最大挑戰(zhàn)就是在噪音環(huán)境中的性能表現(xiàn)。我們相信VocalZoom的技術(shù)可以為我們?cè)谛阅芨纳品矫嫒〉猛黄菩赃M(jìn)步奠定基礎(chǔ)。” 他續(xù)指 “我們已經(jīng)在多個(gè)場(chǎng)景中測(cè)試了VocalZoom傳感器,其中包括將車窗保持打開狀態(tài)以及狂風(fēng)噪聲的環(huán)境下,在駕駛的汽車內(nèi)部所產(chǎn)生噪音的場(chǎng)景,而相應(yīng)的性能改善是相當(dāng)可觀的。”
使用虛擬助理和汽車語音控制的人機(jī)交互的關(guān)鍵是這臺(tái)機(jī)器是否可以完成人們指定的任務(wù),并且足夠快速、準(zhǔn)確地滿足用戶需求。即使是最新的降噪法,如今的聲學(xué)麥克風(fēng)在這種控制水平下仍舊不能達(dá)到足夠的聲音隔離效果,特別是在嘈雜的環(huán)境中。VocalZoom多功能人機(jī)交流(HMC)傳感器通過收集人在談話時(shí)的其他數(shù)據(jù)來解決這個(gè)問題,例如人在說話時(shí)嘴巴、嘴唇、臉頰和喉嚨附近的面部皮膚的震動(dòng)等數(shù)據(jù)。通過將VocalZoom光學(xué)人機(jī)交流(HMC)傳感器集成到聲控解決方案中,并令它著重針對(duì)這些領(lǐng)域,可以捕足、測(cè)量面部震動(dòng)的數(shù)據(jù),并將其轉(zhuǎn)換為一個(gè)獨(dú)立的、近乎完美的參考信號(hào)。系統(tǒng)可以通過這個(gè)信號(hào)進(jìn)行運(yùn)轉(zhuǎn),而不受噪音水平的影響。
“能夠與科大訊飛合作,顯著提高最為廣泛使用的自動(dòng)語音識(shí)別(ASR)平臺(tái)的性能,我們感到非常興奮,” VocalZoom銷售和業(yè)務(wù)發(fā)展副總裁Rammy Bahalul如是說。“隨著我們不斷探索將兩種技術(shù)融合到語音控制和身份驗(yàn)證的革命性解決方案中,VocalZoom 和科大訊飛打算在本月完成聯(lián)合測(cè)試。我們通過使用更小、更時(shí)尚的耳機(jī)以及在各種各樣的應(yīng)用程序中的其他解決方案來共享更好的聲控體驗(yàn)。”
VocalZoom和科大訊飛已經(jīng)測(cè)試了一個(gè)解決方案的性能,即在多個(gè)不同噪音級(jí)別的場(chǎng)景中以及結(jié)合音樂、汽車噪音和其他干擾因素的移動(dòng)汽車內(nèi)部,對(duì)兩家公司的技術(shù)相結(jié)合的解決方案進(jìn)行了測(cè)試。自動(dòng)語音識(shí)別(ASR)性能已經(jīng)被提高至一個(gè)幾乎完美的級(jí)別,而之前在同樣的高強(qiáng)度噪聲環(huán)境中,理想的聲控性能幾乎是不可能的。