微信時代,在緊張的辦公中,收到對方大段一分鐘長的音頻時,內(nèi)心其實是崩潰的。于是,越來越多人開始選擇語音輸入,輕松了自己,更方便了他人。
然而選擇語音輸入的另一個問題就是:不得不面對的語音識別速度。一旦網(wǎng)絡(luò)環(huán)境稍差,識別速度就堪稱“龜速”,而在沒網(wǎng)的情況下,就只能面對著“網(wǎng)絡(luò)在打盹兒,稍后在試吧!”而興嘆了。
近期,捷通華聲針對靈云語音識別SDK進(jìn)行全新升級,更改vad引擎并優(yōu)化了效果,大幅提升了識別率以及識別速度,并增加了ASR的雙路識別功能,更能保障識別的準(zhǔn)確率與成功率。
除了語音識別SDK,靈云語義理解SDK、語音合成SDK也得到了相應(yīng)的升級優(yōu)化,從而實現(xiàn)更快、更優(yōu)質(zhì)的人機(jī)語音交互。開發(fā)者登陸靈云平臺(www.aicloud.com),進(jìn)入開發(fā)者社區(qū),即可下載相關(guān)SDK,讓你的APP不再忍受語音交互的等待之苦。
靈云語音識別 中國智能語音領(lǐng)軍品牌
捷通華聲作為國內(nèi)最早從事中文智能語音技術(shù)研究與應(yīng)用的高新技術(shù)企業(yè),擁有行業(yè)頂尖的靈云語音識別技術(shù)。識別技術(shù)采用行業(yè)領(lǐng)先的深度學(xué)習(xí)算法,具備了識別率高、響應(yīng)速度快、支持話者分離和智能語音端點檢測,口音和方言適應(yīng)能力強(qiáng)等優(yōu)點。
除支持中文識別已達(dá)國內(nèi)領(lǐng)先水平外,靈云語音識別還支持英文、維語、粵語等多語種識別,其中,中文普通話,識別率可達(dá)97%以上,實時率在0.3以下,并可通過語言模型定制和聲學(xué)模型定制,在短時間內(nèi)大幅提升專業(yè)領(lǐng)域的語音識別率。
結(jié)合靈云語音識別技術(shù),捷通華聲在靈云平臺上為開發(fā)者提供的靈云語音識別SDK可支持HTTP、Socket、WebService以及MRCP接口,且支持詞表識別、語法識別和自由說識別,可以在用戶終端進(jìn)行語音識別,也可以在云端進(jìn)行語音識別,并能根據(jù)不同領(lǐng)域的需求進(jìn)行個性化定制。
大規(guī)模語音實現(xiàn)高效、實時、精準(zhǔn)轉(zhuǎn)寫
靈云語音識別技術(shù)的快速進(jìn)步,給企業(yè)創(chuàng)新發(fā)展、提高效率帶來了新機(jī)遇,讓更多企業(yè)享受到靈云人工智能技術(shù)帶來的方便與快捷。
新升級的靈云語音識別SDK,以及靈云語義理解SDK、語音合成SDK、靈云種子,配合捷通華聲專門推出的靈云麥克風(fēng)陣列技術(shù),不僅能夠輕松實現(xiàn)電視、空調(diào)、音箱、機(jī)器人、車載系統(tǒng)的遠(yuǎn)場精準(zhǔn)語音交互,也讓交互等待時間不再漫長、卡頓。
在各類會議的文字直播中,新升級的靈云語音識別能更加實時、高效地將會議情況進(jìn)行文字轉(zhuǎn)播,從而達(dá)到同步轉(zhuǎn)寫的效果,庭審記錄中將庭審現(xiàn)場實時記錄轉(zhuǎn)寫下來,大幅減輕速記員等文字工作者的工作量,提升了信息的傳播效率。
在客服、呼叫中心領(lǐng)域,語音識別技術(shù)將坐席與用戶的電話實時轉(zhuǎn)寫為文字,識別速度及準(zhǔn)確率的提升,讓溝通與文字的轉(zhuǎn)寫變得更為同步。在靈云智能語音導(dǎo)航系統(tǒng)以及靈云智能外呼機(jī)器人上,這一升級體現(xiàn)的更為明顯,接打外呼機(jī)器人或機(jī)器人客服的電話溝通交流時,我們再也不用為機(jī)器人長時間的“思考”而苦苦等待了,用戶體驗得到顯著提升。
未來,捷通華聲將進(jìn)一步深化與清華大學(xué)“靈云科技源自清華”的戰(zhàn)略合作,不斷提升靈云語音識別、語義理解、語音合成、人臉識別等各項技術(shù)的能力,讓大眾能夠體驗到人工智能帶來的方便與快捷。開發(fā)者可以到靈云平臺上下載體驗包括靈云語音識別、語義理解、語音合成、人臉識別、OCR識別、聲紋識別等多種能力在內(nèi)的SDK。