隨著AI技術(shù)的發(fā)展,語(yǔ)音交互功能也在不斷地進(jìn)化,從最初的語(yǔ)音喚醒、語(yǔ)音識(shí)別,到現(xiàn)在的語(yǔ)義理解能力。但AI在智能水平上始終落后于人,目前最大的短板是認(rèn)知能力不足。比如,當(dāng)機(jī)器人和人對(duì)話時(shí),我們無(wú)法判斷什么時(shí)候需要給出回應(yīng)或者給不出回應(yīng);當(dāng)我們跟人對(duì)話但他(她)沒(méi)有及時(shí)回答時(shí)……基于這樣巨大的認(rèn)知差距,AI語(yǔ)音技術(shù)在不斷進(jìn)化中,從最初的單一語(yǔ)音喚醒、聲紋識(shí)別和語(yǔ)義理解功能逐步發(fā)展到多功能的問(wèn)答、對(duì)話、娛樂(lè)等場(chǎng)景。在今天我們來(lái)看一下不同場(chǎng)景下AI語(yǔ)音技術(shù)解決方案。
1、醫(yī)療行業(yè)
醫(yī)療行業(yè)是最能體現(xiàn)AI價(jià)值的行業(yè)之一,因?yàn)獒t(yī)療涉及到大量的知識(shí),比如醫(yī)學(xué)領(lǐng)域、疾病相關(guān)等。
如果使用傳統(tǒng)的方式去咨詢,患者很可能需要在海量的醫(yī)療信息中檢索自己想要了解的知識(shí)或者問(wèn)題。
如果有AI智能問(wèn)答機(jī)器人,就可以快速獲取患者信息,從而幫助醫(yī)生診斷病情以及給出治療方案。
目前在這方面已經(jīng)有了不少智能交互機(jī)器人解決方案的應(yīng)用,比如丁香園平臺(tái)、小咖助手平臺(tái)等等。
此外,語(yǔ)音交互已經(jīng)逐漸從人機(jī)交互過(guò)渡到人機(jī)混合交互時(shí)代,例如智能對(duì)話機(jī)器人就是一個(gè)很好的例子,不僅可以幫助醫(yī)生在問(wèn)診時(shí)解決患者遇到的問(wèn)題與困難,而且可以在一定程度上降低醫(yī)患溝通時(shí)產(chǎn)生的負(fù)面情緒。
2、教育行業(yè)
教育是社會(huì)中最大的剛需,是人們生活和工作最重要的組成部分,在教育行業(yè)可以看到很多AI技術(shù)的應(yīng)用,比如AI技術(shù)在英語(yǔ)口語(yǔ)上的應(yīng)用;AI技術(shù)在教育行業(yè)中的應(yīng)用;AI技術(shù)+教育行業(yè)相關(guān)知識(shí)的結(jié)合等等。
通過(guò)語(yǔ)音交互來(lái)實(shí)現(xiàn)對(duì)話式學(xué)習(xí)和互動(dòng)練習(xí),并利用大數(shù)據(jù)分析來(lái)幫助老師對(duì)學(xué)生的學(xué)習(xí)進(jìn)行反饋,這是人工智能語(yǔ)音發(fā)展最重要內(nèi)容。
目前很多學(xué)校和企業(yè)都有使用語(yǔ)音機(jī)器人與學(xué)生進(jìn)行互動(dòng),幫助學(xué)生解決問(wèn)題,提高學(xué)習(xí)效率。
語(yǔ)音交互系統(tǒng)包括:多輪對(duì)話、多輪問(wèn)答、個(gè)性化推薦等功能。
隨著智能設(shè)備及人工智能技術(shù)應(yīng)用市場(chǎng)規(guī)模擴(kuò)大及應(yīng)用場(chǎng)景不斷拓展和豐富,在未來(lái)2-3年內(nèi)我國(guó)將會(huì)出現(xiàn)一批基于語(yǔ)音交互產(chǎn)品/系統(tǒng)平臺(tái)并融合云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等新興技術(shù)形成新型教育生態(tài)系統(tǒng)中的人工智能產(chǎn)品/系統(tǒng)平臺(tái)及其應(yīng)用。
3、汽車行業(yè)
語(yǔ)音交互的優(yōu)勢(shì)在于簡(jiǎn)單、方便、自然,可以很好地與用戶溝通,并且可以將汽車語(yǔ)音交互能力延伸到生活中,可以給用戶帶來(lái)更多便捷體驗(yàn),所以汽車行業(yè)是未來(lái)很有發(fā)展前景的一個(gè)應(yīng)用領(lǐng)域。
通過(guò)語(yǔ)音識(shí)別(TTS)功能完成對(duì)客戶相關(guān)信息的采集、匹配等,并通過(guò)語(yǔ)義理解將用戶意圖轉(zhuǎn)化為可執(zhí)行指令。
除了上述兩個(gè)應(yīng)用場(chǎng)景以外,還有很多不同類型的應(yīng)用場(chǎng)景下都可以使用AI語(yǔ)音技術(shù)進(jìn)行解決。
例如:智能客服、智能導(dǎo)購(gòu)機(jī)器人、聊天機(jī)器人等。
4、娛樂(lè)行業(yè)
隨著科技的發(fā)展,AI語(yǔ)音機(jī)器人的應(yīng)用范圍越來(lái)越廣,比如游戲中、出行中等等。
但是,在不同的場(chǎng)景下又有不同的需求和解決方案,比如在商業(yè)營(yíng)銷場(chǎng)景上,有廣告類的機(jī)器人與銷售類機(jī)器人;再比如在生活、娛樂(lè)等行業(yè),又有些不同。
比如,在商業(yè)營(yíng)銷廣告場(chǎng)景上,我們需要將用戶的語(yǔ)音轉(zhuǎn)化為文字內(nèi)容;
例如:當(dāng)用戶用語(yǔ)音搜索想看電影時(shí);當(dāng)用戶要查天氣信息時(shí)。
而通過(guò)自然語(yǔ)言處理技術(shù)來(lái)解決上述問(wèn)題,將問(wèn)題進(jìn)行識(shí)別、理解、分類與排序等步驟后便可得到結(jié)果。
(文章轉(zhuǎn)載于天潤(rùn)融通)