近日,我們的“一站式智能語音識(shí)別方案”將實(shí)現(xiàn)升級(jí)。升級(jí)后,在原有合作伙伴“數(shù)美科技”基礎(chǔ)上,將新增依圖、阿里云這兩家智能語音識(shí)別服務(wù)商,通過整合行業(yè)TOP3服務(wù)商的語音識(shí)別技術(shù)優(yōu)勢(shì),幫助直播、語音聊天室等互聯(lián)網(wǎng)平臺(tái)更智能、高效的識(shí)別語音中存在的涉黃、涉政、廣告等不良信息,實(shí)現(xiàn)全面、深入地凈化平臺(tái)網(wǎng)絡(luò)環(huán)境。
依圖、阿里云重磅加入,智能語音識(shí)別方案升級(jí)
近年來,隨著直播、短視頻、語音社交等行業(yè)的快速發(fā)展,由用戶創(chuàng)造的UGC內(nèi)容成為了互聯(lián)網(wǎng)內(nèi)容生態(tài)的重要構(gòu)成,并豐富了人們的互聯(lián)網(wǎng)生活。而另一方面,隨著用戶UGC內(nèi)容越來越多,涉黃、涉政、不良廣告等違法、違規(guī)的內(nèi)容也頻頻出現(xiàn),成為了“害群之馬”,給很多平臺(tái)帶來了風(fēng)險(xiǎn)。同時(shí),相對(duì)于圖文和視頻,音頻審核本身在技術(shù)上也更具難度,又增加了平臺(tái)方的內(nèi)容審核壓力。
在去年8月,聲網(wǎng)Agora就推出了“一站式智能語音識(shí)別方案”,為企業(yè)提供可集成實(shí)時(shí)音視頻、實(shí)時(shí)錄制和實(shí)時(shí)智能語音識(shí)別的一站式服務(wù),在語音識(shí)別服務(wù)方面接入了數(shù)美科技的“天凈”智能語音審核系統(tǒng),通過聲紋檢測(cè)、語音識(shí)別等技術(shù),智能識(shí)別語音環(huán)境中的涉黃、涉政、廣告等違法違規(guī)信息,受到了很多企業(yè)的好評(píng)。
而此次升級(jí)后的“一站式智能語音識(shí)別方案”新增接入了阿里云、依圖科技先進(jìn)、智能的語音識(shí)別技術(shù),整合了業(yè)界TOP3智能語音識(shí)別服務(wù)商的技術(shù)優(yōu)勢(shì)以提供目前互聯(lián)網(wǎng)行業(yè)最全面、最高效的智能語音識(shí)別技術(shù)。例如,數(shù)美科技的“天凈”智能語音識(shí)別,基于深度學(xué)習(xí)語音識(shí)別技術(shù),多維度智能實(shí)時(shí)審核。深挖場(chǎng)景需求,為直播視頻流、UGC短視頻、FM電臺(tái)、語音廣場(chǎng)、語音直播間等各類場(chǎng)景提供智能內(nèi)容過濾服務(wù),通過語音識(shí)別轉(zhuǎn)文本的方式,識(shí)別文本內(nèi)容中涉政、色情、廣告等不良信息;業(yè)內(nèi)首創(chuàng)的嬌喘語音識(shí)別,基于基于Bi-GRU、Attention模型,精準(zhǔn)識(shí)別聲音中含有嬌喘、呻吟、耳騷、喊麥等違規(guī)音頻,準(zhǔn)確率達(dá)到90%以上。聲紋識(shí)別與檢索對(duì)比”技術(shù)可進(jìn)行聲紋聚類、關(guān)聯(lián),發(fā)現(xiàn)線上、線下語音廣告與欺詐行為等。
而依圖科技在公共安全領(lǐng)域早已深耕多年。依靠世界級(jí)算法團(tuán)隊(duì)自研的語音識(shí)別、自然語言理解和聲紋算法,依圖的“智能語音審核”擁有準(zhǔn)、快、省三大特點(diǎn)。準(zhǔn)——憑借世界級(jí)算法能力加已有場(chǎng)景數(shù)據(jù)的螺旋迭代提升,依圖的召回和準(zhǔn)確率居行業(yè)前列,幫企業(yè)最大程度的降低風(fēng)險(xiǎn)???mdash;—實(shí)時(shí)監(jiān)測(cè)并在3秒內(nèi)返回結(jié)果。省——同步返回高精準(zhǔn)轉(zhuǎn)寫文本和違規(guī)音頻片段,幫人工審核員提高效率、節(jié)省時(shí)間。
打通實(shí)時(shí)音視頻+智能語音識(shí)別+AI,企業(yè)一站式接入
聲網(wǎng)Agora的“一站式智能語音識(shí)別方案”可為企業(yè)提供實(shí)時(shí)音視頻+實(shí)時(shí)錄制+實(shí)時(shí)智能語音識(shí)別的一站式高度集成服務(wù),也是目前唯一一家打通人工智能、實(shí)時(shí)語音識(shí)別、實(shí)時(shí)音視頻三大技術(shù)解決方案的服務(wù)商。使用聲網(wǎng)的一站式服務(wù),企業(yè)無需部署額外SDK、無需自己對(duì)接CDN廠商、更無需支付拉流成本,就可同時(shí)上線直播(實(shí)時(shí)音視頻)和鑒黃(實(shí)時(shí)語音識(shí)別)功能,幫助企業(yè)大幅節(jié)省接入成本,真正做到一站式方便接入。
在智能語音識(shí)別方面,聲網(wǎng)Agora整合了業(yè)界TOP3智能語音識(shí)別服務(wù)商的技術(shù)優(yōu)勢(shì)。而在實(shí)時(shí)音視頻功能方面,聲網(wǎng)自建的軟件定義實(shí)時(shí)網(wǎng)SD-RTN?專為實(shí)時(shí)音視頻業(yè)務(wù)提供SLA/QoS質(zhì)量保證,能為企業(yè)提供高并發(fā)、高可靠性、低延時(shí)和抗弱網(wǎng)等特性的實(shí)時(shí)音視頻技術(shù)。
聲網(wǎng)Agora目前在全球擁有250多個(gè)數(shù)據(jù)中心。在網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)上能夠應(yīng)對(duì)10倍以上的負(fù)荷,具備千萬級(jí)并發(fā)能力。聲網(wǎng)的軟件定義實(shí)時(shí)網(wǎng)SD-RTN™擁有超低延時(shí)特性,可做到全球端到端延時(shí)小于400ms,延時(shí)中位數(shù)76ms,處于行業(yè)領(lǐng)先水平。聲網(wǎng)還具備優(yōu)秀的弱網(wǎng)傳輸和抗丟包算法,可以在60%的丟包環(huán)境下保障音視頻流暢,70%的網(wǎng)絡(luò)丟包環(huán)境下保障語音的流暢。在終端性能和適配方面,聲網(wǎng)針對(duì)實(shí)時(shí)互聯(lián)網(wǎng)lastmile做了深度優(yōu)化,目前已經(jīng)適配6000多款終端設(shè)備,網(wǎng)絡(luò)覆蓋全球200多個(gè)國(guó)家和地區(qū),即使在網(wǎng)絡(luò)環(huán)境差的偏遠(yuǎn)山區(qū)或跨國(guó)場(chǎng)景中用戶也能實(shí)現(xiàn)順暢互動(dòng)。
此外,對(duì)于語音識(shí)別中常見的噪聲、背景音等音質(zhì)問題,聲網(wǎng)的一站式智能語音識(shí)別解決方案還融合聲網(wǎng)Agora語音引擎與AI音頻降噪算法,可提供去除背景音、環(huán)境音之后的高音質(zhì)音頻源,在原來算法的基礎(chǔ)上將不良信息的識(shí)別率有效提高30%以上。
通過聲網(wǎng)Agora的“一站式智能語音識(shí)別方案”可以幫助企業(yè)嚴(yán)格、有效的凈化平臺(tái)內(nèi)容質(zhì)量,降低監(jiān)管風(fēng)險(xiǎn),提升用戶體驗(yàn),同時(shí)還能為企業(yè)大幅節(jié)省接入成本。據(jù)了解,接下來聲網(wǎng)還將聯(lián)合更多業(yè)界知名智能語音識(shí)別服務(wù)商,為企業(yè)持續(xù)提供業(yè)界最高效、最嚴(yán)格的內(nèi)容審核機(jī)制,促進(jìn)網(wǎng)絡(luò)生態(tài)健康發(fā)展。