盗墓笔记有声小说,有声小说

主頁 > 知識庫 > 極限元語音合成為「有聲讀物」提供高質(zhì)量的情感合成音

極限元語音合成為「有聲讀物」提供高質(zhì)量的情感合成音

　　據(jù)中國新聞出版研究院數(shù)據(jù)顯示，2017年中國成年人的聽書率為22.8%，越來越多的人習(xí)慣于用耳朵聽而不是用眼睛看，有聲閱讀正在成為未來閱讀的新形式。生活節(jié)奏的加快，上班族習(xí)慣了通勤路上或者碎步化時(shí)間來收聽消息，所以能夠收聽新聞資訊、滿足閱讀需求的音頻類平臺、APP越來越受大眾喜歡。

　　聲音作為有聲閱讀中重要環(huán)節(jié)，是如何實(shí)現(xiàn)的？

　　傳統(tǒng)的聲音獲取可以通過找專業(yè)的聲優(yōu)進(jìn)行錄音或配音，而互聯(lián)網(wǎng)信息瞬息萬變，錄制的速度可能趕不上信息變化的速度，同時(shí)海量的內(nèi)容信息通過錄音工作量大且成本高，而人工智能技術(shù)的發(fā)展，語音合成技術(shù)改變了這一難題。

　　語音合成技術(shù)，從源頭解決聲音輸出的方式

　　極限元的語音合成技術(shù)采用國際先進(jìn)的數(shù)據(jù)驅(qū)動技術(shù)，利用精心設(shè)計(jì)的語音語料庫進(jìn)行聲學(xué)模型和文本處理模型的訓(xùn)練，得到的模型深度挖掘了語音語言特性，合成的語音清晰、自然、親切、具有高表現(xiàn)力，媲美真人發(fā)聲。

　　極限元的語音合成技術(shù)能夠?qū)崿F(xiàn)有聲閱讀下的多種平臺多種場景的應(yīng)用，如提供新聞資訊播報(bào)平臺、小說詩歌閱讀APP、音頻公眾號、智能音箱等。

　　適配于多用戶多場景下的“閱讀”體驗(yàn)

　　在面對多種人群多種閱讀內(nèi)容形式時(shí)，單一的合成語音已經(jīng)不能滿足需求，極限元語音合成能夠提供各類型男聲、女生及童聲。

　　還可根據(jù)用戶需求定制個(gè)性化音色服務(wù)，如：林志玲的嗲氣十足、郭德綱幽默逗趣、游戲動漫角色聲、各類方言等。極限元定制化語音合成支持錄音人選型、錄音采集、語料標(biāo)注，還能實(shí)現(xiàn)模型迭代訓(xùn)練、合成引擎優(yōu)化，支持在線、離線模式，適用于多種平臺。

　　極限元語音合成技術(shù)優(yōu)勢體現(xiàn)

　　數(shù)字、符號在生活中無處不在，同樣也充斥在閱讀的文本中，那么不同的數(shù)字，符號代表不同的意思，該如何處理呢？極限元語音合成技術(shù)能夠根據(jù)數(shù)字的上下文語境，做出智能判斷，以確保朗讀的正確性，例如10:12，可以表示十點(diǎn)十二分，也可能是比分十比十二，這就需要根據(jù)其上下文語境進(jìn)行判斷。

　　而對于符號，極限元語音合成技術(shù)能正確判斷這些符號的讀法，以及其符號與相鄰文本(數(shù)字)朗讀的先后順序。比如RMB100讀作“100元人民幣”，40%-50%讀作“百分之四十到百分之五十”。

　　語音合成技術(shù)中，讓聲音富有情感和表現(xiàn)力，一直是語音合成的一大難點(diǎn)，而極限元為了保證合成語音真實(shí)、自然、富有情感，適用于多種場景下，積極地與國際接軌。其創(chuàng)始團(tuán)隊(duì)源自中科院自動化研究所并成立“智能交互聯(lián)合實(shí)驗(yàn)室”，號稱語音合成界的“黃埔軍校”；在人工智能領(lǐng)域有20多年技術(shù)積累，在國際會議和期刊上發(fā)表論文400余篇，申請語音及音頻領(lǐng)域?qū)＠?00余項(xiàng)；作為負(fù)責(zé)人、科研骨干參與多項(xiàng)國家自然基金項(xiàng)目、國家863項(xiàng)目和國家重點(diǎn)研發(fā)計(jì)劃等項(xiàng)目，獲得多媒體情感競賽第二名、北京市自然科學(xué)進(jìn)步二等獎、中國專利獎優(yōu)秀獎、北京科技進(jìn)步獎、Eurospeech大會獎等多種獎項(xiàng)。

標(biāo)簽：三明辛集曲靖臺灣赤峰麗水秦皇島銅川

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《極限元語音合成為「有聲讀物」提供高質(zhì)量的情感合成音》，本文關(guān)鍵詞極限,元,語音,合,成為,有聲,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。