新發(fā)展格局下,產(chǎn)業(yè)數(shù)字化驅(qū)動人工智能向多元化、融合化發(fā)展,技術(shù)輸出‘厚度’增加,‘邊界’擴(kuò)大,智慧城市加速構(gòu)建,‘泛在智能’初見雛形。捷通華聲董事長武衛(wèi)東在接受億歐智庫獨(dú)家專訪中,對人工智能產(chǎn)業(yè)發(fā)展給出了這樣的判斷。同時(shí),結(jié)合自身20余年的發(fā)展歷程,與億歐智庫針對智能語音市場現(xiàn)狀與發(fā)展趨勢進(jìn)行了深度探討。
2000年,幾位清華學(xué)子懷著讓機(jī)器‘能說會聽,能寫會看,能辨音會認(rèn)人,能思考會判斷’,為人們的生活帶來輕松與便捷的美好愿望,成立捷通華聲,是國內(nèi)最早投入人工智能領(lǐng)域的創(chuàng)業(yè)團(tuán)隊(duì)之一。
2011年,基于深度神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型在大詞匯量連續(xù)語音識別任務(wù)上獲得了顯著的性能提升,智能語音領(lǐng)域研究開始轉(zhuǎn)向深度學(xué)習(xí)。這一年,捷通華聲對外發(fā)布靈云平臺,將語音識別、語音合成、語義理解、機(jī)器翻譯等智能語音、智能語義技術(shù)面向產(chǎn)業(yè)全面開放。
2016年,語音識別準(zhǔn)確率第一次達(dá)到人類水平,進(jìn)入快速落地期。智能語音成為金融、能源、電信、互聯(lián)網(wǎng)等行業(yè)產(chǎn)業(yè)提升發(fā)展戰(zhàn)略的關(guān)鍵詞。人工智能發(fā)展進(jìn)入新階段,成為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力。
深耕AI二十載,匠心鑄就領(lǐng)先。本著對核心技術(shù)孜孜不倦的探索精神和務(wù)實(shí)推進(jìn)的原則,捷通華聲在不斷摸索中走出了自己的道路,即以自主研發(fā)的人工智能算法為核心,以市場應(yīng)用為導(dǎo)向,推進(jìn)智能語音、智能語義等技術(shù)研發(fā)持續(xù)創(chuàng)新與融合,形成由技術(shù)到平臺、由產(chǎn)品到解決方案全覆蓋的產(chǎn)業(yè)生態(tài),全面融入經(jīng)濟(jì)社會發(fā)展。
語音是人類最直接、最簡潔的交流方式。同樣,以實(shí)現(xiàn)人和機(jī)器像人與人一樣無障礙交流為使命的智能語音技術(shù),被認(rèn)為是數(shù)智化時(shí)代萬物智聯(lián)最方便的入口。相對整個(gè)人工智能產(chǎn)業(yè),智能語音產(chǎn)業(yè)化程度更高,是所占份額比例較大的細(xì)分領(lǐng)域,正以其廣闊的產(chǎn)業(yè)化應(yīng)用席卷人們?nèi)粘I詈凸ぷ鞯姆椒矫婷妗?/div>
提到智能語音,公眾最直觀的感受可能是語音識別,但實(shí)際上智能語音所包含的內(nèi)容遠(yuǎn)比我們想象的復(fù)雜。武衛(wèi)東介紹到。
完整的智能語音包括聲音信號的前端處理、將聲音轉(zhuǎn)為文字供機(jī)器處理、在機(jī)器生成語言之后,用語音合成技術(shù)將文本語言轉(zhuǎn)化為聲波,從而形成完整的人機(jī)語音交互鏈條。背后涉及聲學(xué)研究、語言學(xué)研究、數(shù)字信號處理、自然語音處理研究及垂直場景的深度語義理解,如果要感知聲音的起止、講話人身份和語種等特征,還需另外進(jìn)行語音喚醒、聲紋識別和語種分類等任務(wù)。就像一個(gè)拼接的木桶,每一個(gè)環(huán)節(jié)出現(xiàn)短板,都將直接影響最終交互結(jié)果。
捷通華聲與清華大學(xué)合作,成立靈云人工智能研究中心、清華海峽院人工智能研究中心,不斷加強(qiáng)對核心技術(shù)的研發(fā)投入,強(qiáng)化每一個(gè)板塊,實(shí)現(xiàn)語音識別、語音合成、語義理解、機(jī)器翻譯等多項(xiàng)技術(shù)保持行業(yè)領(lǐng)先,同時(shí)推動各項(xiàng)技術(shù)交叉融合,為人工智能持續(xù)發(fā)展積蓄力量。
正是對核心技術(shù)不斷創(chuàng)新和融合發(fā)展的堅(jiān)持,捷通華聲在推進(jìn)各行業(yè)智能化發(fā)展的過程中形成了自身獨(dú)特的優(yōu)勢,成長為中國人工智能技術(shù)實(shí)力的引領(lǐng)者和產(chǎn)業(yè)化應(yīng)用的探索者。
資本是推手,技術(shù)是核心,產(chǎn)業(yè)需求才是根本
政策與市場雙重驅(qū)動下,人工智能行業(yè)迎來了發(fā)展的黃金時(shí)代。作為萬物智聯(lián)的入口,語音賽道更是有參與者不斷入局。但需要注意的是,這些企業(yè)雖然估值很高,盈利能力卻很有限,甚至可能還在虧本。
人工智能產(chǎn)業(yè)發(fā)展過程中,資本是推手,技術(shù)是核心,產(chǎn)業(yè)需求才是根本。武衛(wèi)東這樣向記者釋疑。
高新技術(shù)是高投入、高回報(bào)、高風(fēng)險(xiǎn)的領(lǐng)域,人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),很受資本青睞。但是,僅依賴資本驅(qū)動,容易出現(xiàn)在投入、建設(shè)階段大干快上,卻在應(yīng)用環(huán)節(jié)掉鏈子的行為。
在人工智能領(lǐng)域,技術(shù)積累是一個(gè)漫長的過程,短期內(nèi)人工智能服務(wù)商難以將技術(shù)直接轉(zhuǎn)化收入,缺乏造血機(jī)能,也就無法提升實(shí)體產(chǎn)業(yè)效率和效益。
風(fēng)口期快速積累資本,海量宣傳擴(kuò)大企業(yè)知名度,再次吸引資本用于擴(kuò)充疆土,規(guī)劃盈利目標(biāo)進(jìn)行上市,這種模式很難形成核心競爭力,自然缺乏造血機(jī)能。
人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力,其本質(zhì)是科技進(jìn)步對所有產(chǎn)業(yè)的提升。只有當(dāng)人工智能實(shí)現(xiàn)與各傳統(tǒng)產(chǎn)業(yè)融合應(yīng)用,才能創(chuàng)造經(jīng)濟(jì)和社會價(jià)值。場景決定應(yīng)用、應(yīng)用決定市場、市場決定企業(yè)發(fā)展前景,武衛(wèi)東說到。
產(chǎn)業(yè)數(shù)字化發(fā)展初期,通用型方案無法滿足定制化需求,每個(gè)行業(yè)都有自己的問題要解決,有應(yīng)用場景要突破,需要技術(shù)跟場景的深度融合,單一的AI能力已經(jīng)無法滿足。技術(shù)和產(chǎn)業(yè)不匹配,是現(xiàn)階段很多AI企業(yè)面臨的困境。而且產(chǎn)業(yè)落地是有時(shí)間周期的,需要人工智能服務(wù)商具備一定的行業(yè)沉淀以及行業(yè)理解,進(jìn)行能力融合、應(yīng)用融合和場景融合。只有提升行業(yè)的垂直縱深,技術(shù)才能擁有更大的落地價(jià)值。
明者因時(shí)而變,知者隨事而制。經(jīng)過多年的實(shí)戰(zhàn)積累,捷通華聲對于人工智能的場景化應(yīng)用經(jīng)驗(yàn)頗豐,通過AI能力中臺和AI數(shù)據(jù)中臺雙驅(qū)動,廣泛賦能智慧城市、數(shù)字金融、智慧社區(qū)、智慧醫(yī)療、數(shù)字政府、智能交通等數(shù)字化應(yīng)用場景。
堅(jiān)持以核心技術(shù)突破為根本,以場景深度融合應(yīng)用為目標(biāo),不斷將市場趨勢和用戶需求落地為方案和產(chǎn)品,是捷通華聲創(chuàng)造良好造血機(jī)能,成為行業(yè)內(nèi)少有的盈利企業(yè),并持續(xù)保持領(lǐng)先的秘訣所在。
做有價(jià)值的人工智能
在談及捷通華聲未來發(fā)展規(guī)劃時(shí),武衛(wèi)東表示,捷通華聲的初心一直沒有變,讓每一家企業(yè)都能擁有人工智能,讓每一個(gè)人都能享受人工智能帶來的輕松與便捷。
在人工智能領(lǐng)域,我們和世界發(fā)達(dá)國家仍存在一定的技術(shù)差距。堅(jiān)持自主研發(fā),全面增強(qiáng)原始創(chuàng)新能力,在新一輪國際科技競爭中掌握主導(dǎo)權(quán),是中國所有科技作者,包括捷通華聲的價(jià)值追求。也是責(zé)任,我們將繼續(xù)探尋人工智能發(fā)展趨勢,堅(jiān)持對核心技術(shù)的研發(fā)投入,力爭在行業(yè)持續(xù)領(lǐng)先。武衛(wèi)東表示。
人工智能深度融合實(shí)體經(jīng)濟(jì)是當(dāng)前我國重要的經(jīng)濟(jì)戰(zhàn)略。捷通華聲作為智能語音龍頭企業(yè),責(zé)無旁貸。武衛(wèi)東認(rèn)為,重點(diǎn)在于人工智能應(yīng)用于傳統(tǒng)行業(yè)和服務(wù)業(yè),提升實(shí)體經(jīng)濟(jì)智能化水平。捷通華聲在服務(wù)客戶過程中,積累了豐富的智能化升級經(jīng)驗(yàn),我們將向全產(chǎn)業(yè)推廣。
捷通華聲也在積極探索人工智能技術(shù)在社區(qū)養(yǎng)老等民生場景下的適用性。目前,已形成以靈云社區(qū)AI運(yùn)營大腦為核心,以設(shè)備數(shù)據(jù)信息橋、政府居民連心橋、社區(qū)生活便民橋?yàn)闃蛄海ㄟ^靈云鄰?fù)贤?、社區(qū)安防治理、社區(qū)咨詢服務(wù)、智慧生活服務(wù)、社區(qū)黨建文化、健康養(yǎng)老服務(wù)六大場景賦能智慧社區(qū)養(yǎng)老建設(shè),打造老年人能用、會用、敢用、想用的智能化產(chǎn)品和服務(wù)應(yīng)用。
武衛(wèi)東說,我有兩個(gè)愿望,一個(gè)是看到我們國家科技進(jìn)步,更加強(qiáng)大。另一個(gè)就是盡捷通華聲最大的能力,推動中國人工智能產(chǎn)業(yè)發(fā)展,為經(jīng)濟(jì)社會發(fā)展貢獻(xiàn)一份力量。