POST TIME:2021-07-12 15:55
智能電話機器人公司在介紹電話機器人技術的時候,都會提到三大核心技術:ASR、NLP、TTS,也都會說是公司自主研發(fā)的技術.
然后,市場上大多數(shù)電話機器人公司的這三大核心技術都不是自己的,都是租用或者免費接入阿里、百度、科大訊飛(002230)的開放版引擎系統(tǒng).
今天,我們來了解一下智能電話機器人的其中一個技術:自然語言處理,簡稱為NLP.
什么是自然語言處理?
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向.它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法.自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的科學.因此,這一領域的研究將涉及自然語言,即人們?nèi)粘J褂玫恼Z言,所以它與語言學的研究有著密切的聯(lián)系,但又有重要的區(qū)別.
自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現(xiàn)自然語言通信的計算機系統(tǒng),特別是其中的軟件系統(tǒng).因而它是計算機科學的一部分.
自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類(自然)語言之間的相互作用的領域.
用一句通俗易懂的話來表達一下,自然語言處理是智能電話機器人的大腦,它是聽懂并理解人類語言的關鍵技術,聽懂人類語言表達的意思才能夠回應人類,產(chǎn)生真正的人機交互.
哪些公司擁有NLP技術?
微軟亞洲研究院1998年成立自然語言計算組,研究內(nèi)容包括多國語言文本分析、機器翻譯、跨語言信息檢索和自動問答系統(tǒng)等.
Google是最早開始研究自然語言處理技術的團隊之一,作為一個以搜索為核心的公司,Google對自然語言處理更為重視.
百度自然語言處理部是百度最早成立的部門之一,研究涉及深度問答、機器翻譯、閱讀理解、語言分析、語義計算、對話系統(tǒng)等方面.
阿里自然語言處理為其產(chǎn)品服務,在電商平臺中構(gòu)建知識圖譜實現(xiàn)智能導購,同時進行全網(wǎng)用戶興趣挖掘,在客服場景中也運用自然語言處理技術打造機器人客服.
AI Lab是騰訊的人工智能實驗室,研究領域包括計算機視覺、語音識別、自然語言處理、機器學習等.
京東在人工智能的浪潮中也不甘落后.京東AI開放平臺基本上由模型定制化平臺和在線服務模塊構(gòu)成,其中在線服務模塊包括計算機視覺、語音交互、自然語言處理和機器學習等.
科大訊飛是一家從事智能語音及語言技術、人工智能技術研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務的公司,對于語音識別、自然語言處理也有自己的核心技術.
同花順(300033)從2009年開始布局人工智能,經(jīng)過多年在金融證券領域的數(shù)據(jù)積累和近些年來對機器學習、深度學習等前沿技術的大力投入,已經(jīng)在語音識別、自然語言處理領域有了相當深厚的技術積淀.
自研NLP和租用NLP效果一樣嗎?
自然語言處理技術是智能電話機器人三大核心技術之一,那么很多企業(yè)在選擇的時候,都會有這么一個問題:自主研發(fā)的NLP效果和租用或者外部接入的NLP效果一樣嗎?
從理論角度上來說,同一家公司的自然語言處理技術,在自用的情況下和租用的情況下效果是一樣的,幾乎沒有差別.
但從實際應用來說,因為租用的自然語言處理系統(tǒng)并不在本地服務器上,而是需要通過網(wǎng)絡傳輸方式去調(diào)用第三方的系統(tǒng),所以自然語言處理的理解準確度及輸出穩(wěn)定性都是存在巨大風險和差別的.
例如會因為網(wǎng)絡的原因?qū)е吕斫庋舆t、部分理解缺失、理解錯誤等,還會存在并發(fā)數(shù)量限制等問題,一條數(shù)據(jù)的處理和N條數(shù)據(jù)的處理完全是兩種不同的狀態(tài).
人們都常說:身體是革命的本錢.
我想說:在人工智能產(chǎn)品不斷更新迭代的市場中,技術是產(chǎn)品的核心,連核心的技術都不是自家的,談何產(chǎn)品有多好?