本文目錄一覽:
1、電銷機器人是什么?
2、電話機器人是什么?
3、聊天機器人概述
4、打電話的機器人?
5、騰訊算法高級研究員陳松堅:智能問答技術及其應用
電銷機器人是什么?
電銷機器人,是一種AI機器人智能語音呼叫系統(tǒng),是一種智能電話機器人,模仿真人打電話,真人語音,每天拔打電話量高達2000到3000不等,工作效率非常高。當今房地產、金融、貸款、保險、裝修等行業(yè)都非常適合使用電銷機器人。
為各電銷行業(yè)提供一款全自動化電話機器人架構圖的智能電銷機器人
1、可以自動直找客戶號碼,自動找手機號碼;
2、智能設置自動執(zhí)行每天撥打任務安排,實現(xiàn)自動撥打號碼;
3、支持本人語音話術錄制,實時訓練全程智能應答,真實真人智能交流,介紹產品等公司相關業(yè)務;
4、語境語意即時算法,準確捕捉客戶意圖,實現(xiàn)自動判斷智能回復;
5、靈活多變電話機器人架構圖的締結方式,自動引導客戶需求;
6、綜合分析通話內容,智能標識用戶需求,自動對接人工坐席,實現(xiàn)自動轉接;
7、根據預設客戶意向標注,自動匹配判斷客戶意向需求;
8、通過過程自動錄音,自動歸類,自動統(tǒng)計時長,自動推送工作報告,實現(xiàn)客戶智能分類管理;
9、自動設定約訪,回訪時間,自動啟動電話回訪或提醒人員根據,實現(xiàn)意向客戶自動跟蹤.
電話機器人是什么?
電話機器人主要就是用來模擬人工通話電話機器人架構圖的一組程序電話機器人架構圖,一般由電話機器人架構圖,CRM系統(tǒng)電話機器人架構圖,語義識別,轉換文字,話術體系,這是軟的部分,再加上底層軟交換和通信模塊一起,合并起來就是一套完整的電話機器人系統(tǒng)。
聊天機器人概述
聊天機器人,是一種通過自然語言模擬人類,進而與人進行對話電話機器人架構圖的程序。
1950年,圖靈(Alan M. Turing)在 Mind 期刊上發(fā)表的文章 Computer Machinery and Intelligence ,這篇文章開篇就提出了“機器能思考嗎?(Can machines think?)”的設問,提出了經典的 圖靈測試(Turing Test) 。通過圖靈測試被認為是人工智能研究的終極目標,圖靈本人也因而被稱為 “人工智能之父” 。
1966年,最早的聊天機器人程序 ELIZA 誕生,由麻省理工(MIT)的約瑟夫·魏澤鮑姆(Joseph Weizenbaum)開發(fā),開發(fā)用于臨床模擬羅杰斯心理治療的 BASIC腳本程序 。實現(xiàn)技術僅為對用戶輸入計算機的話語做關鍵詞匹配,并且回復規(guī)則是由人工編寫的。
1972年,美國精神病學家肯尼思·科爾比(Kenneth Colby)在斯坦福大學(Standford University)使用 LISP 編寫了模擬偏執(zhí)型精神分裂癥表現(xiàn)的計算機程序 PARRY 。
1988年,英國程序員羅洛·卡彭特(Rollo Carpenter)創(chuàng)建了聊天機器人 Jabberwacky ,項目目標是“以有趣、娛樂和幽默的方式模擬自然的人機聊天”,這個項目也是通過與人類互動創(chuàng)造人工智能聊天機器人的早期嘗試,但 Jabberwacky 并未被用于執(zhí)行任何其電話機器人架構圖他功能。技術是使用 上下文模式匹配技術 找到最合適的回復內容。
1988年,加州大學伯克利分校(UC Berkeley)的羅伯特·威林斯基(Robert Wilensky)等人開發(fā)了名為UC(UNIX Consultant)的聊天機器人系統(tǒng)。UC聊天機器人目的是幫助用戶學習UNIX操作系統(tǒng)。
1990年,美國科學家兼慈善家休·勒布納(Hugh G. Loebner)設立了人工智能年度比賽------勒布納獎(Loebner Prize)。勒布納獎旨在借助交談測試機器的思考能力,它被看做對圖靈測試的一種時間,其比賽的獎項分為金、銀、銅三等。目前為止,尚無參賽程序達到金獎或銀獎標準。
在勒布納獎的推動下,聊天機器人迎來了研究的高潮,其中較有代表性的聊天機器人系統(tǒng)是1995年12月23日誕生的 ALICE(Artificial Linguistic Internet Computer Entity) 。隨著 ALICE 一同發(fā)布的 AIML(Artifical Intelligence Markup Language) 目前在移動端虛擬助手的開發(fā)中得到了廣泛的應用。
2001年,SmarterChild在短信和即時通信工具中廣泛流行,使得聊天機器人第一次被應用在了即時通信領域。2006年,IBM開始研發(fā)能夠用自然語言回答問題的最強大腦 Watson ,作為一臺基于IBM“深度問答”技術的超級計算機, Watson 能夠采用上百種算法在3秒內找出特定問題的答案。
2010年,蘋果公司推出了人工智能助手 Siri , Siri 的技術來源于美國國防部高級研究規(guī)劃局公布的CALO計劃:一個簡化軍方繁復事務,且具備學習、組織及認知能力的虛擬助理。CALO計劃衍生出來的民用版軟件就是 Siri虛擬個人助理 。
此后,微軟小冰、微軟Cortana(小娜)、阿里小蜜、京東JIMI、網易七魚等各類聊天機器人層出不窮,并且這些聊天機器人逐漸滲透進人們生活的各個領域。
2016年,全國各大公司開始推出可用于聊天機器人系統(tǒng)搭建的開放平臺或開源架構。
2010年至今,標志性的聊天機器人產品如下圖所示。
總結:隨著人工智能相關技術“東風”漸起,自然語言處理研究碩果頗豐,聊天機器人相關技術迅速發(fā)展。同時,聊天機器人作為一種新穎的人機交互方式,正在成為移動搜索和服務的入口之一,畢竟搜索引擎的最終形態(tài)很可能就是 聊天機器人 。眾多人工智能領域的探索者和開發(fā)者都想緊緊抓住并搶占聊天機器人這一新的交互入口。
下面從幾個維度對齊進行分類介紹。
在線客服聊天機器人系統(tǒng) 的主要功能是自動回復用戶提出的與產品或服務相關的問題,以降低企業(yè)客服運營成本、提升用戶體驗。代表性的商用在線客服聊天機器人系統(tǒng)有小i機器人、京東JIMI客服機器人、阿里小蜜等。以京東JIMI客服機器人為例,用戶可以通過與JIMI聊天了解商品的具體信息、了解平臺的活動信息、反饋購物中存在的問題等。另外,JIMI具有一定的 拒識能力 ,因此可以知道用戶的哪些問題時自己無法回答的,且可以及時將用戶轉向人工客服。阿里巴巴集團在2015年7月24日發(fā)布了一款人工智能購物助理虛擬機器人,取名為“阿里小蜜”,阿里小蜜基于客戶需求所在的垂直領域(服務、導購、助手等),通過“智能+人工”的方式提供良好的客戶體驗。
娛樂場景下聊天機器人系統(tǒng) 的主要功能是同用戶進行不限定主題的對話(閑聊),從而起到陪伴、慰藉等作用。其應用場景集中在社交媒體、兒童陪伴及娛樂、游戲陪練等領域。有代表作的系統(tǒng)如微軟的“小冰”、微信的“小微”、北京龍泉寺的“賢二機器僧”的等。
教育場景下的聊天機器人系統(tǒng) 可以根據教育內容的不同進一步劃分。這類聊天機器人的應用場景為具備人機交互功能的學習、培訓類產品,以及兒童智能玩具等。
個人助理類 應用可以通過語音或文字與用戶進行交互,實現(xiàn)用戶個人事務的查詢及代辦,如天氣查詢、短信手法、定位及路線推薦、鬧鐘及日程提醒、訂餐等,從而讓用戶可以更便捷地處理日常事務。
智能問答類 聊天機器人系統(tǒng)可以回答用戶以自然語言形式提出的事實型問題及其電話機器人架構圖他需要計算和邏輯推理的復雜問題,以滿足用戶的信息需求并起到輔助用戶決策的目的。不僅要考慮如 What、Who、Which、Where、When 等事實型問答,也要考慮如 How、Why 等非事實型問答,因此智能回答的聊天機器人通常作為聊天機器人的一個服務模塊。
從實現(xiàn)的角度來看,聊天機器人可以分為 檢索式 和 生成式 。檢索式聊天機器人的回答是提前定義的,在聊天時機器人使用規(guī)則引擎、模式匹配或者機器學習訓練好的分類器從知識庫中挑選一個最佳的回復展示給用戶。生成式聊天機器人不依賴于提前定義的回答,但是在訓練機器人的過程中,需要大量的語料,語料包含上下文聊天信息和回復。
盡管目前在具體生產環(huán)境中,提供聊天服務的一般都是基于檢索的聊天機器人系統(tǒng),但是基于深度學習Seq2Seq模型的出現(xiàn)可能使基于生成的聊天機器人系統(tǒng)成為主流。
基于功能的聊天機器人可以分為問答系統(tǒng)、面向任務的對話系統(tǒng)、閑聊系統(tǒng)和主動推薦系統(tǒng)4種。
目前,對問答系統(tǒng)和主動推薦系統(tǒng)的評價指標較為客觀,評價方式也相對成熟。而面向任務的對話系統(tǒng)和餡料系統(tǒng),在給定相同輸入的情況下,系統(tǒng)回復形式可以多種多樣,對于用戶的同一輸入,通常有多種合理且數(shù)目不固定的回復,這使得很難通過一種客觀的機制對其進行評價,所以在評價時需要加入人的主觀判斷作為評價的依據之一。
通常,一個完整的聊天機器人系統(tǒng)框架如圖,其主要包含自動語音識別、自然語言理解、對話管理、自然語言生成、語音合成5個主要的功能模塊。需要指出的是,并不是所有的聊天機器人系統(tǒng)都需要語音技術。
例如,以文字方式實現(xiàn)人機交互的聊天機器人系統(tǒng),就不需要自動語音識別模塊和語音合成模塊。
Amazon Lex是一種可以在任何程序中使用語音和文本構建對話界面的服務。Amazon Lex提供可擴展、安全且易于使用的端到端(end2end)解決方案,以構建、發(fā)布和監(jiān)控開發(fā)人員發(fā)布的機器人。下圖展示了聊天機器人如何通過對話的方式協(xié)助用戶完成訂花的需求。
另一個典型的聊天機器人框架是Facebook的Wit.ai。Wit.ai積累了大量高質量的對話數(shù)據,有效促進了聊天機器人系統(tǒng)的發(fā)展,并通過將人工智能和人類智能結合,進一步提升了聊天機器人的智能水平。
聊天機器人的4種分類,包括 問答系統(tǒng)、面向任務的對話系統(tǒng)、閑聊系統(tǒng)和主動推薦系統(tǒng)。
Siri被定位為面向任務的對話系統(tǒng),為用戶提供打電話、訂餐、訂票、放音樂等服務。Siri對接了很多服務,且設置了 “兜底” 操作,當Siri無法理解用戶的輸入時就命令搜索引擎返回相關的服務。Siri的出現(xiàn)引領了移動終端個人事務助理的商業(yè)化發(fā)展潮流。
下圖是Siri的技術框架:
2011年2月,IBM耗資3000萬美元研發(fā)的IBM Watson登上了美國著名智力問答競賽節(jié)目《危險邊緣》(Jeopardy),面對節(jié)目中充滿雙管意思的英文問題,IBM Watson能做出分析并在龐大的自然語言知識庫中尋找線索,將這些線索組合成答案。最終,IBM Watson壓倒性地優(yōu)勢擊敗了節(jié)目中最聰明的人腦,同時創(chuàng)下了這個知識競賽系列節(jié)目27年歷史上的最高分。IBM Watson作為IBM公司研發(fā)的問答系統(tǒng),集成了自然語言處理、信息檢索、知識表示、自動推理、機器學習等多項技術的應用,形成了假設認知和大規(guī)模的證據搜集、分析、評價的深度問答技術。IBM Watson可以分析自然語言形式的數(shù)據,通過大規(guī)模學習和推理,為用戶提供個性化服務。
2012年7月9日,谷歌發(fā)布了智能個人助理Google Now。Google Now通過自然語言交互方式為用戶提供頁面搜索、自動指令等功能。Allo是谷歌在前述工作的基礎上發(fā)布的語音助手。Allo具備隨時間推移學習用戶行為的能力。
2014年4月2號
主動推薦系統(tǒng)采用的是一種實現(xiàn)個性化信息推送的技術方式。主動推薦系統(tǒng)并不需要用戶提供明確的需求,而是通過分析用戶的歷史行為數(shù)據建立用戶畫像,從而基于用戶畫像主動向用戶推薦系統(tǒng)認為能夠滿足用戶興趣和需求的信息。在電商購物(如阿里巴巴、亞馬遜)、社交網絡(如Facebook、微博)、新聞資訊(如今日頭條)、音樂電影(如網易云音樂、豆瓣)等領域均有廣泛而成功的應用。主動推薦系統(tǒng)本質上是一項幫助人們解決信息過載(information overload)問題的工具。所謂信息過載,是指用戶真正需求、真正感興趣的東西被淹沒在其同類物品的海洋里。 主動的交互方式能夠顯著提升用戶體驗,且機器人主動交互的方式更接近真實的人與人之間的對話方式,使得對話更自然。
一種主動推薦的方式,是基于 知識圖譜(Knowledge Graph) 的主動推薦系統(tǒng)。例如,在建立音樂領域的主動推薦系統(tǒng)時,可以先建立音樂領域知識圖譜和用戶知識圖譜,然后在進行用戶信息搜索的過程中建立起用戶的音樂喜好畫像,從而更精準地對用戶進行音樂推送。
從圖中可看出,在用戶點播歌曲的過程中,主動推薦系統(tǒng)可以結合音樂知識圖譜、用戶個人知識圖譜,以及用戶的歷史對話數(shù)據,綜合給出最優(yōu)的音樂推薦。
主動推薦系統(tǒng)與問答系統(tǒng)、面向任務的對話系統(tǒng)和閑聊系統(tǒng)被認為是聊天機器人產品的4種主要分類。
打電話的機器人?
打電話的機器人俗稱“電話機器人”,是一款通過精準語言平臺,群呼潛在客戶群體,并模擬銷售專員溝通進行信息篩選的人工智能語音機器人。
電話機器人在普通呼叫系統(tǒng)基礎上加入了自然語言處理、語音識別、詞義理解等多項人工智能技術,通過智能外呼,自動應答來代替人工接打電話,達到篩選意向客戶、鎖定目標客戶、精準客戶分類等等營銷服務目的,提升客戶體驗、提高營銷效率、優(yōu)化運營成本、助力企業(yè)降本增效。
騰訊算法高級研究員陳松堅:智能問答技術及其應用
隨著人工智能電話機器人架構圖的飛速發(fā)展以及廣泛落地應用電話機器人架構圖,越來越多電話機器人架構圖的設備將會被植入智能問答技術電話機器人架構圖,人機交互場景隨處可見,智能問答在未來將會成為一個非常重要的入口。
騰訊小知憑借著業(yè)界領先的智能AI引擎算法和海量大數(shù)據倉庫,已將智能問答技術落地實施,并且經過大量的業(yè)務考驗和優(yōu)化,知識點匹配度和準確率都已達到90%以上,在2018 年 GITC 全球互聯(lián)網技術大會上,騰訊小知榮獲年度互聯(lián)網最具價值產品獎。
騰訊小知算法負責人陳松堅也在會場發(fā)表了關于智能問答技術原理及其在To B場景下的應用的專題演講,從自己的角度為電話機器人架構圖我們展現(xiàn)智能問答技術的最新成果。
他首先從智能問答是什么,為什么和怎么做的三個問題出發(fā),闡明了他對當前智能問答技術的定位和價值,首先,現(xiàn)階段的智能問答是信息檢索技術的升級,是量變而未達到質變。但是無論在To B還是To C的場景下,當前的技術都能夠切實解決一些用戶的痛點,提升用戶體驗,是亟待推進和充滿想象的方向。
在回答怎么做這個問題時,他詳細介紹了幾種不同的問答機器人的實現(xiàn)路徑,包括單輪問答機器人,多輪問答機器人及閱讀理解機器人。其中重點闡述了單輪問答機器人的實現(xiàn)原理,包括字面匹配,詞向量匹配,深度語義匹配,遷移學習等技術。
此后他還分享了小知團隊將上述技術產品化的經驗,包括智能客服機器人和電話機器人兩大塊,主要分享了當前產品的形態(tài),亮點和實際項目中取得的一些成果。
最后,他簡單總結了小知目前完成的工作以及就智能問答的發(fā)展提出了自己的幾點看法。
--------------------------------------------------------------
以下是演講稿全文:
各位下午好,很高興今天能在這里給大家做分享報告。先介紹一下,我們騰訊小知是致力于為政府和各行業(yè)提供一攬子智能問答解決方案的團隊,目前已經落地的包括基于文本的智能客服機器人和基于語音的電話機器人等。
在大多數(shù)人的認知里,智能問答很可能是以上的3個印象,2011年打敗了人類取得問答競賽冠軍的waston;2017年被沙特授予公民身份的機器人sofia;更為大家熟知的鋼鐵俠中的機器人管家jarvis。在大家心目中,智能就意味著能夠像真人一樣交流。然而作為從業(yè)者,很遺憾地告訴大家,目前的技術還遠沒有達到這個目標,我認為本質上目前的智能問答技術是對信息檢索技術的一次升級,是量變而未到質變。這個皇冠上的明珠還等待我們去摘取。
既然問答技術還不成熟,那為什么還要投身到這個領域呢。我想從To B和To C兩個角度去回答。對企業(yè)來講,當前的問答技術雖然無法解答復雜的咨詢,但是大部分的簡單的頭部問題是可以比較好的解答的。從本輪AI大潮NLP賽道的幾名種子選手都從智能客服這個方向切入就可以看出企業(yè)是確實存在對智能問答的剛性需求。而對普通用戶來講,一方面siri等語音助手每天都在為用戶提供便捷的交互界面,另一方面像amazon echo這一類的智能家居產品也逐步進入千家萬戶,成為物聯(lián)網生態(tài)的中心入口之一,這便是智能問答的價值所在。
那如何實現(xiàn)智能問答機器人呢?我們先來看最基本的單輪問答機器人的實現(xiàn)原理。
熟悉搜索引擎的朋友會發(fā)現(xiàn)這個架構跟搜索引擎的很類似。單輪問答一般來說就是FAQ問答,是基于業(yè)務問答對組成的問答庫進行檢索匹配。其中FAQ問題集包含多個相似問法供用戶問題去匹配。預處理階段一般會進行文本糾錯,標準化和底層NLP特征提取;召回階段會在倒排索引中召回若干個候選問題(粗排),而最后的匹配階段會基于各種模型進行匹配打分并返回得分最高的結果(精排)。匹配階段還會引入其他模塊,如知識圖譜和拒識模型,目的是輔助提升匹配的最終準確率。
retrieval中的匹配可以看做是naive solution,詞袋+VSM, 篩選候選夠用了,但是精排需要更精致的策略,第一,要利用監(jiān)督信息做擬合,我們構建基于問題對的訓練語料,擬合是否匹配這個二分類目標。第二,特征上拋棄稀疏的詞袋模型,而是構造各種相似度來做base scorer,然后利用非線性的抗噪能力強的xgboost來做融合,比如我們用到詞bigram, 字bigram, 核心詞,名詞等特征集合的相似度。這種方法的優(yōu)缺點是一體的,由于模型只學習字面相似的特征,因此不受領域影響,通用性強,適合用在冷啟動階段;但也因為只考慮字面相似,無法處理更深層的語義匹配。
那如何度量語義的相似呢。詞向量技術的興起是語義匹配的前提,所謂詞向量,是將孤立的傳統(tǒng)的token表示映射到相互關聯(lián)的向量空間中,這種關聯(lián)性,或者說是相似性,是通過詞語的上下文的來描述的。也就是說,上下文越相似的詞語,他們的語義就越相似,詞向量的歐式距離就越近。這是很容易理解的,更妙的是,通過對向量進行簡單加減運算,能夠呈現(xiàn)出概念的關系,比如king-man+woman的結果非常接近于queen, 因此說明詞向量能夠一定程度刻畫語義。那對句子如何做向量表示呢?一個簡單的想法是直接求和平均,WMD是另一個比較有意思且有效的做法,他將計算句子到句子的相似度建模成一個運輸?shù)膯栴},把句子p的各個詞,運輸?shù)絨的各個詞上,也可以說是變換;運輸成本是詞向量的cosine相似度,而要運輸?shù)氖歉鱾€詞在句子中的權重,用線性規(guī)劃求解一個最優(yōu)解,即為p到q的距離。另外還有個有效的方法是SIF,思路是做詞向量加權求和,但是突顯出句子中非通用的部分,即權重用詞頻倒數(shù)來計算權重,實驗效果也很不錯。
上面的方法有一個問題就是沒有利用有監(jiān)督信息,所以效果有明顯的天花板。下面介紹這個工作是基于深層網絡做有監(jiān)督學習的匹配的,做法也比較簡單,首先把句子文本用one-hot編碼,假如詞典大小是500K,那編碼完長度就是500K維,其實等于是詞袋模型,然后輸入到一個多層的神經網絡去學習,最終得到一個128維的向量作為句子的語義表示,然后用cosine計算兩個句子與文檔的相似度作為模型輸出。這個方法其實是將高維稀疏的token特征映射到低維語義空間,跟詞向量的思路很類似,只不過訓練目標不同,并且這里使用了深層網絡結構。
但是CNN對上下文的處理能力依賴于窗口大小,遠距離就沒辦法處理了,因此要考慮另一種網絡單元RNN,這種單元是專門為時序模型量身打造的,簡單來說,每一時刻t上的隱藏狀態(tài),或者說第t個詞上的語義編碼,都由兩個輸入共同決定,即上一時刻的隱藏狀態(tài)和當前時刻的原始輸入,而為了解決遠距離傳遞導致的梯度消失和梯度爆炸等問題,RNN有一些變種結構來應對,比如 LSTM和GRU等。
CNN和RNN都是對原始輸入進行語義編碼的基本單元,編碼后的向量就可以接入多層感知機進行相似度計算,如果是直接計算cosine相似度,那就是dssm的升級版,而更常見的做法是把兩個句子的編碼向量拼接在一起,再經過一個多層感知機計算相似度,而這種方法統(tǒng)稱為表達式建模;
另一種方案考慮到兩個句子之間的交互信息對學習他們是否匹配顯然更為重要,這一類方案被稱為交互式建模,右邊是一個典型的例子,他最大的不同是首先對兩個句子的所有窗口組合進行拼接和卷積,得到交互信息。然后再進行多次卷積和池化得到表示。其他的交互方式還包括編碼之后,進行交互操作,如作差,點乘等,還有計算attention表示,也是常見的交互方式。
下面介紹我們的方案,跟上面介紹的模型相比,我們的方案主要做了兩處改動,一個是使用了稠密連接的網絡結構,讓rnn層的輸入和輸出拼接在一起做為下一層的輸入,第二個是混合注意力機制,即在計算attention向量進行交互式建模的基礎上,增加self-attention向量計算,然后把兩個attention向量經過門機制進行融合,這樣做一方面引入了問句間的交互信息,同時又增強了對自身的表達建模。
上面的模型是比較復雜的模型,參數(shù)量有5.8M。在實際中應用中訓練語料會嚴重不足,為了解決這個問題,我們引入了遷移學習的策略。首先第一種是多任務聯(lián)合學習,比如在擬合兩個問句是否匹配的同時,也對問句進行分類預測;另外還可以同時對匹配的問題對做seq2seq的翻譯模型訓練。這兩個策略都證明能有效提升準確率。
而另一個思路更加直觀,即引入其他領域的語料,所謂多語料遷移。Fine-tune即參數(shù)微調是其中一種做法,即先用通用語料訓練網絡,固定底層表達層的參數(shù),然后再使用領域語料調整上層參數(shù);另一種思路參考了對抗學習的思想,即引入一個新的任務“混淆分類器”去判別當前樣本是來自源語料還是目標語料,通過在損失函數(shù)中增加反向的混淆分類損失項,讓混淆分類器盡可能地無法區(qū)分樣本的來源,從而保證共享了參數(shù)的表達網絡能夠學習到兩部分語料中共性的部分。
以上的介紹都是為了完成一個基本的單輪對話機器人,而實際應用中,往往存在需要需要交互的場景,比如查詢社保余額,就需要用戶提供指定信息,如姓名,身份證號,手機號等。這種是所謂任務導向型機器人,而另一種,基于知識圖譜的機器人也往往會涉及到多輪交互。這里簡單介紹一下多輪對話機器人的架構,整體上是一個對話管理系統(tǒng),總的來說是管理會話狀態(tài),包含4個模塊,分別是輸入部分:自然語言理解模塊NLU,負責意圖識別和抽取槽位實體,比如這里匹配到了意圖是查詢社保余額,抽取到了社保號1234。得到的意圖和槽位值會送入到對話狀態(tài)追蹤模塊,DST,他負責會話狀態(tài)的更新,形式化來說是一個函數(shù),輸入是當前狀態(tài)s和當前的query經過NLU處理過得到的意圖和槽位值q, 輸出新的狀態(tài)s‘,下一步是把s’送入DPL,對話策略模塊,這個模塊是根據新的狀態(tài)s‘輸出行動a,通常這個決策選擇會依賴于一個外部數(shù)據庫或知識圖譜,最后,由輸出部分,自然語言生成模塊NLG負責將行動轉換為自然語言文本,返回給用戶。
前面提到的單輪FAQ機器人,有一個問題是問答準確率依賴于問答庫的質量,而問答庫的構建耗時費力,所以針對數(shù)據較大的非結構化文檔,如果可以直接從中抽取答案,是非常理想的做法。比如斯坦佛大學開源的drQA,就是基于wikipedia的語料做的一個開放域上的問答機器人,我們來看看這種閱讀理解機器人的架構示意,他也是基于檢索重排的思路,首先把可能的文段從語料庫中摘取出來,然后送入閱讀理解模型進行答案定位,打分,排序和選擇得分最高的答案。閱讀理解模型與匹配模型是類似的,需要先對問題和候選文段進行編碼表示,不同之處在于最終預測的目標是答案的起始和結束位置。我所在的團隊在去年,在閱讀理解的權威公開測評Squad v1中取得過第一的成績,同時參加這個測評的包括了google, facebook, 微軟,阿里idst, 科大訊飛等國內外同行。說明業(yè)界對這種技術還是非??粗氐摹?/p>
下面分享小知在把以上技術落地產品化的經驗。首先我們來看看小知的整體架構圖,核心引擎有兩部分,一塊是上面重點闡述的深度語義匹配模型,另一塊是本次分享沒有展開的知識圖譜引擎,在此之上,我們構建了FAQ機器人,多輪會話機器人(任務機器人),閑聊機器人等。以下是我們單輪和多輪機器人的示例。
在我們實際的落地項目中,得益于深度遷移模型的語義匹配能力和行業(yè)知識圖譜的的精準匹配和輔助追問,小知機器人能夠做到95%左右的問答準確率,并且節(jié)省了50%以上的服務人力,切實為政府和企業(yè)提升效率和降低成本。
在智能客服的基礎上,我們又打造了基于語音的電話機器人,力主融合智能客服,人工在線客服,工單系統(tǒng)和電話機器人,為客戶打造從售前售中售后的整體解決方案。
以下是電話機器人的整體架構圖,核心是自然語言理解NLU模塊,負責識別用戶提問意圖
提取相關實體。根據NLU輸出的結果,內置的對話管理引擎會進行流程狀態(tài)流轉和跟蹤。
另外,ASR語音識別和TTS語音合成是不可或缺的重要服務,這三個模塊相互協(xié)作,共同完成與用戶的交互。
最后對智能問答的未來發(fā)展提幾點我的看法。目前學術界比較公認的一個方向是,需要更有機地結合模型和規(guī)則,而在問答領域,規(guī)則的一大組成部分就是知識圖譜,包括開放領域的知識圖譜和專業(yè)領域知識圖譜。而更進一步地,我們需要研究帶有推理性質的事理型知識圖譜去描述領域內的規(guī)則和知識,讓機器人能夠處理帶有復雜條件的問題,提供更智能的回復。在我看來,智能問答的一個突破口就在于解決以上三個問題。以上就是今天分享的內容,謝謝大家。
主講人介紹:
陳松堅,騰訊數(shù)據平臺部算法高級研究員,有著8 年的 NLP 研發(fā)經驗,2017 年加入騰訊 TEG 數(shù)據平臺部,負責智能客服產品騰訊小知的算法規(guī)劃和落地。負責過多個智能客服項目,對封閉領域的智能問答有豐富的實戰(zhàn)經驗。
如需要了解產品詳情,可電話咨詢專業(yè)客服人員:15358521011(微信同號)