中,傳統(tǒng)式電話營銷占企業(yè)總營業(yè)額的一大半一部分,電話營銷客戶服務(wù)中心每日呼出幾萬元打電話,銷售話術(shù)全是如影隨行。但傳統(tǒng)式的電銷在線客服存有流通性大,塑造時(shí)間長,人工成本高的缺陷,怎樣降低企業(yè)的成本費(fèi)又不降低電話營銷的市場份額,是每所遭遇的難點(diǎn)。智能化電銷機(jī)器人的發(fā)生,讓以上傳統(tǒng)式市場銷售難點(diǎn)引刃而解。但是,因?yàn)橹悄芑婁N機(jī)器人未對(duì)于金融業(yè)情景開展改進(jìn)和難以解決的語義識(shí)別等緣故,還未能運(yùn)用于金融行業(yè)。
文中指出了一種組成應(yīng)用文本相似度測算與特征詞標(biāo)準(zhǔn)配對(duì)的方式,可以提升語義識(shí)別準(zhǔn)確度,完成更加友善的人機(jī)對(duì)戰(zhàn)對(duì)話。
傳統(tǒng)式的語義識(shí)別要靠軟件開發(fā)工作人員寫一些標(biāo)準(zhǔn)來處理語義識(shí)別問題??墒?,要窮舉并制訂這種標(biāo)準(zhǔn)針對(duì)開發(fā)者而言勞動(dòng)量無法想象。由于在自然語言處理行業(yè)中始終有寫不完的標(biāo)準(zhǔn),這時(shí)就必須智能機(jī)器人應(yīng)用你的自學(xué)能力開展邏輯推理。TF-IDF詞袋模型能依據(jù)詞的關(guān)鍵水平加上相匹配權(quán)重值,更合乎對(duì)話詞義邏輯性,但會(huì)使原文件格式轉(zhuǎn)換為高維的稀少空間向量,為向量儲(chǔ)存和相似之處測算產(chǎn)生了非常大的艱難。其關(guān)鍵技術(shù)性包括如下所示:
1、對(duì)電銷對(duì)話語料數(shù)據(jù)信息開展清理,刪掉對(duì)話邏輯性不科學(xué)的數(shù)據(jù)信息,刪掉語音轉(zhuǎn)文本全過程中鑒別偏差過大的數(shù)據(jù)信息,保存一部分語音轉(zhuǎn)文本全過程中的錯(cuò)別字,進(jìn)而提升實(shí)體模型的抗干擾性。
2、應(yīng)用python分詞工具jieba包對(duì)清理后的語料開展中文分詞,與此同時(shí)刪掉停用詞和低頻詞。
3、創(chuàng)建詞袋模型,根據(jù)TF-IDF優(yōu)化算法測算各詞的關(guān)鍵水平并做權(quán)重計(jì)算解決。
4、應(yīng)用LSI對(duì)TF-IDF詞袋模型開展特征提取,去除小的奇異值,將文本文檔特點(diǎn)室內(nèi)空間變成文本文檔定義室內(nèi)空間。
5、整理電銷整體步驟,獲取電銷步驟中的每個(gè)情景,對(duì)于不一樣情景設(shè)定多種多樣意圖紙句。
6、將顧客的即時(shí)對(duì)話數(shù)據(jù)信息與各種各樣句核對(duì)(定義空間向量之問應(yīng)用內(nèi)積的交角余弦相似度測算比原先根據(jù)全文本空間向量的相似之處測算更靠譜),超過設(shè)定的相似之處閥值即鑒別為該情景下的相匹配用意。
7、開展電銷的相匹配銷售話術(shù),進(jìn)行一輪人機(jī)對(duì)戰(zhàn)對(duì)話。
對(duì)語音轉(zhuǎn)文本數(shù)據(jù)處理方法步驟如下所示:
比如,客戶說:“我還在駕車,到時(shí)候說?!睒?biāo)準(zhǔn)配對(duì)字典中僅有“繁忙”“有急事”等,無 ** 確判斷顧客是“忙”的情景。將顧客的對(duì)話與意圖紙句開展同源性核對(duì),若超過預(yù)置閥值則可判斷為“忙”的情況。
文本相似度測算應(yīng)用無輔導(dǎo)優(yōu)化算法,不用很多人力資源標(biāo)明,與此同時(shí)加上新語料時(shí),可自動(dòng)更新特點(diǎn)引流矩陣,無需再次練習(xí),合適商品快速迭代發(fā)布;組成應(yīng)用文本相似度計(jì)算方式與特征詞標(biāo)準(zhǔn)配對(duì)方式,在智能化電銷對(duì)話全過程里能更確切的掌握顧客意圖識(shí)別,并高效增強(qiáng)了語義識(shí)別準(zhǔn)確度。