■作為顧客意見(jiàn)分析方法的一種,關(guān)注度上升
文本挖掘是分析像文章這樣的定性數(shù)據(jù)的技術(shù)。因?yàn)槟軐?duì)定量數(shù)據(jù)分析無(wú)法徹底把握的顧客意見(jiàn)進(jìn)行有效梳理而受到關(guān)注,如第六章中所介紹的對(duì)話分析和錄音分析在
呼叫中心已開(kāi)始得到活用。在實(shí)際分析中,首先要制作性別、年齡、地域等屬性和數(shù)值的數(shù)據(jù),然后再結(jié)合進(jìn)行定性數(shù)據(jù)的文本挖掘,從而得到高利用價(jià)值的知識(shí)。
■支持文本挖掘基礎(chǔ)的技術(shù):形態(tài)要素解析
形態(tài)要素解析是將文章分解的技術(shù)。將文中出現(xiàn)的有意義的最小單位稱作形態(tài)要素,以此解析句子,標(biāo)注詞性,進(jìn)行處理。例如今天天氣好這句句子,就可以分解為今天/天氣/好。具體來(lái)說(shuō),需要進(jìn)行以下三個(gè)方面的處理:
①語(yǔ)匯單元化(tokenization)
將句子進(jìn)行以單詞為單位的劃分。
②還原活用語(yǔ)(Stemming,Lemmatization)
對(duì)英語(yǔ)的動(dòng)詞和名詞的詞尾,日語(yǔ)的活用語(yǔ)詞尾等進(jìn)行還原性處理。
③標(biāo)注詞性(Pait-of-?speechtagging)
對(duì)每個(gè)單詞進(jìn)行詞性標(biāo)注的處理形態(tài)要素解析工具中,奈良尖端科學(xué)技術(shù)研究院大學(xué)的圓筒竹刷非常著名。
■文本挖掘工具
使用市場(chǎng)上銷售的文本挖掘工具可以迅速分析出大量數(shù)據(jù)。在transcosmos,使用的是野村綜合研究所的文本挖掘工具TRUETELLER"。"TRUETELLER被評(píng)價(jià)為具有多種機(jī)能,且用戶操作起來(lái)很方便。具體分析功能請(qǐng)參考下表。
![](/d/20211020/25a561115514f3f6b87a290fd2bfe414.gif)