濮阳杆衣贸易有限公司

主頁 > 知識(shí)庫 > 數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用

數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用

熱門標(biāo)簽:河北三河400電話的申請(qǐng) 福建辦理400電話的公司 宿遷自建外呼系統(tǒng) 鎮(zhèn)江地圖標(biāo)注app 山西云電銷機(jī)器人公司 給商家地圖標(biāo)注定位 百度地圖標(biāo)注位置多久顯示出來 天水電銷 小語語音電話機(jī)器人哪家好
  隨著互聯(lián)網(wǎng)的出現(xiàn),信息過量幾乎成為人人需要面對(duì)的問題。如何才能不被信息的汪洋大海所淹沒,從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息利用率牽數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,越來越顯示出其強(qiáng)大的生命力。金融事務(wù)需要搜集和處理大量的數(shù)據(jù),由于銀行在金融領(lǐng)域的地位、工作性質(zhì)、業(yè)務(wù)特點(diǎn)以及激烈的市場(chǎng)競(jìng)爭(zhēng)決定了它對(duì)信息化、電子化比其它領(lǐng)域有更迫切的要求。利用數(shù)據(jù)挖掘技術(shù)可以幫助銀行產(chǎn)品開發(fā)部門描述客戶以往的需求趨勢(shì),并預(yù)測(cè)未來。美國商業(yè)銀行是發(fā)達(dá)國家商業(yè)銀行的典范,許多地方值得我國學(xué)習(xí)和借鑒。

  一、數(shù)據(jù)挖掘的基本原理

  1.?dāng)?shù)據(jù)挖掘概述

  數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘是一種從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱藏的預(yù)測(cè)性信息的新技術(shù)。它能開采出潛在的模式,找出最有價(jià)值的信息,指導(dǎo)商業(yè)行為或輔助科學(xué)研究。還有很多和數(shù)據(jù)挖掘這一術(shù)語相近的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)、數(shù)據(jù)分析、數(shù)據(jù)融合等。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。已有的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員。

  2.?dāng)?shù)據(jù)挖掘的流程

 ?。?)數(shù)據(jù)取樣。當(dāng)進(jìn)行數(shù)據(jù)挖掘時(shí),首先要從企業(yè)大量數(shù)據(jù)中取出一個(gè)與要搜索的問題相關(guān)的樣板數(shù)據(jù)子集,而不是動(dòng)用全部企業(yè)數(shù)據(jù)。通過對(duì)數(shù)據(jù)樣本的精選,不僅能減少數(shù)據(jù)處理量,節(jié)省系統(tǒng)資源,而且能通過對(duì)數(shù)據(jù)的篩選,使數(shù)據(jù)更加具有規(guī)律性。

 ?。?)數(shù)據(jù)探索。數(shù)據(jù)探索就是通常所進(jìn)行的對(duì)數(shù)據(jù)深入調(diào)查的過程,從樣本數(shù)據(jù)集中找出規(guī)律和趨勢(shì),用聚類分析區(qū)分類別,最終要達(dá)到的目的就是搞清楚多因素相互影響的、十分復(fù)雜的關(guān)系,發(fā)現(xiàn)因素之間的相關(guān)性。

 ?。?)數(shù)據(jù)調(diào)整。通過上述兩個(gè)步驟的操作,對(duì)數(shù)據(jù)的狀態(tài)和趨勢(shì)有了進(jìn)一步的了解,這時(shí)要盡可能對(duì)問題解決的要求能進(jìn)一步明確化、進(jìn)一步量化。針對(duì)問題的需求要對(duì)數(shù)據(jù)進(jìn)行增刪,按照對(duì)整個(gè)數(shù)據(jù)挖掘過程的新認(rèn)識(shí)組合或生成一個(gè)新的變量,以體現(xiàn)對(duì)狀態(tài)的有效描述。

 ?。?)模型化。在問題進(jìn)一步明確,數(shù)據(jù)結(jié)構(gòu)和內(nèi)容進(jìn)一步調(diào)整的基礎(chǔ)上,就可以建立模型。這一步是數(shù)據(jù)挖掘的核心環(huán)節(jié),運(yùn)用神經(jīng)網(wǎng)絡(luò)、決策樹、數(shù)理統(tǒng)計(jì)、時(shí)間序列分析等方法來建立模型。
 ?。?)評(píng)價(jià)。從上述過程中將會(huì)得出一系列的分析結(jié)果、模式和模型,多數(shù)情況會(huì)得出對(duì)目標(biāo)問題多側(cè)面的描述,這時(shí)就要綜合它們的規(guī)律性,提供合理的決策支持信息。評(píng)價(jià)的一種辦法是直接使用原先建立模型樣本和樣本數(shù)據(jù)來進(jìn)行檢驗(yàn)牷另一種辦法是另找一批數(shù)據(jù)并對(duì)其進(jìn)行檢驗(yàn),已知這些數(shù)據(jù)能反映客觀實(shí)踐的規(guī)律性牷再一種辦法是在實(shí)際運(yùn)行的環(huán)境中取出新鮮數(shù)據(jù)進(jìn)行檢驗(yàn)。

  以上敘述的是數(shù)據(jù)挖掘的基本流程如下圖所示。這一過程要反復(fù)進(jìn)行牞在反復(fù)過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問題的解決方案。數(shù)據(jù)重組和細(xì)分添加和拆分記錄選取數(shù)據(jù)樣本可視化數(shù)據(jù)探索聚類分析神經(jīng)網(wǎng)絡(luò)、決策樹數(shù)理統(tǒng)計(jì)、時(shí)間序列結(jié)論綜合解釋評(píng)價(jià)數(shù)據(jù)知識(shí)數(shù)據(jù)取樣數(shù)據(jù)探索數(shù)據(jù)調(diào)整模型化評(píng)價(jià)。

  3.?dāng)?shù)據(jù)挖掘的功能

  數(shù)據(jù)挖掘通過預(yù)測(cè)未來趨勢(shì)及行為,做出前攝的、基于知識(shí)的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識(shí),主要有以下五類功能。

 ?。?)自動(dòng)預(yù)測(cè)趨勢(shì)和行為。數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫中尋找預(yù)測(cè)性信息,以往需要進(jìn)行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個(gè)典型的例子是市場(chǎng)預(yù)測(cè)問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報(bào)最大的用戶,其它可預(yù)測(cè)的問題包括預(yù)報(bào)破產(chǎn)以及認(rèn)定對(duì)指定事件最可能作出反應(yīng)的群體。

 ?。?)關(guān)聯(lián)分析。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。

 ?。?)聚類。數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點(diǎn)是,在劃分對(duì)象時(shí)不僅考慮對(duì)象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。

 ?。?)概念描述。概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征,后者描述不同類對(duì)象之間的區(qū)別。生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。

 ?。?)偏差檢測(cè)。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測(cè)這些偏差很有意義。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等。偏差檢測(cè)的基本方法是,尋找觀測(cè)結(jié)果與參照值之間有意義的差別。

  二、數(shù)據(jù)挖掘工具

  1.基于神經(jīng)網(wǎng)絡(luò)的工具

  由于對(duì)非線性數(shù)據(jù)的快速建模能力,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘工具現(xiàn)在越來越流行。其開采過程基本上是將數(shù)據(jù)聚類,然后分類計(jì)算權(quán)值。神經(jīng)網(wǎng)絡(luò)很適合非線性數(shù)據(jù)和含噪聲數(shù)據(jù),所以在市場(chǎng)數(shù)據(jù)庫的分析和建模方面應(yīng)用廣泛。

  2.基于規(guī)則和決策樹的工具

  大部分?jǐn)?shù)據(jù)挖掘工具采用規(guī)則發(fā)現(xiàn)或決策樹分類技術(shù)來發(fā)現(xiàn)數(shù)據(jù)模式和規(guī)則,其核心是某種歸納算法。這類工具通常是對(duì)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行開采,生產(chǎn)規(guī)則和決策樹,然后對(duì)新數(shù)據(jù)進(jìn)行分析和預(yù)測(cè)。這類工具的主要優(yōu)點(diǎn)是,規(guī)則和決策樹都是可讀的。

  3.基于模糊邏輯的工具

  其發(fā)現(xiàn)方法是應(yīng)用模糊邏輯進(jìn)行數(shù)據(jù)查詢、排序等。該工具使用模糊概念和“最近”搜索技術(shù)的數(shù)據(jù)查詢工具,它可以讓用戶指定目標(biāo),然后對(duì)數(shù)據(jù)庫進(jìn)行搜索,找出接近目標(biāo)的所有記錄,并對(duì)結(jié)果進(jìn)行評(píng)估。

  4.綜合多方法工具

  不少數(shù)據(jù)挖掘工具采用了多種開采方法,這類工具一般規(guī)模較大,適于大型數(shù)據(jù)庫牗包括并行數(shù)據(jù)庫牘。這類工具開采能力很強(qiáng),但價(jià)格昂貴,并要花很長(zhǎng)時(shí)間進(jìn)行學(xué)習(xí)。

  三、數(shù)據(jù)挖掘技術(shù)在商業(yè)銀行中的應(yīng)用

  數(shù)據(jù)挖掘技術(shù)在美國銀行金融領(lǐng)域應(yīng)用廣泛。金融事務(wù)需要搜集和處理大量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場(chǎng)的變化趨勢(shì)。商業(yè)銀行業(yè)務(wù)的利潤(rùn)和風(fēng)險(xiǎn)是共存的。為了保證最大的利潤(rùn)和最小的風(fēng)險(xiǎn),必須對(duì)帳戶進(jìn)行科學(xué)的分析和歸類,并進(jìn)行信用評(píng)估。Mellon銀行使用IntelligentAgent數(shù)據(jù)挖掘軟件提高銷售和定價(jià)金融產(chǎn)品的精確度,如家庭普通貸款。零售信貸客戶主要有兩類,一類很少使用信貸限額(低循環(huán)者),另一類能夠保持較高的未清余額(高循環(huán)者)。每一類都代表著銷售的挑戰(zhàn)。低循環(huán)者代表缺省和支出注銷費(fèi)用的危險(xiǎn)性較低,但會(huì)帶來極少的凈收入或負(fù)收入,因?yàn)樗麄兊姆?wù)費(fèi)用幾乎與高循環(huán)者的相同。銀行常常為他們提供項(xiàng)目,鼓勵(lì)他們更多地使用信貸限額或找到交叉銷售高利潤(rùn)產(chǎn)品的機(jī)會(huì)。高循環(huán)者由高和中等危險(xiǎn)元件構(gòu)成。高危險(xiǎn)分段具有支付缺省和注銷費(fèi)用的潛力。對(duì)于中等危險(xiǎn)分段,銷售項(xiàng)目的重點(diǎn)是留住可獲利的客戶并爭(zhēng)取能帶來相同利潤(rùn)的新客戶。但根據(jù)新觀點(diǎn),用戶的行為會(huì)隨時(shí)間而變化。分析客戶整個(gè)生命周期的費(fèi)用和收入就可以看出誰是最具創(chuàng)利潛能的。Mellon銀行認(rèn)為“根據(jù)市場(chǎng)的某一部分進(jìn)行定制”能夠發(fā)現(xiàn)最終用戶并將市場(chǎng)定位于這些用戶。但是,要這么做就必須了解關(guān)于最終用戶特點(diǎn)的信息。數(shù)據(jù)挖掘工具為Mellon銀行提供了獲取此類信息的途徑。Mellon銀行銷售部在先期數(shù)據(jù)挖掘項(xiàng)目上使用IntelligenceAgent尋找信息,主要目的是確定現(xiàn)有Mellon用戶購買特定附加產(chǎn)品:家庭普通信貸限額的傾向,利用該工具可生成用于檢測(cè)的模型。據(jù)銀行官員稱:IntelligenceAgent可幫助用戶增強(qiáng)其商業(yè)智能,如交往、分類或回歸分析,依賴這些能力,可對(duì)那些有較高傾向購買銀行產(chǎn)品、服務(wù)產(chǎn)品和服務(wù)的客戶進(jìn)行有目的的推銷。該官員認(rèn)為,該軟件可反饋用于分析和決策的高質(zhì)量信息,然后將信息輸入產(chǎn)品的算法。IntelligenceAgent還有可定制能力。

  美國Firstar銀行使用Marksman數(shù)據(jù)挖掘工具,根據(jù)客戶的消費(fèi)模式預(yù)測(cè)何時(shí)為客戶提供何種產(chǎn)品。Firstar銀行市場(chǎng)調(diào)查和數(shù)據(jù)庫營(yíng)銷部經(jīng)理發(fā)現(xiàn):公共數(shù)據(jù)庫中存儲(chǔ)著關(guān)于每位消費(fèi)者的大量信息,關(guān)鍵是要透徹分析消費(fèi)者投入到新產(chǎn)品中的原因,在數(shù)據(jù)庫中找到一種模式,從而能夠?yàn)槊糠N新產(chǎn)品找到最合適的消費(fèi)者。Marksman能讀取800到1000個(gè)變量并且給它們賦值,根據(jù)消費(fèi)者是否有家庭財(cái)產(chǎn)貸款、賒帳卡、存款證或其它儲(chǔ)蓄、投資產(chǎn)品,將它們分成若干組,然后使用數(shù)據(jù)挖掘工具預(yù)測(cè)何時(shí)向每位消費(fèi)者提供哪種產(chǎn)品。預(yù)測(cè)準(zhǔn)客戶的需要是美國商業(yè)銀行的競(jìng)爭(zhēng)優(yōu)勢(shì)。

標(biāo)簽:內(nèi)蒙古 山西 承德 黃石 防城港 棗莊 贛州 大同

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用》,本文關(guān)鍵詞  數(shù)據(jù)挖掘,及其,在,商業(yè),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用》相關(guān)的同類信息!
  • 本頁收集關(guān)于數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    阿巴嘎旗| 高雄市| 锡林郭勒盟| 凤凰县| 萨迦县| 昭苏县| 大邑县| 株洲县| 临江市| 巴彦淖尔市| 陈巴尔虎旗| 五寨县| 且末县| 龙口市| 阳原县| 东阳市| 安康市| 壶关县| 昌邑市| 新宁县| 克什克腾旗| 盱眙县| 阜阳市| 边坝县| 千阳县| 昌江| 天全县| 永昌县| 龙陵县| 惠来县| 安徽省| 南平市| 石家庄市| 赫章县| 临朐县| 安新县| 汉寿县| 诸城市| 来宾市| 永善县| 新营市|