首頁(yè)>>>技術(shù)>>>CRM  CRM產(chǎn)品

銀行客戶(hù)信息整合詳解

2003/04/14

  隨著(zhù)中國成功加入WTO,并逐步向國際社會(huì )開(kāi)放自己的金融市場(chǎng),將會(huì )有更多的國外商業(yè)銀行進(jìn)入中國金融市場(chǎng)。如何在國內國際的金融市場(chǎng)競爭中立于不敗之地,并且穩步發(fā)展自己,關(guān)鍵在于能否有效地挖掘和利用已經(jīng)建立起來(lái)的和潛在的客戶(hù)資源。國內各商業(yè)銀行都已經(jīng)逐步建立起龐大的綜合業(yè)務(wù)系統,主要應用于銀行的交易處理和賬戶(hù)管理。這些系統中積累了大量的面向賬戶(hù)的交易數據,但是由于面向交易的系統往往以產(chǎn)品為中心,信息分散在不同系統中,缺乏對客戶(hù)統一全面的了解,不能對賬戶(hù)背后的客戶(hù)有直接全面的認識。

  如果把各種客戶(hù)相關(guān)數據采集、抽取、整合在一起,從中提取客戶(hù)的交易習慣、利潤貢獻、資產(chǎn)負債變化趨勢等等,就可以作為發(fā)現優(yōu)質(zhì)客戶(hù)、向客戶(hù)提供差別化服務(wù)的信息基礎。同時(shí),根據客戶(hù)對銀行產(chǎn)品的選擇和使用情況,可以為正確的市場(chǎng)定位,發(fā)現最有商業(yè)價(jià)值的金融產(chǎn)品以提供數據支持。只有充分挖掘利用這些數據,才能使其成為真正的數據財富。

個(gè)人客戶(hù)信息整合方案設計

  面向客戶(hù)的數據庫設計

  面向客戶(hù)的數據庫需要圍繞客戶(hù)的各種信息和交易行為信息進(jìn)行設計。客戶(hù)信息數據庫中的各表以客戶(hù)編碼為關(guān)鍵字進(jìn)行關(guān)聯(lián)和管理,包含客戶(hù)基本信息、相關(guān)客戶(hù)信息、客戶(hù)賬戶(hù)信息、客戶(hù)交易信息、客戶(hù)資產(chǎn)負債信息等數據表。

  已有個(gè)人客戶(hù)信息的整理

  現有的交易系統都是面向賬戶(hù)服務(wù)的,數據表的設計都是圍繞著(zhù)賬號進(jìn)行關(guān)聯(lián),而客戶(hù)信息散亂地存放在各個(gè)交易子系統中,既有重復也有不一致的。面向個(gè)人客戶(hù)的交易系統一般包括儲蓄系統、信用卡系統、個(gè)人貸款系統、住房公積金系統等,既有個(gè)人客戶(hù)的基本信息,也有本外幣賬戶(hù)、銀行卡、貸款申請、還款等信息。賬戶(hù)情況、交易情況在不同的系統中存放的內容相對獨立,而且數據的正確性可以保證,這些數據的整合主要是根據分析的類(lèi)別分類(lèi)抽取。而客戶(hù)基本信息卻是在各個(gè)系統中都有存放,整合的難度是最大的。

  在不同的系統中,個(gè)人客戶(hù)的基本信息有全面的(如個(gè)人貸款申請所留的資料),也有最有限的(如個(gè)人活期賬戶(hù)開(kāi)立只需姓名和身份證號)。各系統的編碼規則各不相同,如職務(wù),可能按“廳局處科”這種方式編碼,也可能按“董事長(cháng)、總經(jīng)理、經(jīng)理”這種方式編碼,甚至直接存入漢字信息。要將各系統中客戶(hù)信息整合在一起需要進(jìn)行大量仔細的核對工作,將不同系統中的數據合理地進(jìn)行轉換和清理。同時(shí),不同系統中所存放的數據真實(shí)性、完整性也不盡相同,例如,雖然儲蓄、信用卡、個(gè)貸等系統中都存有客戶(hù)的通訊地址,但信用卡客戶(hù)由于每月需要郵寄對賬單,信用卡系統中存放的客戶(hù)通訊地址往往是最為準確的。申請貸款的客戶(hù)由于需要經(jīng)過(guò)審批,其個(gè)人收入、單位狀況等信息往往是最準確的。因此,對同一個(gè)客戶(hù)在不同系統中存放的資料也需要進(jìn)行認真分析,從中抽取最有效的信息。

  數據對照關(guān)系的建立

  我們需要從以往的各個(gè)交易子系統中抽取有價(jià)值的客戶(hù)信息,并經(jīng)過(guò)清洗轉換到客戶(hù)信息數據庫中。針對客戶(hù)信息數據庫中每張數據表、每個(gè)數據字段,需要從原來(lái)的數據源中尋找對應的數據、設計轉換的算法、建立對照關(guān)系。

數據抽取工具的選擇

  從多個(gè)交易數據庫中抽取數據轉換到客戶(hù)信息數據庫中需要進(jìn)行大量的數據訪(fǎng)問(wèn)、計算和裝載,選擇強有力的工具可以大大提高開(kāi)發(fā)和運行的效率。DataStage 是一個(gè)專(zhuān)業(yè)的ETL(抽取/轉換/裝載)工具,可以從多種不同數據源中進(jìn)行數據抽取、轉換和清洗,并根據需要將結果輸出到目標數據庫或文本文件。

  邏輯架構

  由圖1可以看出DataStage既可以應用于多個(gè)數據庫數據的抽取轉換,也可以對普通的文本文件、HTML文件進(jìn)行抽取轉換,然后將轉換后的數據直接裝載到數據倉庫中或產(chǎn)生新的普通文本文件等,便于客戶(hù)以后對數據進(jìn)行查詢(xún)、分析、制作各種報表,并且進(jìn)行數據挖掘。



  圖1 DataStage邏輯架構

  常用設計簡(jiǎn)介

  DataStage 提供給開(kāi)發(fā)者非常直觀(guān)的圖形界面,開(kāi)發(fā)者可以遵循一種工作流思考方式來(lái)選擇數據源、目標數據與過(guò)程轉換用的組件(Stages),并將之置于一個(gè)最初看起來(lái)像一個(gè)空格一樣的“草稿表”模板上。Stage是包含了一定功能的組件,類(lèi)型很多:作為數據源和目標的可以是各種數據庫的連接,可以是文本文件或hash文件等;作為轉換功能的可以是排序、聚類(lèi)統計、數學(xué)運算等具有特殊功能的組件。設計者用一種叫做“鏈接”的箭頭來(lái)連接這些具有代表性的圖標,而這些箭頭則闡明了運行開(kāi)始后數據與元數據的流向。在創(chuàng )建DataStage任務(wù)時(shí),用戶(hù)可以在設計草圖上添加注釋、說(shuō)明、標簽或是其他可以添加給作業(yè)的描述性文字。DataStage使用圖形方式建立表的查詢(xún)、連接關(guān)系、排序和匯總運算。圖2、圖3是幾種常用的設計模式:



  圖2 源數據和目標數據都直接操作數據庫

  數據抽取的實(shí)現

  客戶(hù)信息數據庫中的各表以客戶(hù)編碼為關(guān)鍵字進(jìn)行關(guān)聯(lián),客戶(hù)編碼是由客戶(hù)的證件號碼經(jīng)過(guò)專(zhuān)門(mén)的算法計算產(chǎn)生的唯一客戶(hù)標識。根據各個(gè)系統中客戶(hù)數據與新系統客戶(hù)信息的對照關(guān)系我們設計數據抽取轉換的程序,如圖4所示是一個(gè)DataStage的Job。

  由于源數據量很大,從數據庫中直接提取數據效率不高,我們采用先將數據卸載到文本文件中,再從文本中抽取數據進(jìn)行處理。通過(guò)DataStage的Sequential File Stage可以連接一個(gè)指定路徑的文本文件,在db1_tab1設定文件的存放位置、文件中分隔符、文件中每個(gè)字段的類(lèi)型、長(cháng)度和名稱(chēng),即可以取得客戶(hù)的證件號碼、姓名、電話(huà)、職務(wù)職稱(chēng)等信息。這些信息需要進(jìn)行一系列處理:計算客戶(hù)編碼,根據新編碼規則進(jìn)行代碼轉換,去掉非法字符等,在一個(gè)Transformer Stage Transform1中對各數據進(jìn)行處理。


圖3 源數據和目標數據直接操作文本文件


  其中CreateKhbm函數是利用DataStage提供的函數開(kāi)發(fā)環(huán)境編寫(xiě)的,目的是產(chǎn)生客戶(hù)唯一標識客戶(hù)編碼。由于tab1中的身份證號字段存儲的證件號碼數據不規范,所以在CleanSfzh函數中,我們對不規范的證件號碼進(jìn)行清洗整理,產(chǎn)生規范的證件號碼。證件類(lèi)型(zjlx)由于在不同系統中編碼定義不同,因此需要進(jìn)行轉換。通訊地址和郵編兩個(gè)字段只對空值進(jìn)行特殊處理。在這樣一個(gè)Transformer Stage中只需用很少的代碼即可以完成需要的數據處理。

  由于不同的源數據中可能包含同一個(gè)客戶(hù)的信息,因此采用Hashed File Stage HF_khjbxx存放輸出結果,相同客戶(hù)的信息根據客戶(hù)編碼覆蓋前面產(chǎn)生的信息,避免了重復的客戶(hù)信息。從不同源數據庫取得客戶(hù)信息,根據數據的真實(shí)性依次進(jìn)行處理后,生成的客戶(hù)信息全部保存在一個(gè)Hash文件中,最后從Hash文件中取出結果數據裝載到目標數據庫中。



圖4 一個(gè)DataStage的Job

  由于客戶(hù)數據量很大,為了在不同的數據庫中將大量的數據進(jìn)行整合,數據處理效率十分重要。在實(shí)現中不直接操作數據庫而使用文本文件的優(yōu)勢在于DataStage直接抽取文本文件數據的效率高于從數據庫中抽取,DataStage訪(fǎng)問(wèn)數據庫時(shí)需要通過(guò)ODBC連接相應的數據庫Driver,連接上數據庫后,從數據庫中抽取部分數據存放于DataStage Server內存中,轉換裝載完后,再從數據庫中抽取一部分數據,所以不適用于大數據量的抽取轉換,而且不易于實(shí)現多進(jìn)程同時(shí)執行。

  對于大數據量的抽取轉換(如1000萬(wàn)條記錄),我們可以手工卸載成幾個(gè)文本文件,放到DataStage Server上,DataStage在抽取轉換時(shí)直接將文本文件內容裝載到內存中,省去了連接數據庫資源的消耗,并且可以同時(shí)執行幾個(gè)Job(Job的設計可以重用),從而提高抽取轉換效率。

  在客戶(hù)基本信息整合完成后,從不同系統將客戶(hù)的賬戶(hù)數據抽取出來(lái),客戶(hù)的每個(gè)賬戶(hù)、賬戶(hù)類(lèi)型、幣種、狀態(tài)、余額、積數、開(kāi)戶(hù)、銷(xiāo)戶(hù)情況全部整合在一起,建立起一套較為完整的客戶(hù)總賬。在此基礎上,對客戶(hù)的資產(chǎn)負債總量、分布情況可以匯總統計,每日對資產(chǎn)負債變化進(jìn)行跟蹤分析,可以全面地了解客戶(hù)在銀行的資產(chǎn)分布和變化狀況。同時(shí),從各交易系統中獲得賬戶(hù)的交易情況,可以轉換為客戶(hù)的交易情況,分別統計不同時(shí)間段、不同交易地點(diǎn)、不同交易種類(lèi)的客戶(hù)交易,從而了解客戶(hù)的交易習慣和喜好。客戶(hù)信息整合后,不同角度、不同層面的客戶(hù)分析可以全面展開(kāi)。

  結束語(yǔ)

  目前,各個(gè)銀行都已具有強大的面向賬戶(hù)的交易系統。真正要做到面向客戶(hù)服務(wù)首先要建立完善的客戶(hù)信息系統。放棄目前各系統中分散零亂的客戶(hù)信息而從頭積累客戶(hù)信息是巨大的浪費,從分散的賬務(wù)系統中抽取整合客戶(hù)信息通過(guò)實(shí)踐是完全可行的。只要設計一個(gè)科學(xué)的方法,采用有效的工具,完全可以在很短的時(shí)間內將有效的數據提煉出來(lái),建立起擁有幾百萬(wàn)客戶(hù)的信息庫。客戶(hù)信息庫不僅為客戶(hù)服務(wù)提供了基礎,更為客戶(hù)分析創(chuàng )造了必要條件。

賽迪網(wǎng) 中國信息化(industry.ccidnet.com)


相關(guān)鏈接:
架構在互聯(lián)網(wǎng)上的CRM 2003-04-11
CRM在閉環(huán)中運行 2003-04-11
數據倉庫支持的“關(guān)系優(yōu)化器” 2003-04-11
共同打造一流顧客滿(mǎn)意度 2003-03-27
借力CRM系統 上海通用為客戶(hù)需求號脈 2003-03-24

分類(lèi)信息:  銀行_與_CRM     文摘   行業(yè)_銀行_解決方案   技術(shù)_CRM_解決方案
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 镇原县| 宁海县| 杭锦旗| 舟曲县| 莲花县| 石河子市| 定安县| 丽水市| 长垣县| 西充县| 鄂托克前旗| 革吉县| 南丹县| 漯河市| 都江堰市| 汉阴县| 洞头县| 阳谷县| 天等县| 天柱县| 酉阳| 常熟市| 卢氏县| 钟祥市| 荆州市| 荥阳市| 宁陵县| 桐乡市| 藁城市| 通州区| 台东市| 彰化市| 阿克苏市| 绥德县| 通江县| 台山市| 上犹县| 葵青区| 旬邑县| 邳州市| 蒙山县| http://444 http://444 http://444 http://444 http://444 http://444