銀行客戶信息整合詳解

2003/04/14

　　隨著中國成功加入WTO，并逐步向國際社會開放自己的金融市場，將會有更多的國外商業(yè)銀行進入中國金融市場。如何在國內國際的金融市場競爭中立于不敗之地，并且穩(wěn)步發(fā)展自己，關鍵在于能否有效地挖掘和利用已經建立起來的和潛在的客戶資源。國內各商業(yè)銀行都已經逐步建立起龐大的綜合業(yè)務系統(tǒng)，主要應用于銀行的交易處理和賬戶管理。這些系統(tǒng)中積累了大量的面向賬戶的交易數據，但是由于面向交易的系統(tǒng)往往以產品為中心，信息分散在不同系統(tǒng)中，缺乏對客戶統(tǒng)一全面的了解，不能對賬戶背后的客戶有直接全面的認識。

　　如果把各種客戶相關數據采集、抽取、整合在一起，從中提取客戶的交易習慣、利潤貢獻、資產負債變化趨勢等等，就可以作為發(fā)現優(yōu)質客戶、向客戶提供差別化服務的信息基礎。同時，根據客戶對銀行產品的選擇和使用情況，可以為正確的市場定位，發(fā)現最有商業(yè)價值的金融產品以提供數據支持。只有充分挖掘利用這些數據，才能使其成為真正的數據財富。

個人客戶信息整合方案設計

　　面向客戶的數據庫設計

　　面向客戶的數據庫需要圍繞客戶的各種信息和交易行為信息進行設計�？蛻粜畔祿䦷熘械母鞅硪钥蛻艟幋a為關鍵字進行關聯(lián)和管理，包含客戶基本信息、相關客戶信息、客戶賬戶信息、客戶交易信息、客戶資產負債信息等數據表。

　　已有個人客戶信息的整理

　　現有的交易系統(tǒng)都是面向賬戶服務的，數據表的設計都是圍繞著賬號進行關聯(lián)，而客戶信息散亂地存放在各個交易子系統(tǒng)中，既有重復也有不一致的。面向個人客戶的交易系統(tǒng)一般包括儲蓄系統(tǒng)、信用卡系統(tǒng)、個人貸款系統(tǒng)、住房公積金系統(tǒng)等，既有個人客戶的基本信息，也有本外幣賬戶、銀行卡、貸款申請、還款等信息。賬戶情況、交易情況在不同的系統(tǒng)中存放的內容相對獨立，而且數據的正確性可以保證，這些數據的整合主要是根據分析的類別分類抽取。而客戶基本信息卻是在各個系統(tǒng)中都有存放，整合的難度是最大的。

　　在不同的系統(tǒng)中，個人客戶的基本信息有全面的（如個人貸款申請所留的資料），也有最有限的（如個人活期賬戶開立只需姓名和身份證號）。各系統(tǒng)的編碼規(guī)則各不相同，如職務，可能按“廳局處科”這種方式編碼，也可能按“董事長、總經理、經理”這種方式編碼，甚至直接存入漢字信息。要將各系統(tǒng)中客戶信息整合在一起需要進行大量仔細的核對工作，將不同系統(tǒng)中的數據合理地進行轉換和清理。同時，不同系統(tǒng)中所存放的數據真實性、完整性也不盡相同，例如，雖然儲蓄、信用卡、個貸等系統(tǒng)中都存有客戶的通訊地址，但信用卡客戶由于每月需要郵寄對賬單，信用卡系統(tǒng)中存放的客戶通訊地址往往是最為準確的。申請貸款的客戶由于需要經過審批，其個人收入、單位狀況等信息往往是最準確的。因此，對同一個客戶在不同系統(tǒng)中存放的資料也需要進行認真分析，從中抽取最有效的信息。

　　數據對照關系的建立

　　我們需要從以往的各個交易子系統(tǒng)中抽取有價值的客戶信息，并經過清洗轉換到客戶信息數據庫中。針對客戶信息數據庫中每張數據表、每個數據字段，需要從原來的數據源中尋找對應的數據、設計轉換的算法、建立對照關系。

數據抽取工具的選擇

　　從多個交易數據庫中抽取數據轉換到客戶信息數據庫中需要進行大量的數據訪問、計算和裝載，選擇強有力的工具可以大大提高開發(fā)和運行的效率。DataStage 是一個專業(yè)的ETL（抽取/轉換/裝載）工具，可以從多種不同數據源中進行數據抽取、轉換和清洗，并根據需要將結果輸出到目標數據庫或文本文件。

　　邏輯架構

　　由圖1可以看出DataStage既可以應用于多個數據庫數據的抽取轉換，也可以對普通的文本文件、HTML文件進行抽取轉換，然后將轉換后的數據直接裝載到數據倉庫中或產生新的普通文本文件等，便于客戶以后對數據進行查詢、分析、制作各種報表，并且進行數據挖掘。

　　圖1 DataStage邏輯架構

　　常用設計簡介

　　DataStage 提供給開發(fā)者非常直觀的圖形界面，開發(fā)者可以遵循一種工作流思考方式來選擇數據源、目標數據與過程轉換用的組件（Stages），并將之置于一個最初看起來像一個空格一樣的“草稿表”模板上。Stage是包含了一定功能的組件，類型很多：作為數據源和目標的可以是各種數據庫的連接，可以是文本文件或hash文件等；作為轉換功能的可以是排序、聚類統(tǒng)計、數學運算等具有特殊功能的組件。設計者用一種叫做“鏈接”的箭頭來連接這些具有代表性的圖標，而這些箭頭則闡明了運行開始后數據與元數據的流向。在創(chuàng)建DataStage任務時，用戶可以在設計草圖上添加注釋、說明、標簽或是其他可以添加給作業(yè)的描述性文字。DataStage使用圖形方式建立表的查詢、連接關系、排序和匯總運算。圖2、圖3是幾種常用的設計模式：

　　圖2 源數據和目標數據都直接操作數據庫

　　數據抽取的實現

　　客戶信息數據庫中的各表以客戶編碼為關鍵字進行關聯(lián)，客戶編碼是由客戶的證件號碼經過專門的算法計算產生的唯一客戶標識。根據各個系統(tǒng)中客戶數據與新系統(tǒng)客戶信息的對照關系我們設計數據抽取轉換的程序，如圖4所示是一個DataStage的Job。

　　由于源數據量很大，從數據庫中直接提取數據效率不高，我們采用先將數據卸載到文本文件中，再從文本中抽取數據進行處理。通過DataStage的Sequential File Stage可以連接一個指定路徑的文本文件，在db1_tab1設定文件的存放位置、文件中分隔符、文件中每個字段的類型、長度和名稱，即可以取得客戶的證件號碼、姓名、電話、職務職稱等信息。這些信息需要進行一系列處理：計算客戶編碼，根據新編碼規(guī)則進行代碼轉換，去掉非法字符等，在一個Transformer Stage Transform1中對各數據進行處理。

圖3 源數據和目標數據直接操作文本文件

　　其中CreateKhbm函數是利用DataStage提供的函數開發(fā)環(huán)境編寫的，目的是產生客戶唯一標識客戶編碼。由于tab1中的身份證號字段存儲的證件號碼數據不規(guī)范，所以在CleanSfzh函數中，我們對不規(guī)范的證件號碼進行清洗整理，產生規(guī)范的證件號碼。證件類型（zjlx）由于在不同系統(tǒng)中編碼定義不同，因此需要進行轉換。通訊地址和郵編兩個字段只對空值進行特殊處理。在這樣一個Transformer Stage中只需用很少的代碼即可以完成需要的數據處理。

　　由于不同的源數據中可能包含同一個客戶的信息，因此采用Hashed File Stage HF_khjbxx存放輸出結果，相同客戶的信息根據客戶編碼覆蓋前面產生的信息，避免了重復的客戶信息。從不同源數據庫取得客戶信息，根據數據的真實性依次進行處理后，生成的客戶信息全部保存在一個Hash文件中，最后從Hash文件中取出結果數據裝載到目標數據庫中。

圖4 一個DataStage的Job

　　由于客戶數據量很大，為了在不同的數據庫中將大量的數據進行整合，數據處理效率十分重要。在實現中不直接操作數據庫而使用文本文件的優(yōu)勢在于DataStage直接抽取文本文件數據的效率高于從數據庫中抽取，DataStage訪問數據庫時需要通過ODBC連接相應的數據庫Driver，連接上數據庫后，從數據庫中抽取部分數據存放于DataStage Server內存中，轉換裝載完后，再從數據庫中抽取一部分數據，所以不適用于大數據量的抽取轉換，而且不易于實現多進程同時執(zhí)行。

　　對于大數據量的抽取轉換（如1000萬條記錄），我們可以手工卸載成幾個文本文件，放到DataStage Server上，DataStage在抽取轉換時直接將文本文件內容裝載到內存中，省去了連接數據庫資源的消耗，并且可以同時執(zhí)行幾個Job（Job的設計可以重用），從而提高抽取轉換效率。

　　在客戶基本信息整合完成后，從不同系統(tǒng)將客戶的賬戶數據抽取出來，客戶的每個賬戶、賬戶類型、幣種、狀態(tài)、余額、積數、開戶、銷戶情況全部整合在一起，建立起一套較為完整的客戶總賬。在此基礎上，對客戶的資產負債總量、分布情況可以匯總統(tǒng)計，每日對資產負債變化進行跟蹤分析，可以全面地了解客戶在銀行的資產分布和變化狀況。同時，從各交易系統(tǒng)中獲得賬戶的交易情況，可以轉換為客戶的交易情況，分別統(tǒng)計不同時間段、不同交易地點、不同交易種類的客戶交易，從而了解客戶的交易習慣和喜好�？蛻粜畔⒄虾螅煌嵌�、不同層面的客戶分析可以全面展開。

　　結束語

　　目前，各個銀行都已具有強大的面向賬戶的交易系統(tǒng)。真正要做到面向客戶服務首先要建立完善的客戶信息系統(tǒng)。放棄目前各系統(tǒng)中分散零亂的客戶信息而從頭積累客戶信息是巨大的浪費，從分散的賬務系統(tǒng)中抽取整合客戶信息通過實踐是完全可行的。只要設計一個科學的方法，采用有效的工具，完全可以在很短的時間內將有效的數據提煉出來，建立起擁有幾百萬客戶的信息庫�？蛻粜畔觳粌H為客戶服務提供了基礎，更為客戶分析創(chuàng)造了必要條件。

賽迪網中國信息化(industry.ccidnet.com)

相關鏈接:

架構在互聯(lián)網上的CRM 2003-04-11

CRM在閉環(huán)中運行 2003-04-11

數據倉庫支持的“關系優(yōu)化器” 2003-04-11

共同打造一流顧客滿意度 2003-03-27

借力CRM系統(tǒng) 上海通用為客戶需求號脈 2003-03-24

分類信息: 銀行_與_CRM 文摘行業(yè)_銀行_解決方案技術_CRM_解決方案
宜州市| 永济市| 金阳县| 北京市| 上高县| 大埔区| 同德县| 榕江县| 南华县| 饶平县| 武邑县| 德兴市| 江川县| 大石桥市| 新巴尔虎右旗| 民县| 呼图壁县| 安西县| 江安县| 禹州市| 青铜峡市| 济南市| 葵青区| 塘沽区| 平山县| 馆陶县| 宁夏| 临泉县| 武隆县| 公主岭市| 万年县| 甘肃省| 凤城市| 巫山县| 巩留县| 当雄县| 泸定县| 虞城县| 开江县| 潼关县| 伽师县|