銀行個人信用評估方法研究

| 國內外信用評估狀況比較

銀行個人信用評估方法研究

目前,中國除了上海之外,其它城市還沒有專營消費信貸調查業務的報告機構。1999年下半年,建設銀行濟南分行出台的《個人信用等級評定辦法》在信用評估方面進行了嘗試。該辦法對不同的指標賦予不同的分值,對借款申請人的還款能力、信用狀況等做出綜合評價以決定貸款決策。隨着信貸業務的需要,國內越來越多金融機構以業務對象的個人信用記錄直接作決策參考,或附以一些評分方法,但畢竟以主觀經驗為主。而國外在信用評估方面已經有人做了大量的工作,提出了有FICO評分模型、神經網絡模型、貝葉斯分析模型等等各種評估模型,並採用了各種數學的、統計學的、信息學的方法,取得了一定的效果,特別是FICO評分模型,更是成為西方發達國家信用評分事實上的標準。

二、常用評估方法

1.標準數理統計模型

基於標準數理統計理論的信用評分模型是對大量的個人消費貸款的歷史信用數據進行科學的歸納、總結、計算而得到的量化分析公式。在美國,不同的行業有不同的信用評分模型來幫助專業人士進行信用風險管理,如表1所示:

表1 美國不同行業常用信用評分模型表

從概念上講,信用評分就是利用消費者過去的信用表現來預測其未來的信用行為,如圖1所示。

信用評分模型的關鍵是科學合理地選出信用變量,併產生一個公式。信用評分模型的統計方法有線性概率模型、logit模型、probit模型以及線性判別(Discriminant)分析方法。

(1)線性概率模型

線性概率模型假設違約概率Y與信用變量X之間的關係是線性的, 用於解釋過去信用行為(違約或不違約)的信用變量及其重要性(係數)被用來預測未來的信用行為。線性概率模型數學表達如下:

根據歷史樣本數據進行優化計算,得出係數βj的估算值。

(2)Logit信用評分模型

Logit信用評分模型是採用數理統計的logit迴歸方法建模分析。logit信用評分模型的分析方法如下:

這裏,Y∈{0,1}是二元響應變量,表示信貸狀況;為logit概率累積分佈函數。當Xj屬於度量變量時,Xj表示為第j個可度量變量;當Xj屬於範疇變量時,Xj表示為啞元變量向量。

(3)Probit信用評分模型

Probit 模型同樣能夠把違約概率的預測值限制在0和1之間。它與logit模型的不同在於probit模型假設違約概率服從累積正態分佈(cumulative normal distribution),即

(4)線性判別模型

判別模型根據過去觀察到的借貸者的信用特徵,把他們劃分成高違約風險和低違約風險類別。線性判別模型(Linear Discriminant Model) 假定信用變量對這種劃分的影響是線性的。

2.數據挖掘技術

數據挖掘從大量數據中提取或“挖掘”知識,其任務可以分為描述和預測兩類,用於信用評估,可對客户進行分類、聚類、關聯規則發現、預測、偏差檢測等。其中多數用分類、關聯規則發現和預測方法進行個人信用評估。

(1)分類

按分析對象的屬性、特徵建立不同的組類描述事物。它基於對類標記已知的數據對象的分析,導出描述並區分數據類或概念的模型(或函數),用以預測類標記未知的對象類。導出模式可以用分類規則、判定樹、數學公式或神經網絡等形式表示。

(2)關聯規則發現

某種事物發生時其他事物會發生的一種聯繫,這些規則展示屬性-值頻繁地在給定數據集中一起出現的條件,關聯規則形式:X=>Y,即“A1∧...∧Am=>B1∧...∧Bm”。

(3)預測

把握分析對象發展的規律,對未來的趨勢作出預見,其表示形式與分類同。

三、一種基於歷史記錄規則相似性的綜合評估方法

由於國內銀行業現有客户記錄多數是不完整的,所以使用單一的方法進行評估未必能體現客户真實的信用歷史狀況。為了將數據挖掘技術和數理統計完全基於記錄本身特徵並與能夠體現專家判斷的評分很好地結合起來,本文提出一種基於關聯規則的相似推薦方法,實現如下:

1.應用粗糙集理論對歷史數據記錄進行屬性約簡及規則提取

粗糙集理論是數據表簡化和生成最小決策算法的有效方法,可以實現知識約簡,發現屬性表中的屬性依賴,從而在信息不完全環境下進行知識發現,其定義如下:

S=<U,A,F,V>

其中,S:信息系統(決策表)

U:論域

A:屬性集合

F:UXA→V的映射

V:屬性值域集合

採用決策偏好信息的挖掘方法(參見文獻[3]),對S進行屬性約簡併提取規則,形成不同支持度S和信任度C決策規則集合DN{ф→Ψ}(其中N代表提取的規則數量,可根據實際情況確定),且D是S不重複的子集,ф是條件屬性,Ψ是決策屬性,ф、Ψ∈A。

2.對測試記錄與步驟1提取的規則進行相似性計算

相似性是某種關係強度的度量,可以通過數值比較來衡量(參見文獻[4])。因為決策規則集合D不能完全覆蓋所有測試記錄屬性值組合,而且決策表對象結構相同。測試集合SD中的任一組合(規則)Dd對照D中Dn進行相似性計算,得出SIM1、

其中, B:歸一化因子

(B=1/ ∑Wi)

Wi:屬性i貢獻因子

(體現數據特性或專家經驗,也可通過多種賦權綜合評價求得)

SD(Dd,Dn):已知Dd發生,Dn也在同一組發生的概率

3.多賦權綜合評價

對上述步驟求得參照各個規則的支持度S、信任度C及相似性SIM組成一個N個對象、3個指標的矩陣XN×3。

(1)運用變異係數法對X進行客觀賦權

此時,第j個指標的權重就是 這種加權方法是為了突出各指標的相對變化幅度,即變異程度。

(2)對X使用線性插值法進行規範化處理,得到規範化矩形ZN×3,對其使用互補判斷矩陣排序法求屬性權重:

I=1運用綜合賦權法將(1)、(2)兩個權向量進行有機集成,得到綜合權向量W=(W1,W2,......,WN)。傳統的綜合賦權有乘法合成歸一化、線性加權組合法、基於spearman等級相關係數綜合賦權法等,也可採用基於灰色關聯度的客觀權重綜合集成法。

最終求出測試記錄對各個規則的評價值fi=∑wj×zij ,(i=1,2,......,N),其中MAX(fi)就是與測試記錄最相似的規則,可將其決策偏好作為測試記錄的預期偏好。

四、結束語

基於歷史記錄規則相似性的綜合評估方法以客觀存在的記錄規則為依據,更好地保留數據特徵並結合專家經驗,評估結果更加客觀準確。