隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,傳統(tǒng)金融業(yè)務也從線下不斷轉(zhuǎn)移到線上,很多原先在線下的金融機構(gòu)開始在互聯(lián)網(wǎng)上開展經(jīng)營活動。由于線上和線下的經(jīng)營方式的差異,在對客戶背景了解方面,互聯(lián)網(wǎng)金融機構(gòu)面臨著新的挑戰(zhàn)。
本篇案例為數(shù)據(jù)猿推出的大型“金融大數(shù)據(jù)主題策劃”活動(查看詳情)第一部分的系列案例/征文;感謝 頎靈鷹澤 的投遞
作為整體活動的第二部分,2017年6月29日,由數(shù)據(jù)猿主辦,互聯(lián)網(wǎng)普惠金融研究院聯(lián)合主辦,上海金融行業(yè)信息協(xié)會、中國信息通信研究院、大數(shù)據(jù)發(fā)展促進委員會、上海大數(shù)據(jù)聯(lián)盟、首席數(shù)據(jù)官聯(lián)盟、中國大數(shù)據(jù)技術(shù)與應用聯(lián)盟、上海張江發(fā)展戰(zhàn)略研究院、人大人科創(chuàng)協(xié)辦的《「數(shù)據(jù)猿·超聲波」之金融科技·商業(yè)價值探索高峰論壇》還將在上海隆重舉辦【論壇詳情】【上屆回顧(點擊閱讀原文查看)】
在論壇現(xiàn)場,也將頒發(fā)“技術(shù)案例獎”、“應用案例獎”、“實踐案例獎”、“優(yōu)秀征文獎”四大類獎項
來源:數(shù)據(jù)猿丨投遞:頎靈鷹澤
本文長度為5500字,建議閱讀11分鐘
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,傳統(tǒng)金融業(yè)務也從線下不斷轉(zhuǎn)移到線上,很多原先在線下的金融機構(gòu)開始在互聯(lián)網(wǎng)上開展經(jīng)營活動。由于線上和線下的經(jīng)營方式的差異,在對客戶背景了解方面,互聯(lián)網(wǎng)金融機構(gòu)面臨著新的挑戰(zhàn)。例如,在客戶反欺詐方面,由于與潛在客戶沒有見過面,僅僅是根據(jù)用戶提交的身份信息進行核實。因此,當前互聯(lián)網(wǎng)金融機構(gòu)都很重視反欺詐。
另外,由于對客戶的背景了解較少,并且由于互聯(lián)網(wǎng)的特點,這些機構(gòu)面對的客戶的分布范圍比較廣泛,脫離了原先的受限的地域范圍,而且用戶數(shù)量也比線下有了極大的增長。因此,互聯(lián)網(wǎng)金融機構(gòu)目前在對個人信用評價方面有確實存在的需求。
周期/節(jié)奏
2016年9月,北京頎靈鷹澤數(shù)據(jù)科技有限公司與金融機構(gòu)合作開發(fā)頎靈鷹澤數(shù)據(jù)評分模型,項目組成立,建立評分技術(shù)團隊。
2016年10至11月,項目團隊開始準備評分模型數(shù)據(jù),主要包括數(shù)據(jù)合并和數(shù)據(jù)清洗。
2016年12至2017年1月,開始評分模型設(shè)計工作和細分分析工作。
2017年1月至2017年2月,開始評分模型的的開發(fā)工作、模型驗證等工作,并對評分模型進行IT開發(fā)。
2017年2月至今 與大拇哥財富開展家居消費貸款和裝修消費貸款合作,將頎靈鷹澤個人信用評分模型應用于上述消費場景,幫助大拇哥財富快速開展上述兩項消費貸款業(yè)務。
客戶名稱/所屬分類
北京匯鑫融金融信息服務有限公司(大拇哥財富)/大數(shù)據(jù)技術(shù)服務
任務/目標
互聯(lián)網(wǎng)金融機構(gòu)在實際業(yè)務中需要對借貸對象進行綜合信用評價需求,例如大拇哥財富在開展消費貸款時,需要了解客戶的詳細信用狀況并根據(jù)信用狀況給予相應的授信額度。另外,互聯(lián)網(wǎng)金融機構(gòu)開展的這些消費貸款需要在較短的時間內(nèi)完成業(yè)務,因此需要解決信用評價的效率問題。
北京頎靈鷹澤數(shù)據(jù)科技有限公司計劃在與部分金融機構(gòu)開展合作的基礎(chǔ)上,結(jié)合多方面的數(shù)據(jù),如學歷信息、消費行為數(shù)據(jù)、運營商信息和信用黑名單等,開發(fā)出頎靈鷹澤個人信用評分模型,為互金機構(gòu)快速了解借貸對象的信用狀況提出幫助,助力大拇哥財富公司開展家居消費貸款業(yè)務和裝修消費貸款業(yè)務。
挑戰(zhàn)
在評分模型建立過程中,我們在實施時仍然有以下技術(shù)難點:
1.頎靈鷹澤個人評分模型的數(shù)據(jù)有多個不同的數(shù)據(jù)來源,例如個人申請評分利用的是客戶申請信息,綜合行為評分來源頎靈鷹澤合作的金融機構(gòu)和其他第三方數(shù)據(jù)公司。在這些數(shù)據(jù)中可能存在一些因各種原因?qū)е碌腻e誤,因此,為保證后續(xù)的分析工作具有良好的數(shù)據(jù)基礎(chǔ),保證分析結(jié)果的有效性,在正式進行模型開發(fā)之前需要仔細考慮如何進行數(shù)據(jù)分析、數(shù)據(jù)質(zhì)量檢查。
2.在評分模型的建立過程中,預測變量的設(shè)計、生成和計算是整個評分開發(fā)過程的重要組成部分,是評分模型進行預測的信息基礎(chǔ)。合理的預測變量設(shè)計是評分模型成功的關(guān)鍵。評分建模人員需要了解評分袁術(shù)數(shù)據(jù)的含義,并對業(yè)務有較深的理解,這對評分建模人員要求很高。
3、評分模型建立后,需要確定其測量其區(qū)分好壞客戶的能力(區(qū)分能力的指標KS值),并保持模型穩(wěn)定性(模型穩(wěn)定性指標PSI),如何在兩者之間進行平衡,是一個需要綜合考慮的問題。一方面,KS值越高,模型的區(qū)分能力越好,一般模型的區(qū)分能力需要在30%以上,但如果模型的穩(wěn)定性差的話,可能需要調(diào)低KS值,以保證模型的穩(wěn)定性,兩個指標如何調(diào)整,需要有評分建模人員有豐富的經(jīng)驗。
實施過程/解決方案
個人信用評分模型的建立過程主要可以分為以下數(shù)據(jù)準備、模型設(shè)計、細分分析、變量設(shè)計、模型開發(fā)幾個階段。
1、數(shù)據(jù)準備階段
數(shù)據(jù)準備工作包括方案設(shè)計、數(shù)據(jù)合并和數(shù)據(jù)清洗,總體框架為:
其中,最重要的是數(shù)據(jù)質(zhì)量分析方案設(shè)計。數(shù)據(jù)質(zhì)量分析方案設(shè)計需要根據(jù)數(shù)據(jù)分析的目標、當前的數(shù)據(jù)情況,確定整個數(shù)據(jù)質(zhì)量分析需要分析的內(nèi)容,包括是否需要進行數(shù)據(jù)合并及應該如何合并,需要進行哪些數(shù)據(jù)邏輯檢查等等。
方案設(shè)計是一個隨著對數(shù)據(jù)的了解和對數(shù)據(jù)的分析而不斷更新和完善的過程,因為在分析過程中,會根據(jù)數(shù)據(jù)分析的發(fā)現(xiàn)來補充需要分析的內(nèi)容,而不是全部分析工作在初始分析階段就能夠全部確定,特別是針對存在錯誤的數(shù)據(jù)而進行的問題分析,會隨著不同的錯誤情況而不同。數(shù)據(jù)質(zhì)量分析的完成也意味著質(zhì)量分析方案設(shè)計的最終完善。
數(shù)據(jù)合并是數(shù)據(jù)質(zhì)量分析過程中的一個普遍環(huán)節(jié),由于頎靈鷹澤評分模型的數(shù)據(jù)來源較多,在進行數(shù)據(jù)質(zhì)量分析及后續(xù)數(shù)據(jù)處理時,需要將多個數(shù)據(jù)源信息按照一定的關(guān)聯(lián)邏輯,例如客戶層級的標識,合并匯總到一個統(tǒng)一的數(shù)據(jù)信息表上,從而可以更加有效的進行匯總后數(shù)據(jù)信息的加工與分析。
數(shù)據(jù)清洗是在數(shù)據(jù)質(zhì)量分析過程中通過對數(shù)據(jù)進行進行邏輯檢查與挖掘分析后,對其中一些數(shù)據(jù)存在的特殊情況進行處理,以滿足后續(xù)建模工作的需要,例如對于某些缺失值與異常值的處理,可按照缺失值與異常值的產(chǎn)生原因設(shè)定不同類型的人工標準賦值。
數(shù)據(jù)質(zhì)量分析的基本流程和方法見下圖:
2、模型設(shè)計階段
在模型設(shè)計階段,將根據(jù)數(shù)據(jù)清洗和整理后得到的建模數(shù)據(jù)集,結(jié)合數(shù)據(jù)質(zhì)量分析報告及雙方的相關(guān)業(yè)務經(jīng)驗,確定頎靈鷹澤個人信用評分模型開發(fā)及模型驗證所用數(shù)據(jù),以及模型的各種排除規(guī)則、表現(xiàn)定義、樣本數(shù)據(jù)時點等,這將直接決定用于評分模型開發(fā)的好、壞、不確定樣本。
頎靈鷹澤評分模型設(shè)計環(huán)節(jié)重點考量以下要素:
模型的性質(zhì):風險、收益、其它。
數(shù)據(jù)來源:信用報告數(shù)據(jù)、其它數(shù)據(jù);
應用領(lǐng)域:貸款發(fā)放審批業(yè)務、賬戶管理等。
數(shù)據(jù)時間:觀察點、表現(xiàn)點、表現(xiàn)期、觀察期;
排除規(guī)則:不可評分數(shù)據(jù)條件、可評分但不適用于建模的數(shù)據(jù)條件;
表現(xiàn)定義:好、壞、不確定定義;
關(guān)于法律合規(guī)與公眾接受度的考慮;
評分分值標準
3、模型細分分析
頎靈鷹澤個人信用評分模型將樣本群體細分成多個子群體,從而可以分別進行模型開發(fā),其主要考慮如下需求:
對于不同子群體設(shè)置不同業(yè)務策略的需要;
數(shù)據(jù)多樣化對于不同子群體人群的適用性;
在潛在的各子群體中,可能存在較為深層的預測趨勢的差異;
通過模型細分,可比對系統(tǒng)總體建立單一模型更能提升系統(tǒng)的預測能力。
4、預測變量設(shè)計
在模型的開發(fā)過程中,預測變量的設(shè)計、生成和計算是整個評分開發(fā)過程的重要組成部分,是評分模型進行預測的信息基礎(chǔ)。頎靈鷹澤評分模型以FICO評分方法為基礎(chǔ),參考FICO評分模型的預測變量,其反映的信貸特征信息主要包括如下五大類別:
(1)還款歷史:包括客戶歷史上所有賬戶的還款拖欠情況等信息;
(2)債務情況:包括客戶所有賬戶的債務以及相關(guān)信貸產(chǎn)品的使用情況等信息;
(3)信貸歷史:包括客戶使用各種信貸產(chǎn)品的時間長度和信用歷史長度等方面的信息;
(4)信貸需求:包括客戶申請新信貸產(chǎn)品方面行為的特征信息;
(5)信貸組合:包括客戶所有賬戶中的涉及到的各種類型的信貸產(chǎn)品組合方面的信息。
5、模型的開發(fā)
鷹澤評分模型的開發(fā)階段主要有以下幾項工作:
(1)開發(fā)準備工作
在確定需要開發(fā)的模型數(shù)目、細分的邏輯之后,需要根據(jù)具體的細分邏輯,將開發(fā)時點獲取的總體數(shù)據(jù)集切分成相應的各個細分人群,并在其上抽取相應的細分模型建模所需的數(shù)據(jù)樣本。
(2 )變量分箱和降維
由于模型開發(fā)初始時,變量的數(shù)目很多,因此首先需要進行變量降維,在變量降維之后產(chǎn)生的變量集的基礎(chǔ)上,對變量進行細分箱,粗分箱,變量初步篩選,和變量轉(zhuǎn)換。
(3) 模型優(yōu)化和變量選擇
變量的選擇的目的是從變量池內(nèi)所有可能的備選變量中確定最具預測能力的特征變量組合,并排除掉對好壞預測沒有貢獻度的變量。對模型的表現(xiàn)定義分配數(shù)值,好賬戶為0,壞帳戶為1,開始邏輯回歸算法的迭代過程,確定最終的變量系數(shù)。
(4) 評分標準化
在得到了基本符合條件的多變量回歸模型后,需要將邏輯回歸結(jié)果轉(zhuǎn)化成用戶易于理解的分數(shù)。
結(jié)果/效果總結(jié)
北京大拇哥財富公司是一家在業(yè)內(nèi)小有名氣的互聯(lián)網(wǎng)金融機構(gòu),其負債端主要是各種理財產(chǎn)品,資產(chǎn)端主要是汽車貸款、房屋按揭貸款和消費貸款。隨著大拇哥財富互聯(lián)網(wǎng)業(yè)務的不斷發(fā)展,線上業(yè)務所占比例逐漸增加,對于業(yè)務風險控制的需求也越來越迫切。頎靈鷹澤個人信用評分模型適用于大拇哥財富的業(yè)務場景。
因此,大拇哥財富選擇和頎靈鷹澤開展合作,將上述的評分模型應用在大拇哥的消費貸款場景中。
大拇哥財富與某大型家居賣場合作,在賣場內(nèi)開展家居消費貸款業(yè)務和裝修消費貸款。在客戶申請消費貸款時,判斷其是否能夠通過審批及審批額度是關(guān)鍵。在傳統(tǒng)的消費貸款業(yè)務中,客戶獲批消費貸款時間大概是一至三天,如果中間發(fā)生某些狀況,審批時間可能長達一周。
另外,還需要客戶提供一些必要的證明材料,可能還需要再與消費者面談一次。
為了提高了客戶獲取貸款的效率,大拇哥財富與頎靈鷹澤在此業(yè)務上開展合作。在家居賣場,客戶選好想買的家居商品或確定好裝修方案后,如果想要辦理家居消費貸款或裝修消費貸款,只需向賣場銷售人員提供少量信息,賣場銷售人員在電腦或手機上,打開大拇哥財富軟件,將上述信息錄入系統(tǒng)。系統(tǒng)將自動進行客戶身份識別、信用風險識別等。
這其中的信用分析風險識別就是將客戶信息輸入個人頎靈鷹澤個人信用評分模型,進行評分運算,計算出該用戶的信用評分。鷹澤信用風險評分模型的評分數(shù)值與其對應的好壞客戶數(shù)量比、信用違約概率之間存在相對固定的對應關(guān)系。大拇哥財富根據(jù)評分和信用違約概率,就可以確定出該客戶是否可以通過消費貸款審批以及其可享受的貸款利率。
在消費信貸過程中應用頎靈鷹澤個人信用評分模型,使的原先的審批時間大大縮短,一般從申請貸款,到貸款審批發(fā)放的時間,大約為一個小時。用戶也不用提交太多的證明材料,客戶的體驗效果很好。
截止2017年4月底,通過與頎靈鷹澤開展評分模型合作,大拇哥財富累計發(fā)放家居消費貸款和裝修消費貸款235筆,累計金額3539萬元,貸款違約情況符合大拇哥財富之前的預期。
企業(yè)介紹:
北京頎靈鷹澤數(shù)據(jù)科技有限公司是由曾在人民銀行征信中心和京東金融工作的莊傳禮博士建立的數(shù)據(jù)科技公司,主要是服務于汽車金融公司、消費貸款公司、互聯(lián)網(wǎng)金融機構(gòu)等小微金融機構(gòu),提供個人和企業(yè)信用評價服務。
頎靈鷹澤現(xiàn)有兩個個人信用風險評分模型,一個是鷹澤信貸申請評分模型,一個是鷹澤綜合信用評分模型。這個兩個評分模型是以FICO評分方法為基礎(chǔ),利同個人基本信息、金融信息、公共信息等多維度的數(shù)據(jù)訓練而成。通過構(gòu)建的個人信用評分模型計算出來,計算出反應借款人信用風險狀況的一個分值,分值范圍在0-100之間,分值越高,則表明個人信用越好。
1、評分模型介紹
(1)鷹澤申請評分模型是基于百萬量級客戶申請信息進行構(gòu)建的,其KS值(好壞客戶數(shù)量比)達到49%,而國內(nèi)銀行同類申請評分模型的KS值普遍為30%左右。
(2)鷹澤綜合信用評分模型的預測變量覆蓋了信用歷史、當前負債、信用申請、信用類型以及信用歷史長度等五個主要范疇,具有通用性、科學性和穩(wěn)定性的特點。該模型的KS值達到56%,而國內(nèi)銀行同類信貸行為評分模型KS值普遍為40%左右。
2、應用場景
鷹澤申請評分模型和鷹澤綜合信用評分模型的應用場景十分廣泛。其中鷹澤申請評分模型可以用于個人信用卡、個人貸款申請審批;鷹澤綜合信用評分模型則適用于信貸業(yè)務的整個生命周期,可用于放貸機構(gòu)貸前、貸中和貸后管理的各個業(yè)務環(huán)節(jié),如信貸審批、風險定價、額度管理、風險預警等。
(1)信貸類:P2P、小貸、消費金融風險預警
P2P、小額貸款、消費金融等服務行業(yè),大都屬于無抵押信用貸款范疇。消費者的還貸能力和還貸意愿,可從客戶的信用中得到直接反映,信用維度包含歷史交易記錄、個人身份特征、家庭信用情況等方面。具體包含以下幾方面:
反欺詐:身份驗證、黑名單驗證
還貸能力鑒定:職業(yè)信息、公積金、社保信息判斷
家庭信用狀況:評估家庭整體風險(配偶信用查詢)
用戶價值度識別:高價值用戶--如灰名單用戶識別
在信貸業(yè)務的整個生命周期中——貸前、貸后、催收等環(huán)節(jié),頎靈鷹澤評分模型可與不同場景結(jié)合使用。
(2)貸前審核
貸前審核過程中,信貸業(yè)務員,除了審核客戶提交的基本信息、審核材料外,還可借助客戶“鷹澤分”的結(jié)果,對以下環(huán)節(jié)產(chǎn)生影響:
簡化流程:業(yè)務員確認客戶身份等基本信息后,再根據(jù)該客戶的“鷹澤分”,確定是否繼續(xù)審核該用戶其他材料,以達到快速過濾部分不合格客戶。
確定信用額度、靈活定價:系統(tǒng)根據(jù)客戶的“鷹澤分”,制定客戶的貸款額度及貸款利率。
審批結(jié)果確認:結(jié)果公司資金總量的寬裕度、以及客戶的“鷹澤分”,確定是否批準客戶的審批。
(3)催收管理
催收管理過程中,通過“鷹澤分”的查詢,對以下環(huán)節(jié)產(chǎn)生影響:
優(yōu)化催收策略:催收計劃或優(yōu)先級制定過程中,加入客戶“鷹澤分”維度,以細化催收策略。
合理分配催收資源:如果客戶“鷹澤分”低于某一數(shù)值,可將資產(chǎn)作為壞賬變賣。
(4)CRM精準營銷
集團型企業(yè)如保險公司,根據(jù)數(shù)據(jù)挖掘初步判斷客戶潛在需求后,為實現(xiàn)更精準的營銷,可在向客戶推銷產(chǎn)品前,查詢該客戶的“鷹澤分”,并根據(jù)客戶的分值情況做好不同的銷售策略:
如果用戶分值較高,減少對此類用戶的打擾,適當時機向此類客戶推薦高價值產(chǎn)品;
如果用戶分值居中,增加對此類客戶的關(guān)注度,適當時機向此類客戶推薦產(chǎn)品;
如果用戶分值較低,減少對此類客戶的關(guān)注度。
兩種信用評分使用方式可以分為三種情形:一是作為風險計量工具,單獨用于評估借款人的信用風險水平;二是和放貸機構(gòu)內(nèi)部評分結(jié)合使用,形成評分矩陣,從更多的角度對借款人的信用風險狀況進行評估;三是作為放貸機構(gòu)內(nèi)部評分模型的一個變量參與評分計算,提高內(nèi)部評分模型的性能。
數(shù)據(jù)猿超聲波
「2017金融科技商業(yè)價值探索高峰論壇」
聯(lián)系客服