·摘 要·
大數(shù)據(jù)風控作為傳統(tǒng)風控方式補充,主要利用行為數(shù)據(jù)來實施風險控制,用戶行為數(shù)據(jù)可以作為另外的30%客戶風控的有效補充。大數(shù)據(jù)風險控制的作用就是從原來被拒絕的貸款用戶中找到合格用戶,識別出已經(jīng)通過審核的高風險客戶和欺詐客戶。
大數(shù)據(jù)風控那點事?(上)
大數(shù)據(jù)風控同傳統(tǒng)風控在本質(zhì)上沒有區(qū)別,主要區(qū)別在于風控模型數(shù)據(jù)輸入的緯度和數(shù)據(jù)關聯(lián)性分析。據(jù)統(tǒng)計,目前銀行傳統(tǒng)的風控模型對市場上70%的客戶是有效的,但是對另外30%的用戶,其風控模型有效性將大打折扣。
大數(shù)據(jù)風控作為傳統(tǒng)風控方式補充,主要利用行為數(shù)據(jù)來實施風險控制,用戶行為數(shù)據(jù)可以作為另外的30%客戶風控的有效補充。大數(shù)據(jù)風險控制的作用就是從原來被拒絕的貸款用戶中找到合格用戶,識別出已經(jīng)通過審核的高風險客戶和欺詐客戶。
一、銀行信用風險控制的原理
金融行業(yè)中,銀行是對信用風險依賴最強的一個主體,銀行本質(zhì)就是經(jīng)營風險,不同的風險偏好決定了銀行的經(jīng)營水平。在經(jīng)濟結(jié)構(gòu)調(diào)整周期過程中,信用風險管理也是各個銀行面臨的巨大挑戰(zhàn)。
1.兩種常見的信用風險管理方式
銀行信用風險管理有兩種方式,第一種方式是從大量申請人中找到合格的貸款客戶,將貸款放給這些人。第二種方式是從申請人中識別出有潛在風險的貸款客戶,不將貸款發(fā)給這些人??梢院唵蔚卣J為是找到好種子和識別出壞種子
2.如何找到合格的貸款人?
銀行在找好種子時,一般會對好種子進行一些基本限定,從貸款人的學歷、年齡、收入、職業(yè)、資產(chǎn)、負債、消費等幾個方面進行打分,最后綜合評級,依據(jù)評估分數(shù)進行貸款審批,可以簡單地認為是風險定價(RBP)。
貸款銷售人員主要的任務是找到好種子的用戶,通過KYC和風險評估等方式的找到潛在合格客戶。這個階段的風險控制可以認為是一個基線控制,經(jīng)過風險評估之后,會得到客戶的評估分數(shù)或風險評級。在控制基線之上的客戶會被放進來,認為是潛在合格客戶;風險管理部門進一步驗證,如果審核通過之后,就會依據(jù)分數(shù)和級別發(fā)放貸款。
3.識別出潛在風險的人
利用數(shù)學模型來識別風險客戶,目的是找到欺詐客戶和未來不會還款的用戶。在識別壞種子時,數(shù)學模型和壞種子是關鍵,數(shù)學模型決定風控方式是否科學,數(shù)據(jù)緯度是否全面,結(jié)論是否科學。壞種子是用來修正風控模型參數(shù),提升模型的魯邦性,同時讓模型可以不斷完善自己。在預防欺詐用戶時,行業(yè)共享的黑名單也起到了很大的作用。
壞種子對識別出欺詐用戶和潛在違約用戶十分關鍵,風控模型是否有效的一個前提就是是否有足夠多的壞種子。
4.個人消費金融授信的5P原則
信用貸款分為抵押貸款和無抵押貸款,其中抵押貸款的風險相對較低,風險評估過程中主要關注抵押品的自身價值和貸款覆蓋率,貸款用途和還款能力占信用審批權(quán)重比例較低。銀行過去大量的個人貸款,都是抵押貸款,其中按揭房貸占了很大的比重。
無抵押貸款稱為信用貸款,時髦的稱呼為消費金融。貸款人無需進行財產(chǎn)抵押,僅僅依靠自身信用分數(shù)或還款能力申請貸款。相對于抵押貸款,其風險較高,也是銀行信用風險管理的重點領域。這幾年消費貸款增加較快,預計2017年同個人消費相關的消費貸款,可以達到27萬億左右。很多銀行、信用卡中心、互聯(lián)網(wǎng)金融公司都在爭奪這個市場。
個人金融消費貸款除了遵循CCCP消費金融授信審核標準之外,授信5P原則也經(jīng)常用于評估客戶信用風險?!?P”原則主要是指貸款人情況(people),資金用途(purpose),還款來源(payment),債權(quán)確保(protection),借款人展望(perspective)。
·貸款人情況
是指貸款人信用情況、個人財力、銀行往來記錄,其中其個人信用評分比重最高,個人財力次之,貸款人的還款記錄和還款意愿也很重要。
·資金用途
是指貸款人的借款用途是否合理、合法。是否用于投機領域或高風險領域,例如高利貸或賭博等。資金用途是否合法,同貸款被按時歸還相關度較高。
·還款來源
是授信審批中最重要的,用來了解貸款客戶是否具備還款來源,其償債能力如何。其中客人的月度薪資收入、資產(chǎn)收入、支出費用、財產(chǎn)價值都高度相關。其中常用衡量標準是無擔保貸款不得超過月收入的22倍(DBR小于等于22),月還款金額不得超過客人扣掉所有支出費用后,所剩費用的一半。另外信用卡的授信額度也會被考慮在內(nèi)。
·債權(quán)確保
主要是指對申貸客戶所提供的各項擔保品進行評估,當貸款違約時,銀行可以處理擔保品,減少帶貸款損失。消費金融一般無擔保品,因此債權(quán)擔保不太適用,但是某些消費金融公司會讓貸款人購買一個擔保產(chǎn)品,一般為貸款總額的2%,可以作為債權(quán)確保。
·借款人展望
就是貸款人未來違約的可能性,依據(jù)貸款人的行業(yè)、薪資、職業(yè)、職務、學歷等因素進行預測,評估未來發(fā)生風險的概率。一般入門門檻低、專業(yè)程度低,可替代性高度高的工作或行業(yè)風險較高。
5.貸前風險控制的重要性。
信用貸款的風險控制分為貸前,貸中,貸后三個階段。貸前控制主要是找到合格貸款人;貸中控制主要預防抵押品資產(chǎn)減值,無法覆蓋貸款標的,或者預防借款人還款能力下降,無法按時歸還貸款;貸后控制,主要當貸款發(fā)生逾期時,通過催收降低銀行損失。其中,貸前風險控制是最為重要的。
摩根大通銀行有一個統(tǒng)計,75%的信用風險可以在貸款前進行風險控制,貸后風險控制的有效性大概只用25%。因此對于金融企業(yè),貸款前的風險控制更為重要。在信用卡領域,貸款前的惡意欺詐占整體信用貸款損失的60%,真正貸款到期,不進行還款的的客戶只占信用貸款損失的40%?;ヂ?lián)網(wǎng)金融企業(yè)也是如此。信用貸款風險控制過程中,貸前風險控制是最為重要的。
二、金融行業(yè)信用風險控制的挑戰(zhàn)
金融行業(yè)在過去主要依靠經(jīng)驗和宏觀經(jīng)濟形式來實施風險控制,以定性為主,更多依賴風險管理精英的個人能力,特別在經(jīng)濟發(fā)展很好的時期,風險管理偏好不太科學,不能夠反應出真正的風險水平。定性的風險管理占主體,定量的風險管理起到很小的作用。
現(xiàn)在,越來越多的銀行正在重視定量風險管理,積極利用風控模型來實施風險評估。巴塞爾III協(xié)議的推行,推動了定量風險評估。大多數(shù)中國銀行的風控模型大多從國外引入,經(jīng)過自己定制和改良之后用于信用風險評估。但是信用風險和操作風險比較復雜,由于信息不全以及其他問題,很多國外的信用風險模型效果不太明顯。于是大多數(shù)中國銀行參考國外信用風險評估模型,做了一個中國版本。包括著名的FICO風控模型,現(xiàn)在銀行很少直接采用。
在這個中國版本的風控模型中,企業(yè)信用貸款過于依賴政府授信和國有企業(yè),這種粗放型信用風險管理在經(jīng)濟結(jié)構(gòu)調(diào)整過程中,引發(fā)了很高的不良貸款率。對私業(yè)務中,過高的信用審核標準,無法為更多的貸款申請人提供貸款,造成了無法為更多人提供服務,特別是在信用消費領域,無法實現(xiàn)普惠金融服務。
銀行在個人信用風險管理過程中遇到的主要挑戰(zhàn)。
1.缺少壞種子
銀行建立風控模型的基本原理是,利用大量壞種子,尋找到共性信息,建立風控模型。在利用另外一批壞種子來優(yōu)化風控模型,找到合適算法,預測參數(shù),加快收斂等。
壞種子對于建立風控模型至關重要,如果壞種子數(shù)量不夠,風控模型無法設定參數(shù)和修正模型。過去銀行嚴格的信貸審批機制,造成了小額貸款(信用消費信貸)規(guī)模很小,產(chǎn)生的壞種子也不多,規(guī)模較小的壞種子對于建立信用評估模型不利,,無法優(yōu)化已有的模型和提高風控模型的適用性。
信用風險常見的算法有參數(shù)統(tǒng)計法例如邏輯回歸、Bayes風險判別分析法,以及非參數(shù)統(tǒng)計方法例如聚類和K-means法,神經(jīng)網(wǎng)絡法?,F(xiàn)在應用較多的是SVM支持向量級機方法,其在小樣本、非線性及高緯模式識別中有特有的優(yōu)勢。同時SVM也是努力最小化結(jié)構(gòu)風險的算法。
2.數(shù)據(jù)緯度不全
量化風險評估需要將涉及到此風險的所有相關數(shù)據(jù)都包含進來,通過模型進行信用風險評估,計算出還款意愿和還款能力。評估采用的基本數(shù)據(jù)因素有年齡、收入、學歷、客戶資歷、行業(yè)、區(qū)域等,其占主要部分。信用因素包含如負債狀況、繳款記錄、理財方式;以及行為因素例如交易時間和頻率等。
除了這些變量和因素,其實還有一些因素并沒有被考慮到現(xiàn)有的風險評估模型中。例如貸款者的身體健康情況、生活規(guī)律、是否參與賭博、是否參與民間借貸等,同信貸違約高度相關的信息沒有被考慮到信用風險評估當中。
特別是用戶行為特征,幾乎很少的信貸評估模型會考慮用戶的行為。如果客戶在借款前,頻繁去澳門賭博、或參與民間高利貸、或有吸毒歷史、或者飆車、或者經(jīng)常半夜出入夜店等危險區(qū)域、或經(jīng)常半夜使用App等。這些危險行為因素都會對其信用風險產(chǎn)生影響,但這些因素原來并沒有被考慮到信用風險評估之中。
風險評估過程中,如果數(shù)據(jù)緯度不全,高相關數(shù)據(jù)沒有被考慮進來,對風控模型是一個大的風險。信用風險評估模型缺少了重要風險因素的輸入,其評估結(jié)果的偏離度就會較大,評估結(jié)果失效的可能性就很大。
3.風險定價不夠精細
量化風險管理的一個核心是風險定價,根據(jù)銀行自身的風險偏好來對資產(chǎn)進行定價,高風險資產(chǎn)定價較高,低風險產(chǎn)品定價較低,根據(jù)風險高低來制定資產(chǎn)收益,RBP(基于風險定價)已經(jīng)成為主流。
大多數(shù)銀行過于保守,不愿意容忍較高的逾期率和不良率,對于所有信貸產(chǎn)品都一視同仁,嚴格控制逾期率和不良率水,一旦過高,立即縮緊信貸政策,嚴格控制貸款規(guī)模。復雜的經(jīng)濟環(huán)境和風險場景,以及缺少全面數(shù)據(jù),讓風險管理專家更加謹慎對待風險管理,誤殺率遠遠大于漏放率。
實際上,不同風險的產(chǎn)品應該有不同的信貸風險控制指標,高收益的產(chǎn)品,其不良率應該比低風險的產(chǎn)品要高。例如利率為12%的小額信貸就可以容忍3%左右的不良貸款率,其利差收益完全可以覆蓋不良貸款。對于風險較低的消費信貸,其不良貸款率也可以適當放開。在逾期和不良貸款管理中,應該按照風險覆蓋程度細化資產(chǎn)定價,不能采用統(tǒng)一的風險偏好,這樣才能支持消費貸款,依據(jù)風險水平,提供精細化信貸產(chǎn)品。
4.風險模型的自我學習能力和數(shù)據(jù)的實時性
量化風險成為主流風險管理方式之后,銀行也在思考風險評估模型的科學性。影響信用風險管理的因素很多,除了客戶自身的還款能力和還款意愿,還有惡意欺詐、外界經(jīng)濟環(huán)境、黑天鵝事件等不可預見的因素。信用風險的評估完全依賴風控模型將會產(chǎn)生另外一個風險,就是模型自身學習能力和數(shù)據(jù)實效性。
好的風控模型需要具有自我學習能力,可以依據(jù)輸入數(shù)據(jù)來修正模型,另外模型的抗干擾能力也需要較強,避免大量噪聲數(shù)據(jù)干擾計算結(jié)果。具有自我學習能力的模型可以適應外部多種因素的變化,同時也可以自身迭代提高,抵抗外界噪音干擾。
實時有效的數(shù)據(jù)對于風險評估結(jié)果影響也很大,數(shù)據(jù)是有時間價值的,滯后的數(shù)據(jù)會影響評估結(jié)果,不能反映實時風險變化情況。實時的數(shù)據(jù)錄入和動態(tài)信用風險評估現(xiàn)在對銀行是一個巨大的挑戰(zhàn),一個月進行一次的風險評估并不能實時反映信用風險變化情況,銀行需要找到一個好的方法來建立動態(tài)風險視圖,不僅僅是信用風險管理,其他的風險管理方法也要向?qū)崟r數(shù)據(jù)錄入和風險實時評價方向轉(zhuǎn)變。
5.外部風險來源的多樣化
現(xiàn)在的信貸市場,不再是銀行一家的市場?;ヂ?lián)網(wǎng)金融企業(yè)的崛起,讓客戶更加容易獲得貸款,同時也加大了銀行管理信貸風險的難度。
例如一個客戶在銀行環(huán)境內(nèi)部授信額度是10萬,但是其在外面的互聯(lián)網(wǎng)金融公司、典當行、民間借貸機構(gòu),都有借貸行為,可能總計借貸規(guī)模遠遠超過10萬元??蛻舻母哳~借貸增加了違約風險,這些不在金融企業(yè)內(nèi)部的借貸行為,銀行無法了解,也無法實施有效的信貸風險管理。
信貸環(huán)境的復雜給銀行信貸風險管理帶來的較大挑戰(zhàn),客戶信貸信息分散和孤立,造成了外部風險來源的多樣化,銀行需要尋找一種方式來打破這種信息不對稱,購買外部信貸數(shù)據(jù)可以解決這個問題,但信貸數(shù)據(jù)的覆蓋率也是一個較大的挑戰(zhàn)。
大數(shù)據(jù)風控那點事?(中)
2015年互聯(lián)金融出現(xiàn)了井噴式的發(fā)展,行業(yè)貸款規(guī)模已經(jīng)突破1萬億元,同時幾個大的案件也將互聯(lián)網(wǎng)金融推到了風口。相對于傳統(tǒng)金融來講,互聯(lián)金融面對的客戶風險較高,其風控面臨的挑戰(zhàn)更大,對數(shù)據(jù)風控對要求就會更高。
三、互聯(lián)網(wǎng)金融行業(yè)的風控挑戰(zhàn)
中國的互聯(lián)網(wǎng)金融企業(yè)愿意從美國挖一些風控人才來提高自身風控水平。但是美國的征信環(huán)境比中國簡單,很多信息可以拿得到,美國已經(jīng)是一個成熟的信用社會,復雜的欺詐場景和復雜的信用風險場景不多。很多風控模型到了中國之后并不適合,因此很多中國領先的互聯(lián)網(wǎng)金融公司并沒有采用美國的風控模型,大多是自己開發(fā)風控模型。中國目前互聯(lián)網(wǎng)金融的風控環(huán)境和東歐的信用環(huán)境相似,東歐的一些征信公司在中國很有市場就是這個原因。中國互聯(lián)網(wǎng)金融公司在信貸風險管理方面面臨的挑戰(zhàn)如下。
1.客戶風險較高
傳統(tǒng)金融主要服務70%左右的客戶,他們共同的特征就是還款能力強或者背景好。其他的客戶包括中小企業(yè)和收入較低的白領、藍領客戶,銀行不愿為他們提供服務?;ヂ?lián)網(wǎng)金融公司主要為這些客戶提供短期貸款、過橋貸款、消費貸款、發(fā)薪日貸款等。
大多數(shù)互聯(lián)網(wǎng)金融客戶收入較低,在銀行那里拿不到較好的貸款額度,不是銀行的目標客戶,其信用評分較低。傳統(tǒng)金融認為這批客戶還款能力較差,不愿意降低信貸審批要求,為他們提供融資。
特別在目前中國經(jīng)濟調(diào)整的階段,這些小企業(yè)經(jīng)營者或者中低收入人群缺少原始積累,受宏觀經(jīng)濟影響較大,企業(yè)經(jīng)營和收入波動較大,他們的還款能力不穩(wěn)定。互聯(lián)網(wǎng)金融客戶中,還款能力不穩(wěn)定的客戶占很大比例,他們的信用風險較高,對互聯(lián)網(wǎng)金融企業(yè)的信用風險控制提出了很大的挑戰(zhàn)。
2.客戶信用信息不全
傳統(tǒng)金融行業(yè)可以借助于人民銀行的企業(yè)征信和個人征信數(shù)據(jù)實施信用風險評估,各個銀行和信用卡中心也可以及時更新客戶金融信貸信息,共享黑名單。在傳統(tǒng)金融領域,個人和企業(yè)的信用信息集中在一起,容易進行風險評估。
在互聯(lián)網(wǎng)金融領域,大多數(shù)互聯(lián)網(wǎng)金融公司沒有接入人行征信系統(tǒng),無法拿到客戶全維度信用信息,例如客戶財產(chǎn)、學歷、收入、貸款、金融機構(gòu)交易信息等信息?;ヂ?lián)網(wǎng)金融企業(yè)在實施信用風險評估時,僅能夠依靠客戶提供信息進行驗證,但是客戶在傳統(tǒng)金融領域的借款信息,互聯(lián)網(wǎng)金融客戶的信用信息是不全的。
互聯(lián)網(wǎng)金融企業(yè)無法拿到客戶所有的信用信息,包含傳統(tǒng)金融環(huán)境和民間借貸領域,缺少這信息對其實施信用風險評估影響很大。這也是互聯(lián)網(wǎng)金融反欺詐公司或征信公司興起的原因,他們主要的作用就是解決了客戶信用信息不對稱的問題。
3.惡意欺詐和薅羊毛比例較高
信用風險體現(xiàn)在兩個方面,一個是客戶惡意欺詐,另外一是客戶信貸違約。依據(jù)互聯(lián)網(wǎng)金融企業(yè)的經(jīng)驗,惡意欺詐占了其60%左右的信用損失。
互聯(lián)網(wǎng)金融企業(yè)還面對了另外一有趣的問題,專門有一批薅羊毛的人,利用互聯(lián)網(wǎng)金融企業(yè)的營銷漏洞,通過新用戶注冊,用戶推薦,積分兌換,短期投資來攥取超額收入。經(jīng)過精心設計,薅羊毛的收入可以達到20%/月。很多互聯(lián)網(wǎng)金融企業(yè)風險控制部門主要任務就是找出羊毛黨,拒絕他們的貸款請求。
互聯(lián)網(wǎng)金融的不良貸款率沒有對外公布,但是依據(jù)行業(yè)經(jīng)驗,5%的不良貸款率是一個較好的水平,主要損失來源于過高的互聯(lián)網(wǎng)惡意欺詐、過高的信貸審批成本、以及過高的獲客成本。
惡意欺詐基本上以團伙作案為主,并且這些人越來越聰明,技術手段越來越先進,越來越進化,很難找到公共特征,也很難歸納,不容易及時發(fā)現(xiàn)。惡意欺詐的共性信息較少,即使有大量的壞種子,也不好建立風控模型來實施控制,
互聯(lián)網(wǎng)金融公司只能依靠風控經(jīng)驗、客戶信息驗證、部分行為數(shù)據(jù)來實施反欺詐。
4.客戶違約成本低,債務收回成本較高
互聯(lián)網(wǎng)金融公司的客戶違約比例較高,并且建立了自己的貸款催收團隊?;ヂ?lián)網(wǎng)金融公司遇到貸款違約時,一般采用三種方式進行解決。
第一種是將資產(chǎn)打包,以3-4折的方式賣給資產(chǎn)管理公司,由他們?nèi)ゴ呤眨Ч皇翘?,損失較大,還有法律分線風險,因此不是主流。
第二種方式是由擔保公司承擔,客戶承擔2%左右的擔保費用,這個較為普遍,但是一旦借款規(guī)模較大,也不太適合。另外加大了客戶貸款成本,產(chǎn)品競爭力下降。
第三種是自己催收,大部分逾期的貸款可以催收回來,惡意不還款的客戶較少。逾期之后又還款的客戶反倒是互聯(lián)網(wǎng)金融的優(yōu)質(zhì)客戶,其給公司帶來的收益最高。但是缺點就是催收成本太高,客戶違約成本很低。
中國缺少個人征信評分,造成客戶信貸違約成本較低,個人貸款的違約,不會影響客戶的正常社會生活和商業(yè)行為。
5.風控模型冷啟動問題
每年都有大量互聯(lián)網(wǎng)金融公司出現(xiàn),風控成了所有互聯(lián)網(wǎng)金融公司的核心競爭力。每一家互聯(lián)網(wǎng)金融公司都會建立風控模型,實施信用風險管理。
壞種子和數(shù)據(jù)是風控模型重要輸入,決定了風控模型的有效性。新興的互聯(lián)網(wǎng)金融公司,面對新的客戶,缺少足夠的種子用戶來優(yōu)化模型,同時也缺少用戶的行為數(shù)據(jù)來完善用戶風險評估卡。
互聯(lián)網(wǎng)金融公司做風控時,缺少壞種子用戶和數(shù)據(jù)的冷啟動對其風控是一個較大的挑戰(zhàn)。這種信貸違約和惡意欺詐的壞種子,不能夠通過其他方式來解決,例如線下和向第三方購買?;ヂ?lián)網(wǎng)金融公司只能依靠自己的業(yè)務不斷積累,利用自己平臺積累的數(shù)據(jù)和種子來解決這個問題,一旦管理不好,會對新興的互聯(lián)網(wǎng)金融公司造成較大影響。
四、大數(shù)據(jù)風控的優(yōu)勢和劣勢
大數(shù)據(jù)風控是一個廣義詞和一個時代的熱詞,量化風險控制就是利用數(shù)據(jù)分析和模型進行風險評估,依據(jù)評估分數(shù),預測還款人的還款能力、還款意愿、以及欺詐風險。
大數(shù)據(jù)主要是指全量數(shù)據(jù)和用戶行為數(shù)據(jù),目前領先的數(shù)據(jù)風控或者大數(shù)據(jù)風控使用的還是小數(shù)據(jù),使用的是圍繞客戶周圍的信用數(shù)據(jù),這些數(shù)據(jù)的特點是和用戶的信用情況高度相關。之所以叫做大數(shù)據(jù)風控,完全是一個是時代用語,確切地說就是利用數(shù)據(jù)實施科學風控。就像互聯(lián)網(wǎng)思維一樣,就是以客戶為中心的商業(yè)思維,被稱為互聯(lián)網(wǎng)思維,只不過是利用了這個時代的特征而已。
·大數(shù)據(jù)風控的優(yōu)勢:
1、用戶行為數(shù)據(jù)成為風控數(shù)據(jù)
風控最好的數(shù)據(jù)還是金融數(shù)據(jù),例如年齡、收入、職業(yè)、學歷、資產(chǎn)、負債等信用數(shù)據(jù),這些數(shù)據(jù)同信用相關度高,可以反映用戶的還款能力和還款意愿,這些數(shù)據(jù)因子在風控模型中必不可少,權(quán)重也很高,是信用風險評估最好的數(shù)據(jù)。
但是除了這些強相關的數(shù)據(jù),一些用戶行為數(shù)據(jù)對信用風險評估也具有較大的影響,例如用戶是否經(jīng)常去澳門賭博,用戶是否經(jīng)??桃怆[藏自己,用戶是否參與高利貸,用戶是否具有吸毒傾向,是否患有重大心理疾病等等,這些信息在一定概率下決定了用戶風險水平。
在某些條件下這些因素會成為決定信用風險事件的強相關數(shù)據(jù)。過去這些用戶行為數(shù)據(jù),并沒有放到信用風險評估模型中,沒有參與客戶的信用風險評估。金融企業(yè)和互聯(lián)網(wǎng)金融企業(yè)在分析已經(jīng)發(fā)生的信用風險事件之后,發(fā)現(xiàn)的這些用戶行為信息在很多風險事件中起到了很關鍵的作用。小概率風險事件會導致很嚴重的后果,同信用風險事件的發(fā)生具有較強的關聯(lián)性。
現(xiàn)實世界的用戶行為可以揭示信用風險,互聯(lián)網(wǎng)上的用戶行為也同信用風險高度相關。例如全部用大寫字母填寫資料的人,信用貸款逾期率較高;凌晨1點登陸網(wǎng)絡申請貸款的人,惡意欺詐的比較多;手機上只有貸款App,沒有其他App的人,其惡意欺詐比率高;缺少社交活動的人,其貸款逾期可能性較高。這些用戶行為信息都同信用風險高度相關,可以作為一個重要因子進行錄入,影響客戶的信用評分。
大數(shù)據(jù)風控的一個最大的優(yōu)勢就是豐富了信用風險評估的數(shù)據(jù)緯度,這些用戶行為信息,很大程度是大數(shù)據(jù)采集和分析的結(jié)果,用戶一般是不會提供給金融行業(yè)的。很多信息是規(guī)律性信息,需要大數(shù)據(jù)分析才有可能得到,其在信用評估中的權(quán)重,也需要不斷的優(yōu)化模型去完善。
2、實時輸入和實時計算,解決風險視圖實效性問題
傳統(tǒng)風控的另外一個缺點是數(shù)據(jù)錄入和評估結(jié)果的滯后性,缺乏實效性數(shù)據(jù)的輸入,風控模型反映的往往是滯后數(shù)據(jù)的結(jié)果。利用滯后數(shù)據(jù)的評估結(jié)果來管理信用風險,本身產(chǎn)生的結(jié)構(gòu)性風險就較大。
銀行現(xiàn)有的風險控制機制是參考歷史數(shù)據(jù)+模型+專家經(jīng)驗。但是風險事件的聯(lián)動效應已經(jīng)變大,一個小的風險事件可能在很短的時間內(nèi)產(chǎn)生巨大的影響后果,風險事件撬動的杠桿變大了。歷史數(shù)據(jù)反應未來趨勢的相關程度正在變?nèi)?,因此信用風險管理需要大量實時的數(shù)據(jù),已有的模型對風險事件(尤其是內(nèi)部欺詐,外部欺詐)的識別能力在下降,需要新的風險控制模型和實時數(shù)據(jù)。
大數(shù)據(jù)的數(shù)據(jù)采集和計算能力,可以幫助企業(yè)建立實時的風險管理視圖。借助于全面多緯度的數(shù)據(jù)、自我學習能力的風控模型、實時計算結(jié)果、壞種子數(shù)據(jù),企業(yè)可以提升量化風險評估能力。
數(shù)據(jù)、技術、模型、分析將成為信用風險評估的四個關鍵元素,其背后的力量就是大數(shù)據(jù)的技術和分析能力。企業(yè)利用大數(shù)據(jù)的風控能力,實時輸出風險因子信息,為金融企業(yè)提供實時風險管理視圖,提高風險管理的及時性。
3、豐富數(shù)據(jù)輸入緯度以及較細的顆粒度,對傳統(tǒng)風控的補充
傳統(tǒng)風控模型已經(jīng)不能適應復雜的現(xiàn)代風險管理環(huán)境,特別在數(shù)據(jù)信息錄入緯度上,影響客戶信用評分的信息較多,很多都沒有引入到風險評估流程。例如企業(yè)所處行業(yè)的競爭環(huán)境以及同業(yè)產(chǎn)品的競爭、企業(yè)產(chǎn)品的生命周期、企業(yè)的關聯(lián)交易信息和司法信息、貸款個人的心理和性格、上下游產(chǎn)業(yè)經(jīng)營情況、市場需求變化、客戶對企業(yè)產(chǎn)品的評價等。
大數(shù)據(jù)風控可以提供全面的數(shù)據(jù)(數(shù)據(jù)的廣度),強相關數(shù)據(jù)(數(shù)據(jù)的深度),實效性數(shù)據(jù)(數(shù)據(jù)的鮮活度)。這些數(shù)據(jù)顆粒度可以很小,同內(nèi)部數(shù)據(jù)以及原有數(shù)據(jù)打通和整合之后,會影響風險評估結(jié)果,提升信用風險管理水平,客觀地反映用戶風險水平。
信用風險管理中還款意愿也較為重要,多維度、全量的用戶行為數(shù)據(jù)可以客觀揭示用戶的還款意愿,另外細小的顆粒度信息在打通之后,可以更加客觀了解客戶的還款能力。全量數(shù)據(jù)加用戶行為分析,可以充分了解客戶行為,幫助企業(yè)識別出惡意欺詐客戶。這些多緯度,細顆粒度,全面的信息正是大數(shù)分風控的優(yōu)勢所在,同時也是傳統(tǒng)風控的一個很好的補充。
·大數(shù)據(jù)風控的劣勢:
還是要強調(diào)一下,信用風險評估最好的數(shù)據(jù)還是金融數(shù)據(jù),就是人行征信系統(tǒng)里的數(shù)據(jù),大數(shù)據(jù)風控只是一個補充,不能夠完全替代傳統(tǒng)的信貸風險管理。大數(shù)據(jù)風控可以從數(shù)據(jù)緯度和分析角度提升傳統(tǒng)風控水平,是一個必要的補充,可以讓傳統(tǒng)風控更加科學嚴謹,但是不是取代傳統(tǒng)風控的模型和數(shù)據(jù)。
大數(shù)據(jù)風控也有缺點,例如數(shù)據(jù)的覆蓋率,匹配率,飽和度,鮮活度,查得率,以及相關度,甚至數(shù)據(jù)采集和使用涉及得隱私問題都是大數(shù)據(jù)風控的缺點。就像大數(shù)據(jù)應用本質(zhì)一樣,其只是提供輔助決策,數(shù)據(jù)可以說明一個問題,但是不能都代替人腦去做決定,當利用數(shù)據(jù)分析出結(jié)果后,風險管理決策還是需要風險管理專家依靠其他的信息來決定。市場上大多數(shù)的征信公司和風控公司都面臨這些問題,數(shù)據(jù)的匹配率很多都低于20%,有的做風控的公司,其數(shù)據(jù)匹配率低于8%,無法進行商用,吹牛的成分很大。
大數(shù)據(jù)風控那點事?(下)
五、反欺詐成為信用風險防范的主戰(zhàn)場
依據(jù)幾家互聯(lián)網(wǎng)金融公司的數(shù)據(jù),在統(tǒng)計的信用風險損失事件中,惡意欺詐占了60%的比例。惡意欺詐防控成了所有互聯(lián)網(wǎng)金融公司的主要風險管理任務。市場上常用的防范惡意欺詐的方式有三種。
第一種是利用黑名單機制,來拒絕一些惡意欺詐人獲得貸款。但是道高一尺,魔高一丈,黑名單共享機制時效性越來越差,并且惡意欺詐的人頻繁使用其他人信息進行欺詐,黑名單機制在一定程度上很難幫到金融企業(yè)預防欺詐。并且很多平臺不太愿意共享自己的黑名單,因為黑名單在一定程度反映貸款平臺風控管理水平,過多的黑名單會影響平臺的聲譽,甚至影響平臺融資。另外黑名單覆蓋率較低也是一個挑戰(zhàn),目前領先的反欺詐企業(yè),其黑名單覆蓋率也不超過30%。
第二種是利用共享貸款數(shù)據(jù)機制,第三方企業(yè)或者大的P2P,防欺詐聯(lián)盟共享貸款平臺的貸款記錄。其他貸款平臺可以依據(jù)申請人在其他平臺的貸款記錄來決定是否提供貸款,降低欺詐風險。這種方式效果比較好,但是對于最先受理惡意欺詐的貸款平臺是無效的,原因是沒有其他平臺的貸款記錄,無法識別出貸款者是否屬于惡意欺詐。
第三種是借助于平臺自己的風控模型,依據(jù)壞種子歸納出來的規(guī)律,識別出惡意欺詐申請者。這種方式正在成為主流,其中基本采用信息驗證,特征匹配,行為分析等方式來識別出貸款用戶是否屬于惡意欺詐用戶。常見的方式有驗證用戶的工作地點,生活區(qū)域,查看手機應用安裝,社交活動軌跡,設備聚集點,是否經(jīng)常換手機卡,是否刻意隱藏個人信息,是否短期內(nèi)故意暴露個人信息等方式。企業(yè)利用風險評分卡來對用戶進行評估,依據(jù)評分結(jié)果來決定是否貸款給客戶。
移動大數(shù)據(jù)可以幫助金融企業(yè)防范惡意欺詐,例如可以通過手機的位置信息來驗證申請人的居住地和工作地;依據(jù)App安裝列表來驗證用戶是否在活躍在多家借款平臺;依據(jù)數(shù)據(jù)識別用戶是否在幾天內(nèi)不停更換手機卡;依據(jù)手機App裝載和使用情況來辨識用戶是否安裝了很多惡意軟件例如密碼破解器,偽裝號碼軟件;客戶是否僅僅使用貸款軟件,沒有安裝常用軟件。借助于移動大數(shù)據(jù)和用戶行為信息,金融企業(yè)可以識別惡意欺詐用戶。國內(nèi)領先的移動大數(shù)據(jù)服務商TalkingData,正在為互聯(lián)網(wǎng)金融公司提供移動大數(shù)據(jù)來防范用戶的惡意欺詐,數(shù)據(jù)的查得率超過了50%左右,具有成熟的數(shù)據(jù)商業(yè)應用場景。
六、ZestFinance如何利用大數(shù)據(jù)實施風險控制
市場上最熱的大數(shù)據(jù)風控公司就是美國的ZestFinance。其技術來源于Google,正在為15%左右的美國客戶提供信用評估服務,并且也服務很多傳統(tǒng)金融企業(yè),共有400萬美國人直接通過ZestFinance申請信用評分,另外在銀行等金融機構(gòu)通過ZestFinance模型獲得信用背書的人數(shù)則遠遠大于該數(shù)。
ZestFinance公司的CEO介紹了他們公司在大數(shù)據(jù)風控領域的經(jīng)驗,很值得傳統(tǒng)企業(yè)借鑒。歐美傳統(tǒng)銀行通常采用對所有人都適用的線性回歸模型,其中包含性別、出生地等20個左右變量,對每個人都簡單化處理,以打分卡的形式評分ZestFinance采用的變量則多達70000個,采用的算法也不是線性回歸模型,而是來自Google的大數(shù)據(jù)模型。
FICO信用評分參考的數(shù)據(jù)變量只有不到50個,很多人摸清了FICO關注的變量后,就可以“模型套利”增加自己的信用評分,例如一個人可以每天反復在圖書館借書還書“刷信用”。
銀行往往采用200個一下變量和幾個模型,從模型數(shù)量而言,傳統(tǒng)征信評分通常采用一個模型,ZestFinance采用十個模型,從不同角度進行計算。十個模型從不同角度衡量申請人的分數(shù),其中兩個是進行身份驗證防欺詐的,一個是預測提前還款概率的,其余都是評判還款意愿和能力的。最后會用一個決策模型將十個模型的結(jié)果整合在一起,得到最終的結(jié)果。
ZestFinance發(fā)現(xiàn)模型越多,準確率越高。有兩個模型,對利潤的提升分別是16.9%和9.4%,可能第二個模型往往會被棄用。但如果把這兩個模型放在一起使用,利潤會提升了38.3%。每個模型平均半年就會誕生一個新版本,替代舊的版本。新版本通常會加入更多的變量和數(shù)據(jù)源。每個新版本模型都以開發(fā)者的名字命名,從而紀念付出勞動與智慧的工程師。
ZestFinance模型中大部分信號都是通過機器學習找到的。例如,一個人在網(wǎng)上填表喜歡用大寫還是小寫就是一個信號。ZestFinance模型發(fā)現(xiàn),填表喜歡全部用大寫字母的人違約率更高。在月收入經(jīng)過驗證的情況下(ZestFinance有一些渠道可以大概獲知一個人的收入狀況),收入越高,違約率越低。然而,在月收入沒有經(jīng)過驗證的情況下,自己填寫月收入7500美元的人違約率是最低的,填寫7500美元以上則數(shù)字越大違約率就更高。
很多人將社交數(shù)據(jù)視為神器,但是ZestFinance不這么認為,主要還是采用結(jié)構(gòu)化和類結(jié)構(gòu)化的數(shù)據(jù),例如交易信息、法律記錄、租賃信息等,來源主要是從數(shù)據(jù)代理商處購買。
ZestFinance的先進之處并非數(shù)據(jù)來源,“我們有的數(shù)據(jù)銀行都有”,區(qū)別在于,銀行的人有數(shù)據(jù)卻不會用,就好比坐擁大量礦藏卻不會冶煉。相反,ZestFinance最大的優(yōu)勢就是“數(shù)據(jù)冶煉”,同樣的數(shù)據(jù)到了ZestFiance手中,就可以碰撞產(chǎn)生無數(shù)有價值的信號。
注:本文系數(shù)據(jù)觀專欄作者—鮑忠鐵原創(chuàng)稿件,轉(zhuǎn)載請注明來源
聯(lián)系客服