漫谈风控指标
原標題:萬象薦讀 | 漫談風控指標(全文)
序言:
現在消費金融、現金貸發展的非常迅猛,幾乎滲透于任何場景。最近一兩年以來,國家對P2P的政策管制和對校園貸款、現金貸的政策越來越嚴格,筆者作為消費類金融從業者,需要學習的知識更多。
目前市面上系統講解風控的不多,筆者寫本文主要目的希望以以運營和風控人員的視角來看待各項風控指標,從各個數據現象中分析、發現、挖掘隱藏在數據背后的內容。
當下國外的數據類風控非常的完善,但是中國還是有自己的特色的,畢竟這是一個有著五千年歷史文明的、現代化的、中國特色的、社會主義國家。以某數據驅動為理念的國外先進思想作為方法論是非常值得我們學習,但落地實施方面還需要完成本土化方可執行。
本文閱讀對象
風控從業人員、CRO、CEO或相關高級管理人員、風控管理興趣愛好者
目錄
1 風險產生的原因 3
2 風險管理的模塊 3
3 量化風險 4
3.1 指標介紹 4
3.1.1 逾期率指標 7
3.1.2 遷徙率指標 8
3.1.3 賬齡分析指標Vintage圖 9
3.1.4 不良率指標 11
3.1.5 凈損失率NCL指標 13
3.1.6 遞延率指標 13
3.1.7 疑似欺詐率與欺詐、首逾指類標 13
3.1.8 進件類相關指標 14
3.1.9 風險系數指標 14
3.2 指標的選擇 15
3.3 維度介紹 16
3.3.1 產品維度 16
3.3.2 客戶維度 16
3.3.3 信用維度 17
3.3.4 行為維度 17
3.3.5 其他的數據維度 17
3.3.6 設備信息維度 17
3.3.7 用戶畫像實例 18
4 風險數據應用 18
4.1 信審類 19
4.2 決策類 19
4.3 疑似欺詐類 20
5 風險數據預測 20
1 風險產生的原因
無論是銀行業、P2P或者消費金融場景下的任何一種有直接與間接的借貸關系都會產生風險,廣義風險不僅包含貸款人違約、也包含借貸機構或參與者的自身運營風險、以及政策、環境等各個不可控因素。在排除了政策、環境、機構等因素后,俠義的風險僅為貸款人不還錢導致的。借款不還錢的因素多種多樣,或許是無能為力,或許是就不想還。為確保借款人可以還款,應采用必要的風控手段,例如在貸前進行篩查,以確保貸款人的還款能力,對于還款能力的甄別這里不再贅述。讀者可以通過網絡或者任何形式的課程加以學習。
2 風險管理的模塊
風險管理主要分為四大部分:風險識別、風險分析、風險監控、風險應對。
舉個栗子:通過2345貸款王的各種年報季報來看,現金貸的盈利性已經不僅僅是用暴利來形容,現金貸半年的時間走完了P2P三年的時間,成立一條現金貸需要做大致如下5步驟:
1、規劃一個預計客戶人群;2、建立一套屬于自己的系統;3、做好風控篩選(粗粒度即可。有人說現金貸可以沒有風控,如果只想賺一把就跑,風控就不重要。);4、保證有資金可以穩定供給;5、做好運營管理和模式轉型;
以風險四個部分來說,首先要需要預先風險識別。20歲在富士康工作的和20歲在校園學習的風險完全不一樣(高利貸禁止進入校園)。其次,在上線前要提前根據客群進行粗粒度篩選,比如黑名單、反欺詐、設備反欺詐等,再次上線后要實時進行監控、分析相關進件、拒絕、逾期等數據以防止策略被黑產、羊毛和別有用心的人所利用而產生壞賬。最后重要一點就是需要對自己的模式和風險進行預判與監控,事實做到心中有數。推薦采用PDCA質量管理方法論來指導風控操作。
其他的場景,例如消費類金融大體思路也是如此,這里就不再贅述。
3 量化風險
3.1 指標介紹
以銀行為例,目前銀行對風險進行量化已經有比較成熟的體系,作為消費金融風控類模式也大致相似,對于實操細節需要根據不同的場景和形式而進行區別對待。
下面會根據不同階段講解一下筆者認為較為重要的和常見的指標項目,對于其他指標線就不多一一列舉,有機會再與大家分享。
常見貸款通用流程:
申請à審批à簽訂合同à放款à貸后管理à催收à資產處置。
以主要的前五項流程為例,每一項都會落地相關的指標和數據。大致分類如下圖所示。
根據筆者的經驗和相關知識案例,整理了一張列表提供給大家參考。
一些指標有明確的定義,如放款筆數、放款賬戶數等。有一些指標的定義并不明確,廣為人知的就是逾期率的定義,由于不同的公司對逾期率的口徑不一致,會導致其反應的真實意義也不一致。還有一些指標本身就有多種定義,如延滯率,其本身就有即期和遞延兩種口徑,所反映的意義也不一樣。
備注:指標統一口徑僅作為參考,需要根據實際而確定,舉例的口徑僅通過部分企業的實際應用而得,不一定具有全局實用性和統一性。,請讀者悉知。
在重點講解幾個重要的指標之前,我們先給出幾個業內常用的定義:
逾期天數:自約定還款日起的未還款天數。 一般表示逾期D ,D1 表示逾期天1,D1+,表示逾期天數大于等于1;默認+表示大于等于。
逾期期數:以分期類為例,M1 表示逾期1期 M1+表示逾期大于等于1期;
逾期階段:一般以逾期的程度進行劃分或者以逾期的嚴重度劃分。一般M1 或1-20認為比較前期或者輕,每家情況不同劃分等級也不同。通常我建議采用P等級對逾期等級劃分,例如P1-P10等級,方便采用策略進行逾期催收。
期初、期末均指按照賬單日的起始日或結束日或者自然周、月、季、年份等的起始進行劃分。
件數、金額均值進件數理和進件金額;日均進件量表示按照某特定周期進行的日進件量的平均算法。件均金額表示某特定范圍內平均每進件金額數。一般統計都會按照進件量和金額兩個維度統計。例如,逾期中提到的M1 表示逾期1期,那么可以細分為,逾期件數和逾期金額,月均逾期件數,月均逾期金額等指標。
等等其他指標不一一講述。
3.1.1. 逾期率指標
逾期指標是最常見的指標,任何的放款模式或場景都會用到該指標。所以用比較多的內容來描述一下。
定義一:逾期貸款剩余本金(逾期貸款剩余本息)/總剩余本金(總剩余本息)
定義二:M3+剩余本金/(同賬齡的所有貸款的合同金額)
定義三:M3+剩余本息/(同賬齡的所有貸款的合同金額)
部分公司的逾期率會選用定義一或二,因為這樣隨著新貸款的發放,總的剩余本金或剩余本息在增加,分母變大會讓逾期率顯的比較小。而一般公認的逾期率為定義二或定義三。這樣能較為公正的反映當前的資產情況。某上市P2P公司的財報用的就是定義三。
另外,常用的逾期率中含有兩類,即期和延滯。
定義:各逾期段的應收金額(逾期金額)/應收金額
分子很好理解,分母則有如下兩種定義
l 即期(coincidental),分母為當期金額,如當期應收賬款。其概念為分析當期應收賬款的質量結構
l 遞延(lagged),分母為之前的金額,如之前月份的應收賬款。其概念為可以較為合理的反映數據狀態
通過下圖可以說明兩種口徑下的指標所能反應的問題。
圖3-1
由圖3-1數據我們發現,在平臺平穩發展期兩個指標差距不大;在平臺進入擴充期,隨著業務量的增加即期相對穩定,延滯明顯的回落,在業務頂峰期間延滯指標是非常低的;當平臺進入了飽和期后隨著進件量的下降,即期指標依然相對平穩,但是延滯指標缺產生巨大的波動,。因此即期和延滯指標應在不同的階段分別對待。不同的階段也應采取不同的催收手段來降低相關逾期率及后續的應對策略。例如重點增加業務量較多月份產生的逾期。具體相關內容不在贅述,請讀者根據自己實際情況而定。
3.1.2. 遷徙率指標
通俗的遷徙率定義為:某一貸款的狀態變為另一種狀態的一種變化過程(筆者個人的理解定義,非官方定義)。舉例如下:
圖3-2
其中0-M1 表示當期內有非逾期變成逾期1期的占比數M1-M2 以此類推。一般來說,考核逾期催收采用遷徙率也是一種方式。
3.1.3. 賬齡分析指標Vintage圖
賬齡分析指標從字面意思容易理解,但是用的最多的還是Vintage(溫忒直)圖,其主要目的就是展現各個賬齡在某個時間節點的數據分布的關系,
如下圖所示。
圖3-3
該圖展示的就是以M1-M6的一季度到四季度的逾期數據展示,采用V圖。也可以使用堆積圖直方圖進行展示
圖3-4
每一個圖形顯示的內容不同,以圖3-3為例,顯示的是四個季度的逾期變化走勢,方便制訂逾期催收策略、為逾期原因提供數據支持等,圖3-4是方便發現逾期總占比,接近階段性逾期問題等。
一般來說V圖多采用周和月,對于較短數據,推薦使用周為單位。普通的建議以月為單位。
3.1.4. 不良率指標
不良率最主要是先定義什么時壞賬,不同的公司定義不良有很大差距的,例如現金貸大多將M3+或者M1+就算賬為不良(PDL借款周期短 7 、14、30天居多,所以不良定義),而一般的消費類或分期多以M6+為不良,在我的印象中某銀行的不良是Y3+(3年以上不還款)。
首先:
定義: M3+(含M4)客戶逾期金額在總放款金額中的比例
計算公式: M3+(含)客戶剩余本息÷[(3個月前的放款總合同金額+總利息)-(3個月前放款客戶已結清的合同金額+利息]
簡單一點:剩余本息÷(X前期 (應收總金額-已收中金額)
或者 剩余本金÷(X前( 應收-已收))
另外一種計算:剩余本金÷(當期應收-當期已收)
另外還有一種:剩余本金÷當前應收
舉例說明(以下數據皆來自與仿造):
那么:總體不良率=5000/18000=2.78%;
1月份不良率如何計算?有幾種算法我粗糙的列舉一下
A:833/20000=4.615% B: 833/(20000+20000)=2.083%
A與B分母是不同的。一個上月放款金額,一個是當前合計放款金額。一般對外多用B類算法,有的會對內績效考慮采用A類算法。AB的不良算法其實就是一個延滯和即期的算法概念。
從純風控角度來說,我推薦使用延滯算法計算不良率。這也是因為算法的不同,導致當前市面上報表不良的算法不同,例如某著名文章算出的某信托計劃逾期數據大相徑庭。
3.1.5. 凈損失率NCL指標
定義:(成為壞賬的金額減去回收的金額)/轉壞賬前應收。
一般凈損失率也有一些會計上的計算方法,這里就不舉例了,凈損失率最主要目的是計算表內凈損失的指標。
凈損失率與回收率正好相反。一個是針對于呆壞賬之后的損失情況一個是呆壞賬的回收情況,兩者加起來和值等于1;
3.1.6. 遞延率指標
為催收單位最常使用的績效指標,其目的為觀察前期逾期金額經過催收之后,仍未繳款而于次期繼續落入下一bucket的幾率。
3.1.7. 疑似欺詐率與欺詐、首逾指類標
疑似欺詐率指標針對于自身進件數據以及逾期、壞賬數據而進行分析的一種內部反欺詐分析常用指標。該指標也可以配合風控內部反欺詐策略,對數據進行集中分析后執行相關的反欺詐策略。另外一點需要指出的是,這個數據不僅僅可以用在客戶方面,也可以用在內部客戶經理統計績效方面。這個指標也可以作為發現或內外勾結的一種簡單參考,具體的內容還需要根據自身實際情況處理,這里不再贅述。
定義:賬齡mob處于某個階段期間,某月末還款期數較少。例如MOB是3到9直接的,截至當月末還款期數少于3期。
計算公式: (MOB處于N1-N2之間,T月末未還款期數未超過x期的剩余本金)除以(MOB處于N1-N2之間,T月末的中剩余本金)
內部反欺詐也有一類欺詐指標,定義:自放款月后,連續三期未還。這樣的客戶初步確定為欺詐類客戶,需要及時根據后續風控手段,例如停止進件、增加追償等。特別是在教育分期中X+Y模式,X期前期還款較少甚至機構代還的現象出現,很容易掩蓋欺詐行為。
還有一類指標首期逾期指標。定義:放貸后首期還款日未還款,產生首次逾期。此類指標需要對客戶進行判斷,以區分是否是欺詐類客戶。另外,不僅僅是首期逾期的,前兩期,首三期都是重點對象,適當時候需要提前啟動資產保全相關手段。
本文暫不提供數據舉例。
3.1.8. 進件類相關指標
比如一些進件核準率、通過率、反欺詐黑名單命中率、拒絕率等一些進件相關的指標。對于此類指標我個人觀點,需要根據業務的發展規模與實際情況而定,比如新產品或新公司成立階段,需要大力發展,在資金規模較小的情況下在可以接受的虧損范圍內可以適當的提高通過率或降低相關命中率或拒絕率,以適應業務快速發展并沉淀內部風控數據為主。當業務發展到一定規模后,需要謹慎處理進件類相關指標,嚴格控通過率、黑名單和白名單相關數據。
以國內著名某信為例,剛登錄國內的時候屬于無差別放款,通過率非常高。經過燒錢后建立了授信模型之后開始大規模的實行風控手段,短時間內做到了百億規模,這個與前期的小額試錯戰略有著非常重要的關系。
3.1.9. 風險系數指標
風險系數各家都有不同的定義,我個人觀點以流動性、損失率、成長率這主要三個維度來考慮。在保證流動性的前提下,挖護城河建城墻是首要任務,城墻越高未來損失越小,護城河越深成長率越高。
3.2. 指標的選擇
每一件事情的發生都有其前因后果,分析事情切忌從單方面切入。否則就是瞎子摸象,容易使決策發生錯誤。選擇指標時關注如下重點,以厘清不同指標之間的關聯,為報表使用者提供完整可靠的分析。
l 相對性
即事件的一體兩面,若僅以一個指標驟下判斷是非常危險的,例如核準率的上升相對地有可能會帶動延滯率的提高。這兩個指標代表業務的增長和風險的增長,兩個對應指標應同時并列于報表中以供使用者權衡利弊。
l 比較性
實際值和預設值的比較。
l 互補性
某些指標若單獨呈現,解釋力過于薄弱,必須采用互補性質的指標進行補強。這種互補性常見于比率和絕對數字之間。
l 多面性
有時候單一指標所呈現的訊息,再以另一方面切入會產生完全不同的解釋。例如某一產品核準率持續上升,在審核流程無重大變動情況下,表明進件質量良好。但若觀察金額核準率指標后可能出現相反的走勢,客戶申請金額和核準金額存在明顯差異,也就是說進件質量實際上并不如件數核準率所顯示的那么樂觀。
l 順序性
有些指標有前后關系,若要清楚掌握整個事件的始末,就必須對這些指標做一系列的觀察。比如進件量、核準量和放款量,這三個指標依序發生,彼此環環相扣,任一環節出現異常皆會影響最終結果。
l 層次性
指標中的層次關系。
l 落差性
時間上的落差,一個指標數據出現后,另一個指標需要經過一段時間才會有所體現。因此需要同時列出觀察期及反應期的數據,以便報表使用者解讀。如核準后逾期的出現一般需要三到六個月的發酵時間。
3.3. 維度介紹
維度一詞來源于數據集市和數據倉庫的維度建模概念,維度建模以分析決策的需求出發構建模型,構建的數據模型為分析需求服務,因此它重點解決用戶如何更快速完成分析需求,同時還有較好的大規模復雜查詢的響應性能,著名的有雪花模型和星型模型。這里不多做專業知識介紹,有興趣的朋友可以學習相關數據倉庫、數據集市及數據挖掘的相關內容。多年前看過一本《大嘴巴漫談數據挖掘》這本書入門不錯,有興趣的朋友可以自學。
3.3.1. 產品維度
產品維度包括各類產品的屬性,例如產品種類、期限、期數、類型、額度、等相關產品屬性。以貸款類業務為例最主要的貸款六要素(借款人、貸款金額、利率和費率、期限、用途、類型)。
順便吐槽一下:對于教育類分期產品中有一個奇葩設計就是X+Y模式,X期先還利息,Y期后還本息。產品類型來說,此設計無可厚非,屬于適應市場需求,問題是,X利息非常少,從風控的角度來說時間越長回收和損失潛在概率越大。為了燒錢,使勁燒錢占領市場無可厚非,但是有哪家依然敢這么做。。只能說明金主有錢!任性!
3.3.2. 客戶維度
客戶的維度包含很多中,例如身份特征、自然人或者法人或者其他類型身份,性別、年齡、區域、學歷、收入、行業等都很關系,特別是要針對客戶的逾期、壞賬分布來挖掘一些事情。
例如多年前上海的各個以后禁止向福建某區域貸款,這就是一個以客戶維度出發做的數據匯總。另外去年鬧得沸沸揚揚的女大學生裸貸,我相信除了一部分別有用心的人的別有用心的目的,另外一部分也是應該基于女大學還款的情況而定的,至少我在2015年做大學生市場的時候,的的確確的數據表明女大學生幾乎沒有逾期和壞賬的發生,而基于這一數據分析結果專門針對此群體設計了五分鐘極速放貸產品。除此之外,通過數據也發現有著較高學歷和較多社交圈的客戶逾期與壞賬也明顯較少。這樣就可以針對某區域某行業某類型的客戶進行快速放貸或提高授信。
客戶特征類型嚴重影響這一個產品和一個企業的發展。相信很多做資產的朋友有深刻體會。
3.3.3. 信用維度
信用維度這個概念比較大,比如人行征信、芝麻分以及各種各樣的信用分,具體的應用還需要看場景和客戶群表現而定,如果單純的就認為芝麻分700+以上的都是好人而且請用的擴大授信額度,是需要三思的。
3.3.4. 行為維度
一般來說行為多以客戶內部行為為主,因筆者學識淺薄,無能力談論行為維度相關內容。
3.3.5. 其他的數據維度
其他的可以通過內部,外部獲得一些數據,這些數據維度可以通過大數據的方法來進行處理。不過對于弱項的影響力還需要進行科學的驗證方可。
3.3.6. 設備信息維度
在互聯網金融中,因為可以通過移動設備來申請貸款,所以較傳統銀行業,我們多了一個設備信息這方面的維度,主要包括如下幾個大類,各大類又可以進行細化
1)申請行為類:在移動設備上各環節填寫時間、閱讀條款時間、申請時間等。
2)數據識別類:移動設備位置信息、安裝應用信息、手機型號、App版本信息等。
3)社會關系類:通過分析移動設備中的聯系人,得到其社會關系信息。
3.3.7. 用戶畫像實例
通過一下圖片,給大家展示一下我們做的一點點客戶畫像的demo實例。
4 風險數據應用
在進行任何數據分析時,大多分析包含在如下四大類中:分布、變化、對比、預測。進行任何分析前都要先進行問題界定。問題輪廓越清晰,分析方向越明確,
越容易切中要害。下面通過幾張風控IT系統化建設demo截圖給大家展示一下相關內容,具體細節內容不再贅述。
4.1. 信審類
4.2. 決策類
?
4.3. 疑似欺詐類
5 風險數據預測
預測分析法分為定性法及定量法,前者較偏向主觀經驗判斷,后者則側重客觀的計量方式。兩者經常搭配使用??梢圆捎?#xff1a;關聯推測法;定性的推測法;; 移動平均法;指數平滑法;線性回歸法; 對數趨勢法等多種預測方法。這里就不再贅述,有興趣的朋友可以參考統計學中預測相關內容。
內容待續。
總結
- 上一篇: 基于迁移学习的反欺诈方法研究
- 下一篇: 星型模型和雪花型模型比较