风控策略框架简介
? ? ? ? 本文基于自己工作中對策略的理解、網上公開的一些資料以及與業內同行的交流討論,花了一點時間整理出這篇介紹風控策略框架的文章,文章內容如有不妥之處,歡迎與我討論。
目錄
一、策略框架
? ? ?1.1 策略框架簡介
二、策略分析
? ? ?2.1 策略制定
? ? ?2.2 策略調優
? ? ?2.3 AB測試
? ? ?2.4 策略下線
三、策略思維
四、總結
一、策略框架
? ? ? ?策略框架是一個比較大的概念,不同的公司也會有不同的搭建方法,這個涉及的情況比較復雜,比如和業務流程的設計、業務目標也有關。常見的審批策略框架應包含個人信息驗證、準入、欺詐、黑名單、信用風險、人工審核這些模塊。以某培訓機構課程中的流程架構為例:
? ? ? ?上面的策略流程是比較常見的一種,這里有幾個問題是值得思考的:
1.欺詐策略和信用策略的先后順序有什么區別?
2.策略之間串行和并行是怎么處理?
3.策略各節點順序設計的原因?
? ? ? ? 第一個問題,黃姐姐的一篇文章中提及過。"傳統銀行往往先過信用,再過反欺詐,理由是欺詐后需要人工核驗,而人工成本高,所以把這個過程后置。而互金公司更喜歡把反欺詐前置,他們的理由也很合理:我們希望進入到信用模型中的數據盡可能都是真實的,否則就會欺騙評分卡,產生錯誤的決策。其實,這取決于數據在系統中是如何流轉的。如果反欺詐和信用是串行的,且不做單獨授信決策,那么順序其實無所謂"。(也就是上面這種流程)。而對于信用可以單獨做授信決策的流程,比如:先經過簡單的黑名單篩查和硬規則篩查,然后過信用評分,對于信用評分判定為“優質”的用戶,立即授信放款。對于邊際用戶(說不清楚是好是壞),則過一下人工審核。在這種信用可以單獨決策的情況,把反欺詐前置就變得很有必要了。本人還有一點除此之外的理解,從成本的角度來看,命中欺詐策略的用戶會直接拒絕,從而就不會流轉到信用節點,因此也不會查征信和三方數據,也就節省了數據成本。
? ? ? ?第二個問題,除了上面說的策略集之間并行外(這種不常見),常見的是策略集之間串行,策略集內的各條策略并行。在上面的流程圖中即表現為,一個用戶如果被黑名單拒,就不會再流轉到信用的策略集;而這個用戶可能命中了黑名單策略集中的多條策略,只要有一條命中就拒絕。這里就會涉及到策略的拒絕率問題,每一條策略會有一個整體的拒絕率和單獨的拒絕率,這個下面分析時再提。
? ? ? ?第三個問題,策略流程設計時應遵循三個原則:1.無費用在前,有費用在后?2.強高風險在前,弱風險在后 3.盡可能留存信息。
? ? ? ?下面是《信貸業務風控策略簡介》這篇文章中提到的幾種框架:
? ? ? ??將成本低的借貸意向驗證放在成本高的團伙欺詐識別前面,達到節省成本的作用。結合人行拒絕規則、人行數據以及第三方數據建模,其優點是結合雙方數據優勢,模型效果會較好。但數據不穩定時,模型二次迭代工作量較大。
? ? ? ?相較于案例1,案例2較為保守,沒有將人行數據和三方數據結合起來做來模型,對于拒絕的用戶再次做人工審核,將符合的用戶再次撈起來。這樣做數據成本低,但是有人行客戶模型效果下降,誤殺率增加。
? ? ??同案例1的區別:將各個數據構建子模型,然后整合為一個綜合模型,如收入數據、支出數據建模。差異在于客群建模的差異,將不同的客群用戶分開做模型。這樣在評分二次迭代時,模型變量調整較少,主要調整各變量權重即可。但是在極端情況下,會出現某個評分變量不顯著的情況。? ?
? ? ? ?綜合上述三個案例,風控策略并不是完全依賴于成本,還要依賴于實際業務情況和業務目標。很多時候,風控流程是根據業務情況來進行的。
二、策略分析
? ? ? ?本文以第一部分中介紹的策略集之間串行、策略集內各策略并行的框架,簡要介紹下策略分析的整體流程和思路。
2.1 策略制定
? ? ? 本文只介紹策略分析的思路,不作具體的方法介紹。
? ? ? 首先,制定一條策略需要選定樣本,樣本選取時需要考慮兩個方面:
1.策略應用的場景。是貸前/貸中/貸后環節,對應的是哪一類客群(有/無征信、有/無房產等)。實際情況中客戶分群不一定要各群之間風險差異大,但是分群一定要穩定。
2.時間窗口的選取。策略樣本的選取和目標變量Y的選取有關。以當前時間2021年12月為例,如果Y選FPD1,那么樣本可以選9、10、11月份的進件;如果Y選mob5_M2+,那么樣本就需要選有5期表現的,5月、6月、7月。一般Y的選取會有FPD1、FPD15、FPD30、FSTQPD30、MOB5_30+等,選定Y之后再選取有表現的近3個月的數據。
? ? ? ?樣本選取時還有一點需要注意的,策略分析的過程中所選取的樣本需要與線上樣本盡可能一致。這個問題就和評分卡中的拒絕推斷一樣,制定策略時也需要對樣本進行回溯打標,先來看下面這個例子:
? ? ? ?10月和11月新上了兩條策略,12月制定新策略時,Y選取mob5_30+,需要用到6月、7月的樣本進行分析。而此時6-7月份的樣本和12月之后的線上樣本已經產生了差異,所以需要對6-7月的樣本進行回溯打標,如果其命中了10月和11月的兩條策略,就會從分析的樣本中剔除,這樣做的目的是為了保證策略分析用的樣本和上線后的樣本是一致的,否則策略制定和上線后會出現較大偏差。
? ? ? ?繼續深入思考這個問題,如果C001是用到的A數據源,現在準備對新接入的B數據源制定策略,但是A和B的重合度很高(或者說相關性很大)。如果做了策略回溯剔除的話,A數據源拒絕后的樣本在B數據源上的效果會被稀釋,而如果不做回溯剔除則在B數據源的效果就會虛高,但實際上線之后效果會完全不一樣。所以這也一定程度上避免了數據源重復度高導致的策略冗余的問題。
? ? ? 其次,選好樣本后,策略制定需要觀察一些指標,比如IV、Lift、PSI以及命中率、召回率等。策略制定可以分為以下幾步:
1.將所有可能做成策略的變量都挑出來,看下各分位點的lift情況。主要看分位兩端(0.1以下和0.9以上)的lift,一般如果有大于2的,把這些變量挑出來。假設這里從100個變量中挑出了50個變量。
? ? ? ?除了lift外,也可以看IV,挑IV大的先分析。但是IV受分箱影響較大,極端情況下會出現IV低但是單箱lift高的情況,也就是變量預測能力不強但是抓黑能力強。所以需要看下IV對應的分箱情況,判斷下各箱的壞樣本率是否單調以及分布情況,這里就基本可以確定Lift值的上限(是否有大于2的可能,根據實際業務情況來定)。如果有可能再對分箱進行手動調整,或者再窮舉lift情況。
2.看變量之間是否有相關性,也就是上面說的AB數據源的問題。有兩種方法:一是看各變量在真實樣本上的拒絕率,看單獨拒絕和組合拒絕,如果單獨拒絕率低說明這條策略可以被其它策略所替代。二是根據人工的一些經驗。比如有3個規則都是多頭類,分別的近3天、近15天、近30天,那么一般會留下lift大且時間窗口較長的。這一步從50個變量中挑出20個變量。
? ? ? ?然后會對這20個變量進行組合分析,跑下決策樹看下是否有較好的組合規則,一般用得也不會很多,組合變量一般兩兩組合,最多不超過3個。評分類變量為特殊變量,一般單獨作策略,兩兩之間的評分通過“畫格子”法來尋找最優決策。
3.看分月表現的穩定性和覆蓋率。覆蓋率至少要大于1%,穩定性是指lift表現要連續幾個月都保持2(數值需結合具體有業務)以上。還有一點,如果有一條規則lift高但不是很穩定,這種情況下可能會將規則與評分組合,因為規則可能在模型的低分段穩定,這種方法是用評分來加強規則的穩定性。一般用不太著,慎用。
? ? ? ?然后,是策略上線后效果的測算,對通過率、壞賬的改善程度。是在通過率不變的情況下壓降了壞賬還是在壞賬可控的情況下提升了通過率。一般公司會有一個較為確定的風險容忍度,策略上線后的樣本的風險指標應在這個風險容忍度之下,留一點空間。
? ? ? ?最后,策略制定完成之后需要線上空跑一段時間,對上線后的策略,在一定時間內對于有表現的數據進行策略回顧,看策略調整后的進件量、通過率及貸后表現。若是想及時的查看策略上線后的貸后表現可以針對FPD指標分不同的天數去觀測,FPD4,FPD10,FPD30等。最后如果策略實際有效再進行全量切換。??
2.2 策略調優
? ? ? ?策略調優分為A類調優和D類調優。A類調優就是在拒絕用戶中找好用戶,提高通過率;D類調優在通過用戶中找差客戶拒絕,降逾期率。策略調優首先要確定的一個問題是哪些策略可以進行調整。像多頭類、信用評分類屬于可以調整的策略,政策準入類、黑名單類等強規則屬于不可調整的策略。其次是查看規則的命中情況,從上到下依次分析,優先調整命中率高的規則。然后是觀察策略對應的特征分布,評估表現。
? ? ? ?D類調優以收緊策略為目的,通過分析命中策略情況下各分段的壞賬的濃度占比情況進行收緊。比如對一條策略是近7天多頭數>6拒絕,對這條策略進行收緊,需要分析近7天多頭數在6、5...分段的壞賬濃度是否大于總體的3倍,是否具有排序性且分月表現穩定,如果符合上述特征則可以進行收緊,評估對通過率和壞賬的表現,上線后及時進行監控。
? ? ? ?A類調優以放松策略為目的,通過在決策引擎標記豁免部分樣本并進行分析。還是以近7天多頭數>6這條策略為例,現在需要對這條策略進行放松,那么需要知道近7天多頭數為7、8...時的壞賬濃度,如果壞賬不高且分月表現穩定,則可以放開。這里有一點需要注意,打上豁免標簽的樣本在整個風控流程中都不會拒絕,即使命中了其它策略標簽也需要通過。比如一個樣本近7天多頭數為8,豁免,在下一決策節點又命中最大逾期天數>90天的策略,這種情況下依然不能進行拒絕,否則會造成豁免樣本的表現失真。
2.3 AB測試
? ? ? ?AB測試是驗證策略有效性的重要步驟。在策略調優的環節需要通過AB測試來逐步進行策略調整。下面是《金融風控-策略部署邏輯》文章中介紹AB測試的一些內容:
? ? ?AB測試包含兩個方面,一個是整套策略模型的挑戰者方案,一個是針對單條策略的實驗。
-
整套挑戰者方案,區別于正常策略的一整套策略模型集,一般挑戰者的策略模型集相對于正常策略模型集要激進一些,目的是為了進行更加寬松政策的嘗試和實驗;
-
針對單條策略的實驗,由于不同階段公司目標政策導向不同且用戶的一些屬性也會發生一些變化,因此單條策略的閾值存在需要調整的情況,調整時,就需要進行一些灰度測試隨機放過原本拒絕的一些用戶。
2.3.1 D類調優的AB測試
? ? ? ?上圖中信用策略集A中都是多頭策略。A03是近7天多頭數,現在想用近3天多頭數A04對A03進行替換(一般不會直接替換),A05是新加的近1天多頭策略。以6:2:2(需要測算)的比例進行分流,再觀察各自的拒絕率和風險表現,對表現較好的實驗組再逐步調大比例,最終直至100%替換。至于上面AB測試的比例,需要評估測試組壞賬風險上升多少,由此帶來的大盤風險上升多少,以及大盤上升的百分比對應了多少的量來進行測算。
? ? ? ?有一點需要注意,在策略節點串行、策略集內部并行的情況下,A01、A02、A03會出現交叉拒絕的情況,即一個樣本同時命中3條多頭策略。比如A01拒絕10%,A02拒絕10%,A03拒絕10%,整個信用策略集A拒絕15%,說明規則之間存在交叉拒絕的情況。分析拒絕率時需要分析A01、A02、A03的單獨拒絕率,對單獨拒絕率較低的規則應進行下線,以減少規則冗余(后面會提)。
2.3.2 A類調優的AB測試
? ? ? A類調優時的AB測試,即對豁免后的規則進行小規模線上測試(如上圖)。假設有一種極端情況,多頭數在7和8之間的樣本真實風險表現不高,但是這部分豁免的樣本在黑名單和反欺詐策略節點中被全部拒絕,導致對照組B放松的效果不明顯。所以豁免的樣本應不僅針對此條規則,應是全流程的豁免。實際情況中一般策略集豁免的樣本與其它節點無關,可能會被其它節點拒絕。全流程的豁免用的是另外一種方法,對極小部分(例如1%)的樣本進行盲測,即正常跑所有風控策略,不進行拒絕,作為所有規則的AB測試(這部分樣本在決策引擎中不調取任何拒絕函數)。
? ? ? ?如果需要放松策略,一條條進行豁免分析的話,需要針對每條規則進行豁免對照,工作量較大。因此一般在策略初上線時即可留一條口子以便后續調整。比如要上線一條近7天多頭數>6的策略,會留出一小部分樣本不作拒絕,以觀察近7天多頭數在7-8時的風險表現。還有一種設置AB測試的方法:
? ? ? 上圖中對樣本和策略都分成了嚴、中、松三級,通過控制樣本的比例來控制對照組的比例。比如近7天多頭數>6這條策略,如果設置為"松",則有20%的樣本會豁免;如果設置為"中",則有10%的樣本會豁免;如果設置為"嚴"則不會有樣本豁免。這種框架下可以將需要進行豁免觀察的規則都放入"中"或者"松"的規則集中,定期對豁免的樣本進行分析以進行策略調整。
2.4 策略下線
? ? ? ?通過策略規則的組合可以實現精細化的風險管理,就會不斷地增加策略規則,最終導致策略規則的復雜和冗余。因此,策略的優化、下線可以在保證通過率地穩定不斷降低壞賬率。先還是以上面策略制定中的圖為例:
? ? ? ?在策略制定的過程中,首先需要對已有策略做回溯剔除,保證線上樣本與分析樣本的一致性,如上圖分析制定了一條近15天多頭>10的策略,假設lift為3。但實際情況是分析樣本已經被前面的兩條策略切過一刀,真實情況這條策略命中的lift會更高。如果這條策略命中的樣本全部包含了前面兩條策略且三條策略并行,那上線后前面兩條策略的效果就會被稀釋,單獨的拒絕率會降低。因此可以再進行一次回溯:剔除近15天多頭>10拒絕的樣本后,前面兩條策略的濃度情況。但是這個工作量比較大,因為線上的策略可能會有很多,所以這類分析會放在策略的日常維護中。如果某條策略的單拒、濃度降低較多則可以對該策略進行下線。整體的思路就是剔除AB策略分析制定出C策略,再分析C策略上線對AB有什么影響。
三、策略思維
? ? ? 都說策略是風控食物鏈的頂層,這一點我雖然并不完全贊成,但是這也說明做策略需要一個更宏觀的視角、更高的層次去思考業務。一套完整的風控策略,不應該只關注通過率、不良率、回款率這些風控層面指標,還應該關注市容量、行業趨勢、市場轉化率、競爭優勢等,這也是策略的精髓所在。策略思維這個東西說起來比較飄忽,我大概舉幾個實際工作中可能會有的例子:
1.受國家政策影響,今年房地產、教培行業大幅度裁員。那如果業務中有職業在兩個行業的人員,則需要觀察其逾期表現,對這類群體適當收緊策略。
2.受疫情及宏觀經濟影響,市場資金緊張,金融機構普遍縮減放貸規模。此時那些以貸養貸的人群可能會因不再能輕易借到錢而產生逾期。因此策略人員應適當收緊風控策略,以控制風險敞口。
四、參考文章
? ? ? 本文主要闡述風控策略分析的思路和方法,沉淀一下分析框架,并沒有涉及具體的實操方法。感謝幾位小伙伴對此文提出的一些參考建議。實際工作中策略分析會更為復雜,文中仍有理解不到位之處,在此拋磚引玉。網上介紹策略制定的文章并不多,在此整理一些本人覺得值得一讀的文章:
1.8萬字歸納風控策略的所有知識點
https://zhuanlan.zhihu.com/p/126499574
模型視角下的風控策略規則發現
https://zhuanlan.zhihu.com/p/141287611
風控體系——策略篇
https://zhuanlan.zhihu.com/p/363545025
金融風控-策略部署邏輯
實操長文|評估風控策略效果(全)
https://zhuanlan.zhihu.com/p/410022072
總結