风控系统场景分析
1. 背景
2. 數(shù)據(jù)獲取
2.1 數(shù)據(jù)庫從庫
2.2 數(shù)據(jù)同步
2.3 pingback
3. 規(guī)則
3.1 名單類
3.1.1 名單類型
3.1.2 名單類別
3.1.3 外部名單
3.2 規(guī)則引擎類
3.2.1 規(guī)則的實(shí)時性
3.2.2 規(guī)則的范圍
3.2.3 命中規(guī)則的后續(xù)處理
3.2.4 規(guī)則的條件
3.3 兩類規(guī)則對比
3.4 風(fēng)控顯示大屏以及告警
4 評分卡
4.1 評分卡的分類
4.2 評分卡的基本原理
5. 參考文章
6. 推薦閱讀
本文地址:https://www.cnblogs.com/hchengmx/p/15228092.html
1. 背景
風(fēng)控是一個非常大的概念,不同的領(lǐng)域?qū)︼L(fēng)控有不同的需求,像跟錢打交道的一些行業(yè),比如 電商、銀行、金融機(jī)構(gòu)對風(fēng)控的要求也就更多。
這篇文章就來簡單介紹一下,風(fēng)控包括什么,以及設(shè)計一個風(fēng)控系統(tǒng)過程中,需要考慮什么?
電商風(fēng)控:風(fēng)控在電商行業(yè)代表是 “反擼羊毛”、“刷單”、“爆單”,“被盜號” 等
銀行放貸風(fēng)控:貸前調(diào)查來判斷 還款能力以及還款意愿,貸中審查來判斷 逾期風(fēng)險,貸后管理來判斷 催收反應(yīng)等
銀行信用卡:虛假商戶騙積分、信用卡提現(xiàn)等
卡組織:反欺詐、反洗錢、盜刷等
2. 數(shù)據(jù)獲取
一般來說,風(fēng)控的非實(shí)時數(shù)據(jù)采集,不能直接從線上的數(shù)據(jù)庫中讀取,這會把數(shù)據(jù)庫打死。主要的數(shù)據(jù)采集方式有從庫采集,日志采集和pingback三種方式。
2.1 數(shù)據(jù)庫從庫
主流數(shù)據(jù)庫,如Hbase,Mysql都提供同步數(shù)據(jù)進(jìn)從庫的功能,幾個數(shù)據(jù)庫數(shù)據(jù)完全相同,主庫可以讀寫,從庫只讀,讀取從庫不會影響主庫操作。
2.2 數(shù)據(jù)同步
上游異步把數(shù)據(jù)送給風(fēng)控系統(tǒng),一種方式是通過上游系統(tǒng)主動送,比如說RocketMQ,上游完成數(shù)據(jù)采集后,把數(shù)據(jù)異步送給下游。
另外一種方式是通過日志采集,將風(fēng)控需要的數(shù)據(jù)輸出到日志中,風(fēng)控數(shù)據(jù)對對接日志異步進(jìn)行采集。
2.3 pingback
Pingback指在頁面上埋入腳本來監(jiān)測用戶的操作,特別是點(diǎn)擊操作和鍵盤操作,將檢測到的用戶行為異步發(fā)送到服務(wù)器端。這可以偵測到用戶在頁面停留時間,鼠標(biāo)點(diǎn)擊的區(qū)域等信息,由此可以推斷用戶偏好,情緒等信息。 pingback的挑戰(zhàn)在于如何在服務(wù)器端應(yīng)對流量洪峰。pingback數(shù)據(jù)一般不直接入庫,可以先寫入Kafka,風(fēng)控系統(tǒng)對接Kafka來分析pingback數(shù)據(jù)。
3. 規(guī)則
規(guī)則是用來判斷一筆交易、一筆訂單是不是違反了系統(tǒng)中的已有規(guī)則,規(guī)則我認(rèn)為可以分為兩大類,一類是名單類的規(guī)則,一個是規(guī)則引擎類的規(guī)則。
這兩類規(guī)則的特點(diǎn)不同,也就擁有不同的技術(shù)方案。
3.1 名單類
名單類來說相對比較簡單,一個名單通常情況下包括 “名單類型 + 名單類別 + 名單唯一鍵 + 生效/失效時間”。
所以名單類的規(guī)則也通常是 實(shí)時計算的。
3.1.1 名單類型
名單類型包括:黑白灰三種名單。
黑名單:必須阻止
白名單:必須放行
灰名單:不是直接阻止,而是延遲交易,需要人工確認(rèn)后再決定放行不放行
3.1.2 名單類別
注冊登錄:手機(jī)號黑名單
銀行實(shí)時交易系統(tǒng):商戶黑名單、終端黑名單
商城系統(tǒng):IP黑名單
3.1.3 外部名單
除了公司內(nèi)部維護(hù)名單,在還可以引入一些外部名單加入名單。
聯(lián)合國安理會發(fā)布的恐怖分子制裁名單1
全國法院失信被執(zhí)行人名單信息公布與查詢2
中國裁判文書網(wǎng)3。
3.2 規(guī)則引擎類
在設(shè)計規(guī)則引擎的時候,需要考慮以下幾個方面。
3.2.1 規(guī)則的實(shí)時性
業(yè)務(wù)方首先需要確定規(guī)則的實(shí)時性需求,實(shí)時處理當(dāng)然是最好的,但是實(shí)時處理就對于系統(tǒng)的性能要求極高。大多數(shù)風(fēng)控系統(tǒng)也不會采取大量的實(shí)時處理,就算實(shí)時處理,也通常采用比較簡單的規(guī)則,也有用準(zhǔn)實(shí)時處理 或者 非實(shí)時處理的,準(zhǔn)實(shí)時時效性沒有那么強(qiáng),可能幾分鐘或者幾小時再進(jìn)行處理。
實(shí)時性的系統(tǒng):聯(lián)機(jī)交易系統(tǒng),比如用戶A在凌晨給海外匯款,1個億的交易涉及到了反洗錢,要是不實(shí)時拒絕的話,這一個億可能就沒了。
準(zhǔn)實(shí)時處理:銀行貸款系統(tǒng),因?yàn)殂y行貸款系統(tǒng)并不需要說,立即給客戶反饋放不放款,但也不能太慢,就可以用準(zhǔn)實(shí)時處理。
3.2.2 規(guī)則的范圍
規(guī)則需要對于全網(wǎng)都生效嗎?還是只針對某些商戶類型、某些銀行卡、某個地區(qū)生效就行。
要是需要的話,在創(chuàng)建規(guī)則的時候,就需要添加一個屬性,范圍。
3.2.3 命中規(guī)則的后續(xù)處理
命中這個規(guī)則后,后續(xù)該執(zhí)行什么操作,有幾種選擇。
警告,拒絕掉這一筆交易,把這個賬戶加入黑名單。
3.2.4 規(guī)則的條件
且、或。
例子1:發(fā)生一筆消費(fèi),商戶類型為 大型超市 并且 (交易時間在 00:00 - 02:00 或者 22:00 - 23:59)
例子2:發(fā)生一筆交易,交易金額 > 10w元 并且 交易類型 != 消費(fèi)
這種規(guī)則就需要把報文中的某幾個字段取出來,再判斷是不是滿足規(guī)則條件。常見的操作符包括 等于=,不等于!=,大于 >,小于 <,在某幾個值中 in,不在某幾個值中 out。
累計
上面的幾個例子,都是靜態(tài)的數(shù)據(jù),但系統(tǒng)中可能還存在動態(tài)的數(shù)據(jù),某用戶當(dāng)月的消費(fèi)額,就要累計計算。
例子3:在銀行系的風(fēng)控中,統(tǒng)計一張卡在同一個終端下,連續(xù)交易的天數(shù),要是超過20天,就認(rèn)為是刷單。
例子4:在電商系統(tǒng)中,同一個賬號在同一個商戶下,過去30分鐘內(nèi),有超過5次購買記錄,就認(rèn)為是刷單。
例子5:電商系統(tǒng)中,某用戶當(dāng)月的無門檻優(yōu)惠券超過10張,就認(rèn)為是系統(tǒng)bug。
以例3為例,這種規(guī)則的需要分為兩步:1. 把累計值算出來,先統(tǒng)計連續(xù)交易的天數(shù) 2. 規(guī)則里面再配置,連續(xù)交易的天數(shù)是不是大于20,要是大于20,才算命中規(guī)則
數(shù)學(xué)表達(dá)式
在更復(fù)雜的一些風(fēng)控系統(tǒng)中,還會支持這樣的規(guī)則。涉及到了數(shù)學(xué)中的一些計算。
例子6:同一張卡在同一個商戶下當(dāng)月的消費(fèi)金額 占這張卡當(dāng)月所有消費(fèi)金額的 95%以上 并且 此張卡當(dāng)月消費(fèi)金額 > 10筆
例子7:統(tǒng)計某店鋪當(dāng)月的消費(fèi)筆數(shù) 和 它上個月的消費(fèi)筆數(shù),要是當(dāng)月的消費(fèi)筆數(shù) > 上月消費(fèi)筆數(shù)的10倍,就算命中規(guī)則
這就需要先把數(shù)值累計算出來,再來判斷數(shù)學(xué)表達(dá)式的值是真是假。
3.3 兩類規(guī)則對比
名單數(shù)據(jù)在使用上的特點(diǎn):
使用頻率高,實(shí)時性要求高。各種名單匹配基本都需要在線上做實(shí)時計算。
數(shù)據(jù)粒度小,總量大小不一,但存儲空間需求都不高。大部分名單都是一些號碼表,幾個G的空間都能存儲。
更新頻率低。名單數(shù)據(jù)一般都比較穩(wěn)定,按天更新
在使用中,名單數(shù)據(jù)一般直接存儲在內(nèi)存中,或者使用內(nèi)存數(shù)據(jù)庫(Redis,Couchbase)
而規(guī)則引擎的特點(diǎn)
配置靈活,要支持基本字段的 且、或、非
復(fù)雜一點(diǎn)的,還需要支持累計 以及數(shù)學(xué)表達(dá)式
在使用中,規(guī)則引擎類的,會使用drools、Jess、ILog。
3.4 風(fēng)控顯示大屏以及告警
對于實(shí)時風(fēng)控來說,時效性比較重要。經(jīng)常會出現(xiàn) 某半個小時內(nèi),某個規(guī)則被集中命中,需要人工介入進(jìn)行進(jìn)一步的處理的情況。
要是確認(rèn)該用戶有違法操作,就需要把該用戶加入黑名單,或者進(jìn)行限流等操作,要是該規(guī)則配置要問題,就需要對規(guī)則進(jìn)行及時下線的操作。
對于運(yùn)維人員就需要有一個風(fēng)控監(jiān)控大屏,來及時顯示什么規(guī)則被命中,統(tǒng)計某規(guī)則過去多長時間內(nèi)的命中次數(shù)。
業(yè)界常見采用的方法是通過,開發(fā)代碼中命中規(guī)則以后,打印日志,監(jiān)控平臺再通過異步分析日志把數(shù)據(jù)以圖表的方式顯示出來。
4 評分卡
評分卡多用于貸款機(jī)構(gòu),通過對客戶實(shí)行打分制,以期對客戶有一個優(yōu)質(zhì)與否的評判。這種的風(fēng)控跟規(guī)則類的風(fēng)控不一樣,一個人過來貸款,他可能之前沒有在機(jī)構(gòu)貸過款,沒有任何歷史記錄參考,那怎么來決定放不放款給TA呢?
4.1 評分卡的分類
A卡 申請評分卡(Application scorecard):用于貸前審批階段對借款申請人的量化評估
B卡 行為評分卡(Behavior scorecard):通過借款人的還款及交易行為,結(jié)合其他維度的數(shù)據(jù)預(yù)測借款人未來的還款能力和意愿
C卡 催收評分卡(Collection scorecard):當(dāng)借款人當(dāng)前還款狀態(tài)為逾期的情況下,預(yù)測未來這筆貸款變成壞賬的概率,由此衍生出 滾動率、還款率、失聯(lián)率等細(xì)分的模型。
4.2 評分卡的基本原理
評分卡的核心,我理解就是通過評分,來判斷出來 什么是 “好客戶”、什么是 “壞客戶”。
構(gòu)建評分模型
通過幾個渠道來構(gòu)建評分模型
本公司其他平臺,比如 臺賬系統(tǒng)、監(jiān)管系統(tǒng)、理財平臺等
人民銀行的征信系統(tǒng)
第三方合作機(jī)構(gòu)的系統(tǒng),比如其他商業(yè)銀行等
通過一系列建模,就得到類似于這樣的一張圖(建模細(xì)節(jié)和公式這篇文章不細(xì)講):
WOE(Weight of Evidence)叫做證據(jù)權(quán)重,IV(Information Value)叫做信息價值,是一組評估變量的預(yù)測能力的指標(biāo)。也就是說,當(dāng)我們想要拿出證據(jù)證明“年齡”這個變量對于違約概率是否有影響的時候,可以使用這個指標(biāo)評估年齡到底對違約概率的影響有多大。
下面表格展示的就是年齡、性別及婚姻狀況三個變量相關(guān)的好壞樣本數(shù)據(jù)以及計算出的對應(yīng)的WOE及IV值。WOE的計算公式是:ln[(違約/總違約)/(正常/總正常)]。比如對于年齡18~25的組別,WOE=In[(131/總違約樣本數(shù))/(1016/總正常樣本數(shù))]。根據(jù)WOE值,可以進(jìn)一步計算出IV值。
建模細(xì)節(jié)和公式這篇文章不細(xì)講了,具體可參考:
這一次,真正搞懂信用評分模型(上篇) - 知乎4
WOE信用評分卡--R語言實(shí)例_軍軍的專欄-CSDN博客5
打分
用戶的基本信息:學(xué)歷、年齡、婚否、是否有抵押物、年薪等進(jìn)行打分。最終看這個分?jǐn)?shù)在哪個區(qū)間,再來判斷 是否放款、放寬多少。
5. 參考文章
1. 聯(lián)合國安理會發(fā)布的恐怖分子制裁名單
2. 全國法院失信被執(zhí)行人名單信息公布與查詢
3. 中國裁判文書網(wǎng)
4. 這一次,真正搞懂信用評分模型(上篇)
5. WOE信用評分卡--R語言實(shí)例_軍軍的專欄-CSDN博客
6. 這一次,真正搞懂信用評分模型(之二) - 知乎
6. 推薦閱讀
如何看待拼多多出現(xiàn) 100 元無門檻優(yōu)惠券的漏洞?可能的技術(shù)原因是什么?羊毛黨行為是否具有法律風(fēng)險? - 半佛仙人的回答 - 知乎
評分卡都看不懂,怎么能說自己是做風(fēng)控的? | 人人都是產(chǎn)品經(jīng)理
支付風(fēng)控系統(tǒng)設(shè)計:支付風(fēng)控場景分析(一) | 人人都是產(chǎn)品經(jīng)理
總結(jié)
- 上一篇: 简单使用BurpSuite及请求包、响应
- 下一篇: 喘息性支气管炎能不能吃西兰花