當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【勉强采用】反欺诈四大手段一秒get

發(fā)布時間：2025/3/21 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了【勉强采用】反欺诈四大手段一秒get 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

人們常說，有人的地方就有江湖。而我們要說，有江湖的地方就有欺詐。反欺詐由來已久，從最原始的人工檢測，到后來的黑白名單、規(guī)則引擎、有監(jiān)督學(xué)習(xí)算法，再到現(xiàn)如今的無監(jiān)督學(xué)習(xí)，演化至今，欺詐與反欺詐手法可謂變化多端，此消彼長。常言道，道高一尺，魔高一丈。這句話用在欺詐與反欺詐行業(yè)再合適不過了。在巨額利益的誘惑下，欺詐者不斷擴(kuò)充隊伍，升級技術(shù)，變化攻擊方式，給個人和企業(yè)帶來了巨大威脅。

在與欺詐分子斗爭的諸多年間，反欺詐不斷形成了自己的方法論。具體都有哪些方法？都適應(yīng)哪些場景？哪種方法更有效？且聽黃姐姐娓娓道來。

方法一：黑白名單

黑白名單是最原始的反欺詐手段，顧名思義，黑名單就是壞人，白名單則指好人。舉個🌰：人行征信記錄著每個信用卡持卡人的還款記錄，如果你有信用卡逾期且拒絕還款，甚至直接從人間蒸發(fā)，那么恭喜你，你可能就上了人行的黑名單。一段時間后，你重新在江湖上復(fù)出，想著：申請個新信用卡吧！銀行在接到你的申請表后，在黑名單上一查，發(fā)現(xiàn)了你，于是乎，駁回！這就是黑名單的使用方式。黑名單的應(yīng)用非常廣，且一份黑名單通常能賣到很高的價格，例如：你經(jīng)常在淘寶上購買退貨險，又屢屢退貨，那么，你就有可能上了騙保的黑名單，想再次購買退貨險就很難了。

方法二：規(guī)則引擎

黑名單的優(yōu)缺點十分明顯，優(yōu)點就是簡單方便，各行各業(yè)各產(chǎn)品的反欺詐都可以用黑名單，缺點就是無法發(fā)現(xiàn)新騙子。黑名單的升級版本是規(guī)則引擎，還是拿退貨險舉例。之前，保險公司拿著一個清單來比對哪些人可以購買退貨險，經(jīng)過一段時間的積累，保險公司發(fā)現(xiàn)，退貨比例超過80%的用戶極可能再次退貨，疑似騙保；或者連續(xù)退貨超過5次的用戶的騙保嫌疑也非常大。于是乎，保險公司設(shè)定了一個閾值，規(guī)則如下：

1. 連續(xù)退貨5次的用戶，拒絕其購買退貨險；

2. 退貨比例超過80%，拒絕其再次購買退貨險。

很明顯，只要符合這兩種規(guī)則的任何一個，就會被保險公司拒之門外。這相比于黑名單，可以檢測到新的欺詐者，算是進(jìn)了一大步。但是，規(guī)則引擎卻無法檢測到新的欺詐模式。假設(shè)，通過不斷的測試規(guī)則，我發(fā)現(xiàn)了這個閾值。于是乎，我準(zhǔn)確控制自己的退貨率在79%以下，便可以繼續(xù)自己的騙保生涯，躺著賺錢了。一段時間后，保險公司再次發(fā)現(xiàn)了我的伎倆，于是把閾值下調(diào)到50%。

規(guī)則引擎通常可配合黑名單一起使用，通過規(guī)則引擎抓到的壞人被列到黑名單中。

規(guī)則引擎的規(guī)則是如何生成的？答案是：經(jīng)驗！這聽起來有點不靠譜，萬一經(jīng)驗錯了怎么辦？事實上，的確會發(fā)生這樣的情況。例如，通過我們之前的經(jīng)驗判斷，認(rèn)為退貨比例超過80%的就是壞用戶。那么，假設(shè)我是一個網(wǎng)購新人，第一次買衣服，發(fā)現(xiàn)號碼小了，于是退貨。那么，我購買的第一單就退貨，退貨比例100%，能說我就是騙保的嗎？下次就不讓我買退貨險了？這顯然不符合邏輯！

正因為經(jīng)驗的不確定性，規(guī)則通常需要投入大量的精力維護(hù)，不斷更新、修改、刪除、添加等等，否則就會造成大量的FP和FN。

P(Positive)和N(Negative) 代表模型的判斷結(jié)果
T(True)和F(False) 評價模型的判斷結(jié)果是否正確
比如FP:模型的判斷是正例§,實際上這是錯誤的(F),連起來就是假正例
以此類推:
FP:假正例
FN:假負(fù)例
TP:真正例
TN:真負(fù)例

方法三：有監(jiān)督學(xué)習(xí)

有監(jiān)督學(xué)習(xí)是應(yīng)用最為廣泛的反欺詐方法。有監(jiān)督學(xué)習(xí)通常需要大量的有標(biāo)簽數(shù)據(jù)來訓(xùn)練模型，以此來預(yù)測還未被標(biāo)注的數(shù)據(jù)。拿垃圾郵件舉例，假設(shè)你把5000封已經(jīng)由人工確認(rèn)過的垃圾郵件輸入到了模型，告訴模型：hey，這些是垃圾郵件，幫我分析下！于是模型開始工作，通過對標(biāo)題的識別，對郵件內(nèi)容句子的分割，關(guān)鍵詞的識別等各種分析方法，找到了某種你沒辦法說得清楚的內(nèi)在關(guān)系。為了方便說明，我嘗試把這種關(guān)系抽象出來：

標(biāo)題里有“福利”二字的，有90%的可能性是垃圾郵件；

內(nèi)容里有“匯款賬號：xxxxxx”的，有10%的可能性是垃圾郵件；

一次性發(fā)送超過200封的，有60%的可能性是垃圾郵件；

回復(fù)率低于10%的賬戶，有70%的可能性是垃圾郵件；

這里，百分之多少稱為權(quán)重。

訓(xùn)練好后，你給模型一封新郵件，模型通過檢測以上各個子項，并對每一個子項乘以權(quán)重后相加，就得出一個分?jǐn)?shù)，例如，這封有80%的可能性是垃圾郵件。

以上就是一個有監(jiān)督學(xué)習(xí)的抽象過程，其中一個重要的步驟就是通過不斷的迭代計算每一個子項應(yīng)該被賦予的權(quán)重值。權(quán)重值計算好后，就可以說這個模型訓(xùn)練好了。

有監(jiān)督學(xué)習(xí)的好處也十分明顯，它可以幫我們分析隱層關(guān)系。我們可以不必知道到底有監(jiān)督是如何做分析的，每一個子項被賦予了多少權(quán)重，我們只需要知道符合某種規(guī)則的就是壞人。此外，有監(jiān)督還有助于處理多維數(shù)據(jù)。由于規(guī)則是人憑經(jīng)驗產(chǎn)生了，而如果老板丟給你一組數(shù)據(jù)，每一條數(shù)據(jù)都有多達(dá)500個字段，讓你憑肉眼看出其中的關(guān)系，你恐怕要抓狂了。此時，有監(jiān)督就可以解決你的問題了。

但有監(jiān)督也有一個明顯的弊端，每一個模型都需要大量的訓(xùn)練數(shù)據(jù)，訓(xùn)練一個模型也需要較長的時間。現(xiàn)在的騙子是何其聰明啊，到處打游擊戰(zhàn)。在你發(fā)現(xiàn)有入侵者后，你立馬開始訓(xùn)練模型，然而，再你還沒有訓(xùn)練好，騙子們可能就已經(jīng)離開，開始找下一個目標(biāo)了。如此，有監(jiān)督便無法應(yīng)對復(fù)雜多變，詭計多端的欺詐者了。

方法四：無監(jiān)督學(xué)習(xí)

近年來，無監(jiān)督為反欺詐打開了新大門，主要方式有聚類和圖形分析。無監(jiān)督無需任何訓(xùn)練數(shù)據(jù)和標(biāo)簽，通過發(fā)現(xiàn)用戶的共性行為，以及用戶和用戶的關(guān)系來檢測欺詐。下圖描述了聚類的方式：

有這樣一群用戶注冊事件，我們通過聚類發(fā)現(xiàn)其幾個小群符合某些共性：例如：注冊時間集中，都使用了某操作系統(tǒng)，某一個瀏覽器版本等。這個用戶任何一個單獨拿出來分析，看上去都是再好不過的用戶了，而如果其符合某種超乎尋常的一致性就十分可疑了。例如，你發(fā)現(xiàn)一群人在凌晨2點-3點，采用chrome瀏覽器注冊了某產(chǎn)品，其ip的前20位相同，GPS定位小于1公里，且注冊后都去修改了昵稱和性別。如果一個人這么做，你覺得正常啊，某個夜貓子隨便逛網(wǎng)站而已。而如果一群人這么做，你心里恐怕就要犯嘀咕了吧！

下圖描述了圖形分析的方式：

為了解釋分析邏輯，還是拿垃圾郵件舉例。一個正常的郵箱，往來信件比例不會相差特別離譜，中國有句古話“來而不往非禮也”！你收到人家的一封郵件，回復(fù)一下“well received”是起碼的禮儀。而我相信你基本上不會回復(fù)任何一個垃圾郵件或廣告郵件，而是直接刪除吧！通過回復(fù)率來判斷垃圾郵件也是一個常用的方式。

圖中，左下角是一個低端的攻擊者，只是單純地發(fā)送大量垃圾郵件，而郵件的回復(fù)率幾乎為0，對于這種郵箱，我們很容易判斷其為垃圾郵箱。右下角的群體就聰明多了，他們通過互相間的往來郵件來增加回復(fù)率，告訴反欺詐者：看，我有收到郵件哦！人家有回復(fù)我哦！你可不能抓我！這些郵箱通常互加好友，互通郵件，以此來偽裝成正常用戶。

通過無監(jiān)督學(xué)習(xí)，我們可以發(fā)現(xiàn)這種類型的偽裝者，將其一網(wǎng)打盡。

無監(jiān)督算法應(yīng)用于反欺詐檢測，通常還有一個優(yōu)勢，那就是提前預(yù)警。現(xiàn)在聰明的騙子都知道要潛伏一段時間再發(fā)起攻擊，以免太容易被發(fā)現(xiàn)。而由于其在潛伏期的行為依然符合某種規(guī)律，具有某些一致性，所以同樣還是會無監(jiān)督算法捕捉到。在攻擊發(fā)生前就指認(rèn)騙子，這一點，其他三種方法恐怕是望塵莫及！這也是無監(jiān)督之所以在反欺詐檢測大放光彩的重要原因之一。

可見，反欺詐手法無分優(yōu)劣，選擇適合自己的就是最好的！

如果你的欺詐問題非常多，不妨將所有方法綜合起來用，建立一個全棧式檢測平臺。

總結(jié)

以上是生活随笔為你收集整理的【勉强采用】反欺诈四大手段一秒get的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【不采用】人工智能如何帮助银行反欺诈
下一篇：老赖凭本事骗钱，你有本事不被骗吗？