反欺诈之地址的处理和使用
反欺詐之地址的處理和使用(一)
信用卡申請需要填寫家庭地址、卡寄地址、公司地址;電商購物需要填寫收貨地址;外賣訂單需要填寫訂單地址;保險理賠會有出險地址;第三方支付會有消費地址……因互聯網和O2O的快速發展和廣泛普及,使得地址信息成為了一種普遍的采集字段。但目前風控領域對地址的使用大都比較淺顯,甚至有的信貸公司和銀行僅在催收時才會使用地址信息,但實際上,地址所包含的信息十分有價值,被諸多公司如此冷落也著實可惜。以下,黃姐姐就結合相關文獻和項目經驗,來系統性地梳理一下地址信息的處理和使用方法。
#地址的種類#
· 家庭地址:通常為用戶的住宅地址,可能是自有住房,也可能是租用住房;
· 公司地址:通常為用戶的工作地址,例如xxx大廈,xxx園區;
· 戶籍地址:戶口本/身份證上的地址。特別地,某些人可能持有集體戶口,例如大學生;
· 收貨地址/訂單地址:點外賣,網購時,要求送貨員/快遞員送貨的地址。大部分為家庭地址和公司地址,也有可能是他人地址(送禮物給他人)和酒店地址(出差)
· 定位地址:通過GPS或其他技術手段定位發生動作時的地址。
· 卡寄地址:辦理信用卡時郵寄卡片的接收地址;
· 出險地址:車禍發生的地址。
#地址的獲取方式#
· 用戶主動填寫;
· 平臺通過技術手段主動獲取(包含第三方提供);
可以想象,后者可信度更高,但也不排除有GPS模擬器、IP模擬器等干擾。例如,當壞人知道一個城市的地址比一個農村的地址可以獲得更高的信用卡額度;或者一個高房價小區的IP可以獲得更高的貸款額度,他們就會利用模擬器去模擬這樣的條件。
#利用地址進行欺詐的常用手法#
· 真實地址:為了能夠申請到大額信用卡,或者申請到貸款,一些用戶找中介為其包裝信息。采用的方式是網上尋找某個公司的地址,電話則留中介公司的電話,以應付電話審核員的電話驗真。這種方式,中介通常喜歡瞄準那些新開的公司,由于其網絡信息很少,大多沒有公司主頁,所以審核員很難對其公司真實情況進行驗證。為了更加逼真,用戶所填寫的公司地址也按照其營業執照(工信部網站可查)填寫。黃姐姐在上海某銀行做一個信用卡申請項目時,發現一個月內的17個申請全部來自一家注冊不到三個月的公司,所有申請的卡寄地址全部填寫家庭地址,職位均為會計。單純想一想,也覺得這家中介笨得可以了。但看公司名稱和公司地址,的確可以匹配,偏偏又躲得過銀行的風控體系,也不得不佩服中介這愚蠢的聰明!
· 虛假地址:在外賣平臺大戰期間,黃姐姐有幸參與了一家大型外賣平臺的反欺詐項目。由于這一期間,各個平臺的首單紅包很大,吸引了一大批網絡黑產,攻擊方式也是變化多端、五花八門,其中一種就是填寫虛假地址。首先,跟一個飯店串通好,再用n個新賬號在這家店鋪下單,送餐地址填寫一個根本就不存在的地址。甚至有人直接在訂單備注里寫“不需要配送”等留言,讓店主知道這是自己人。再后來,送餐員也加入了這個利益鏈。通過整個閉環操作,騙取了大量的平臺補貼(此處心疼投資人三秒)。
· 模糊地址:現金貸被央媽列入重點監管對象后,消費貸如雨后春筍般涌現,幾個主流電商平臺也位列其中:如京東白條,螞蟻花唄,唯品花等。消費貸的興起引發了黑產的套現風潮,其方式通常是通過購買3C等容易變現的商品,再進行變賣套現(俗稱“額度回收”)。對于有入駐商家的電商平臺,也會有直接勾結的情況——你買個Iphone,我寄給你個磚頭,直接利用平臺推廣期間的消費分期免息福利,套取大量資金。電商平臺為了減少這種套現行為,對于同一地址集中訂單的情況做了限制。為了騙過系統,繞過風控規則,不法分子采用模糊地址的方式進行交易。例如:xxx小區門口,xxx廣場,不寫具體幾幢幾號房間,并在備注里寫“到了電話聯系,自取”。對于這種沒辦法精確到門牌號的模糊地址,風控規則很難覆蓋全面。如果采用一刀切,會引起大量的誤傷,十分棘手。
· 特殊地址字符:為了對抗各個平臺的風控規則,不法分子采用繁體字、錯別字、地址中間夾雜特殊字符以分割關鍵詞等方式進行攻擊。例如,對電商提出的分期免息福利,不法分子通過測試和內外勾結手段獲知,如果地址中出現“手機城”三個字,則會被認定為高風險用戶,他們會采用例如“首機城”(故意寫錯別字)、“手ji城”(采用拼音)、“手機%城”(加特殊字符)、手機城(繁體字)等方式越過風控規則。
背景說明:在消費分期場景套現中,對于購買到的商品的銷贓通常需要包含零售商這一環節,甚至有些零售商就是套現頭子。通用做法是,用戶采用平臺下發的額度下單,直接填寫零售商的地址,例如xxx手機城,xxx電腦城等,零售商收到貨后,以8.3折~9.2折的價格給到用戶現金,如此,套現完成。所以,通過對收貨地址的關鍵詞識別,可以判別一些高風險用戶。而為了躲避這一規則,不法分子就通過各種手段把關鍵詞做變更和分割· 更改地址和地址排序:針對小貸申請場景,通常會讓用戶填寫幾個常用地址。用戶可以通過調整常用地址次序來獲得更高的評分;針對一些消費分期場景,為了獲得更高的額度或者為了獲得使用權限,用戶會先填寫一個高級CBD(會被認為是優質客戶)的地址下單,成功使用消費分期權益后,再打電話給客服更改成實際地址(可能是一個高風險地址)。而電商的通用做法是直接檢測下單地址,對于客服人工修改過的地址則關注較少,因此給了不法分子可乘之機。如下圖所示:
某貸款產品的申請表
某論壇的用戶經驗分享
更換地址可以獲得更高授信額度
?
反欺詐之地址的處理和使用(二)?
反欺詐之地址的處理和使用(一)系統地梳理了地址的種類和利用地址的欺詐手法,本文將以此為基礎,介紹一下地址的處理和使用方法。
#地址的標準化#
(插播一則笑話:一天,黃姐姐在上海地鐵上,聽兩個游客聊天,甲貌似在上海讀書,乙從北京過來玩。乙說:我要去外灘,城隍廟和陸家口…甲沒聽清,什么?乙又重復了一遍:外灘,城隍廟和陸家口…這時,周圍一群人都笑趴了,黃姐姐也是憋出了內傷!甲強忍住笑說:陸家嘴!乙一臉懵逼:哦哦,我說張家口說順口了,對對,陸家嘴。)
言歸正傳,人有對常規地址的自動識別能力(一提到陸家嘴就知道在上海)和糾錯能力(能知道陸家口是陸家嘴的誤讀),而機器沒有。為了讓地址更有識別度,并且能讓機器看得懂,需要對地址進行標準化。何為標準化?讓我們看一個標桿性的地址標準化產品——淘寶。想必在淘寶/天貓買過東西的人都知道,我們在填寫收貨地址時,通常讓我們按照省+市+區+街道+詳細地址這五項來區分,體貼的淘寶,對于我們不太確認的地址,還提供“暫不知道”這一選項,之后會根據我們填寫的詳細地址來做匹配,以完善標準化信息,如下圖所示。
按照省+市+區+街道四個等級填寫,且在街道不確定時,提供“暫不知道”選項
再完善詳細地址后,會自動匹配對應街道
地址的標準化在采集時強制處理是最簡單有效的做法,但對于歷史數據的修復,以及對錯誤數據的更改和對特殊字符的處理,則需要比較細致地處理。以下羅列了幾種常用的方法。
?
#不同種類地址的評估維度#
地址標準化好后,就可以根據地址的靜態信息和動態信息對其進行畫像了。
#貼標簽#
地址標準化并根據評估維度進行字段衍生后,就可以為每個地址/區域貼標簽了。標簽也可以按照幾個維度來貼:
1.按照省、市、區、街道、商圈、樓、室幾個級別來貼;
2.按照房價絕對值和相對值來貼;
3.按照關鍵詞來貼,例如:“大學”對應老師或學生,“醫院”對應醫生、護士和病人,“電腦城”/“手機城”對應零售商等等;
4.按照地址屬性來貼,例如:模糊地址標簽,虛假地址標簽等
5.按照地址/區域逾期率來貼;
6.按照地址接收的平均訂單金額/訂單量來貼;
7.按照訂單商品來貼;
8.按照收貨地址變化頻率來貼;
9.按照公司地址行業來貼;
10.按照公司屬性來貼,例如:是屬于政府機關、學校還是企業?
其中,黃姐姐解釋一下第6條和第7條。在消費分期場景中,用戶會拿到一個授信額度,可以在電商平臺上購物。壞人套現的方式就是一次性用光額度購買手機等易變現商品,例如,近期比較容易變現的是一款899的榮耀手機和799的紅米手機。那么,假設黃姐姐的額度為2500元,那么我會充分利用這一額度,巧妙組合,例如:兩款799?一款899,也即799*2+899=2497<2500,可謂是完美套現。那么,結合地址信息,如果一個地址的訂單金額都約等于授信額度,且寄送的商品品類(如手機)和型號(如紅米5)集中,則可能為高風險客戶。
這個過程有點類似于給人物做側寫或者畫像,只是這里的主角不再是人,而是地址。一個好的地址畫像需要結合場景和業務知識,同時要對數據分布做詳細周密地分析。此處無監督可以提供的就是對地址的分群處理。為了形象地描述,我將無監督的應用抽象成如下案例以方便大家理解。
對于一組雜亂的數據,逾期率為1%。我們通過一定手段對地址進行了分詞處理,發現其中包含“電腦”和“手機”兩個詞的群組中,逾期率高達80%。于是,我們給包含了“電腦”和“手機”的地址貼了一個標簽【零售商】,若結合業務知識,還可以給諸如“華強北”、“賽格”等詞匯同樣貼上【零售商】的標簽。
所以,簡單來說,地址文本的非結構化給地址的標注帶來了一定難度,而無監督有利于整理這些詞匯,有點像excel里的篩選和排序功能,只是,對地址的處理,你不知道是按照什么條件來篩選和排序,而無監督給了你一個可能的篩選條件和思路,讓你無需對案件進行獨立分析,而是批量分析,從而大大節約了時間。
當然,單從地址信息這一個維度,不足以準確判定欺詐行為,僅能作為其中一個角度。為了不因為一刀切而導致的高誤傷,欺詐屬性的判別中,還是需要非常強的擴維能力,從各個角度進行欺詐屬性的綜合評分。
?
?
?
?
總結
以上是生活随笔為你收集整理的反欺诈之地址的处理和使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【采用】反欺诈之四大杀器
- 下一篇: 【待继续研究】如何运用机器学习技术构建可