简直不得了!DataVisor推出轻量级UML,实力圈粉中小企业!
最早僅僅在電商領(lǐng)域“瘋狂肆虐”,如今已經(jīng)發(fā)展為“無處不在+層出不窮”……
額,頭疼!
起初只是簡單易識破的刷單and薅羊毛,而現(xiàn)在卻統(tǒng)統(tǒng)升級為擁有十八般武藝的“神選手”……
嗯,難搞!
原本只是隨機(jī)進(jìn)行的“單挑作案”,慢慢卻轉(zhuǎn)變?yōu)樾钪\已久的“團(tuán)伙行動”……
哎,怎么會這樣?
聽起來,欺詐這種事兒似乎已經(jīng)發(fā)展為“家常便飯”并且猝不及防!
?
形勢如此嚴(yán)峻,身處電商、社交、游戲以及金融等“欺詐重災(zāi)區(qū)”的成熟型企業(yè)們都紛紛拿起有力武器捍衛(wèi)權(quán)益,那處于成長期的企業(yè)們究竟該怎么辦?
圖片來源:http://tupian.baike.com/a2_11_91_14300000678340127193913296427_jpg.html
別急!DataVisor早就想到了這點,抓緊發(fā)布了全新的反欺詐新產(chǎn)品—DataVisorUMLEssentials,實地教會成長期企業(yè)對欺詐堅決說“NO!”
?
DataVisorUMLEssentials究竟怎樣?
據(jù)小編了解,這款新產(chǎn)品以DataVisor首創(chuàng)并在業(yè)界反響強(qiáng)烈的無監(jiān)督機(jī)器學(xué)習(xí)(UML)引擎為基礎(chǔ)。
?
?
?
因為考慮到最初接觸的客戶群體里成熟型企業(yè)居多,相比成長期企業(yè),表現(xiàn)出的技術(shù)能力比較深厚,對此DataVisor中國區(qū)總經(jīng)理吳中表示,這次輕量級產(chǎn)品的業(yè)務(wù)對接,會針對不同企業(yè)在業(yè)務(wù)、數(shù)據(jù)的復(fù)雜度上以及特殊場景方面進(jìn)行定制化的工作,切實為選擇使用該產(chǎn)品的成長型企業(yè)在防欺詐方面帶來收益!
?
?
此外,新產(chǎn)品在接入效率以及方便場景的設(shè)置上,例如注冊環(huán)節(jié),在力求達(dá)到高效全面的防控的同時,確實費了不少心思!
據(jù)悉,產(chǎn)品初期會選擇從大規(guī)模注冊場景入手。
在種類繁多的互聯(lián)網(wǎng)服務(wù)體系中,其實“注冊”幾乎可以作為所有服務(wù)的必備入口之一,通常企業(yè)也最容易在用戶注冊這個環(huán)節(jié)疏忽用戶真假辨別,給日后平臺的安全性埋下隱患。如果可以從源頭上阻止欺詐、防范欺詐的話,針對性會更強(qiáng)!
“我們選擇將這個看似很普通的場景做深做細(xì),當(dāng)然在產(chǎn)品發(fā)展的中后期也有可能會引入更多場景,未來發(fā)展中企業(yè)也可以根據(jù)自身的業(yè)務(wù)發(fā)展選取針對性的服務(wù)。”吳中補(bǔ)充道。據(jù)悉,DataVisorUMLEssentials只需使用一組標(biāo)準(zhǔn)的數(shù)據(jù)字段,就可以輕松面對最廣泛的大規(guī)模注冊場景,還伴隨著性能優(yōu)化。
在交流過程中,小編得知新產(chǎn)品以SaaS形式提供服務(wù),這樣自主服務(wù)就顯得額外重要。依照相關(guān)指引,用戶可以輕松完成數(shù)據(jù)上傳,數(shù)據(jù)質(zhì)量檢查,生產(chǎn)部署,生成可視化報告,自定義報表等全部流程,保證用戶對服務(wù)的全程可控。
DataVisor在這次的產(chǎn)品設(shè)計中做到最大限度減少用戶切入服務(wù)的時長,保證在使用防欺詐功能的過程中,企業(yè)自主參與與把控的程度較高。
更重要的一點,這套產(chǎn)品做到了機(jī)器學(xué)習(xí)服務(wù)中的開放性創(chuàng)新,簡單來說就是完成了模型的自動調(diào)優(yōu)技術(shù)設(shè)計。
過去,在傳統(tǒng)服務(wù)中,產(chǎn)品在接入用戶前需要大量人工參與其中,根據(jù)用戶的特點進(jìn)行手動調(diào)優(yōu)。
如今自動調(diào)優(yōu)的設(shè)計不單大幅度降低了人工耗時,從過去的幾周縮減到幾天甚至幾小時,有效降低成長期企業(yè)對先進(jìn)AI風(fēng)控技術(shù)的接入門檻。
需要強(qiáng)調(diào)的是,DataVisor的服務(wù)均是基于自研發(fā)的數(shù)據(jù)處理平臺,無論是之前的無監(jiān)督學(xué)習(xí)反欺詐解決方案還是這款最新推出的UMLEssentials。
吳中介紹說,這款數(shù)據(jù)處理平臺目前構(gòu)建于主流的云計算基礎(chǔ)架構(gòu)設(shè)施上,包括AWS以及阿里云等,可以實現(xiàn)多租戶任務(wù)自動化,流水線水平擴(kuò)展以及模型公眾發(fā)布等。
如果從數(shù)據(jù)量級的角度分析,每日上千萬級的數(shù)據(jù)吞吐是“小菜一碟”,足見平臺級的數(shù)據(jù)支撐強(qiáng)大且無憂。
“我們希望能把DataVisor在安全領(lǐng)域多年積累的經(jīng)驗賦予更多成長型企業(yè),將線上安全領(lǐng)域中第一步風(fēng)控場景—大規(guī)模注冊,在欺詐發(fā)生前將其攔截,有效降低企業(yè)在使用AI反欺詐服務(wù)的門檻,讓企業(yè)更加專注于產(chǎn)品研發(fā)和用戶增長。”吳中總結(jié)到。
DataVisor啟程于美國加州山景城,2015年獲得由GSR與NewEnterpriseAssociates領(lǐng)投的A輪融資,并于2016年下半年進(jìn)入國人視野。
短短不到兩年時間,就掌握了包括電商、游戲、金融還有社交領(lǐng)域在內(nèi)的諸多中大型企業(yè)的防欺詐業(yè)務(wù),憑借人工智能技術(shù),尤其是無監(jiān)督學(xué)習(xí)算法以及大數(shù)據(jù)方向應(yīng)用深耕“反欺詐”這片土壤,就在剛剛過去的2月,DataVisor又成功獲得由紅杉資本中國基金領(lǐng)投的四千萬美元C輪融資。
有關(guān)DataVisor無監(jiān)督學(xué)習(xí)的幾個問題
談及DataVisor“領(lǐng)銜”的無監(jiān)督學(xué)習(xí)技術(shù)手段防欺詐,還是先來說說如今在防欺詐市場中存在的幾種主流技術(shù)方法吧!
首先就是我們熟知的規(guī)則系統(tǒng)。
即憑借曾經(jīng)被欺詐的經(jīng)歷去分析一些樣本,來總結(jié)得出“出現(xiàn)欺詐”的情況并設(shè)置有效的規(guī)避規(guī)則,這種方法需要深入了解欺詐模式,無法做到有效應(yīng)對不斷變化的欺詐手段。
另一種,有點兒類似于通常使用的社交軟件中的“黑名單”設(shè)置。
可以理解為將一些曾經(jīng)的黑產(chǎn)設(shè)備,包括指紋等信息錄入,把結(jié)果提供給用戶進(jìn)行匹配,如果可以匹配才能鎖定欺詐身份無疑。如果黑產(chǎn)信息不夠多,新設(shè)備出現(xiàn)?就很難辦了!
第三種,也是很多該領(lǐng)域的企業(yè)積極著手的嘗試,被稱為有監(jiān)督學(xué)習(xí)或者半監(jiān)督學(xué)習(xí),但在實際應(yīng)用中也存在不小的困難。
例如標(biāo)簽數(shù)據(jù)的獲取,過程是否透明并獨立,數(shù)據(jù)分類的標(biāo)準(zhǔn)如何把握、是否有效做到提前預(yù)警等。
可想而知,在現(xiàn)實中,各行各業(yè)均擁有較多的數(shù)據(jù)積累,但攜帶明顯含義的標(biāo)簽數(shù)據(jù)卻少之又少,如何合理制定標(biāo)簽?必然需要行業(yè)內(nèi)的權(quán)威專家深度協(xié)同參與,人力是否允許就會打一個大大的問號。
此外,即使“打標(biāo)簽”這個問題得到解決,標(biāo)簽數(shù)據(jù)的及時性又無法得到保證,如果滯后就會對數(shù)據(jù)準(zhǔn)確性造成影響,然后包括建模,檢測攻擊等環(huán)節(jié)一并受到牽連,有監(jiān)督學(xué)習(xí)的效果自然也就達(dá)不到了。
還有最最重要的一點,以上三種防欺詐的技術(shù)手段都無法做到事前的防御和檢測!
也就是說,想用這三種方式,前提是被騙過才行,僅僅有點兒亡羊補(bǔ)牢的意思。
?
圖片來源于:http://www.qq1234.org/QQbiaoqing/biaoqingbao/2015/0415/31318.html
這樣比較來看,無監(jiān)督學(xué)習(xí)還是目前很有效的防欺詐技術(shù)手段,為什么這么說?最重要的優(yōu)勢,可以做到事前的預(yù)防與檢測,當(dāng)然它并不需要“標(biāo)簽”這個東西。
DataVisor作為業(yè)內(nèi)最早并最長時間使用無監(jiān)督學(xué)習(xí)的企業(yè),防欺詐解決方案就是依托這種無標(biāo)簽的機(jī)器學(xué)習(xí),來自動挖掘各種未知或新型的攻擊。
沒錯,根本不用輸入數(shù)據(jù)形成標(biāo)簽就能夠使用。
更便捷的一點,還可以計算出相應(yīng)的函數(shù),用來描述“無標(biāo)簽”輸入數(shù)據(jù)之間隱藏的關(guān)聯(lián)。
?
?
例如,DataVisorUML引擎采用聚類/圖分析技術(shù)開發(fā)而成。通過分析數(shù)據(jù)點之間的距離以及連接(數(shù)據(jù)點代表賬戶及賬戶在一定時間內(nèi)的活動),就可以自動發(fā)現(xiàn)新型濫用、欺詐和洗錢等活動。
?
?
盡管目前無監(jiān)督機(jī)器學(xué)習(xí)很有效,但在實際應(yīng)用相對較少,可能難度還是在于如何設(shè)計算法、體系架構(gòu)以及保障算法的效果等方面。
DataVisor除了在實際欺詐檢測過程中采用無監(jiān)督機(jī)器學(xué)習(xí)引擎,還可以搭配有監(jiān)督機(jī)器學(xué)習(xí)引擎、全球智能信譽(yù)庫以及自動規(guī)則引擎進(jìn)行使用,形成一套防欺詐的解決方案。
運行的大概過程是這樣的!
這套解決方案的原理是將原始數(shù)據(jù)輸入無監(jiān)督機(jī)器學(xué)習(xí)引擎,可在實時環(huán)境下,輸出每個事件的欺詐可疑分?jǐn)?shù)并給可解釋性原因;在批量處理環(huán)境下,輸出檢測出的可疑賬戶列表,并附有相關(guān)分?jǐn)?shù)和原因解釋。
無監(jiān)督機(jī)器學(xué)習(xí)引擎輸出結(jié)果還可錄入到DataVisor可視化控制臺,控制臺可直觀顯示攻擊團(tuán)伙,方便調(diào)查每個已檢出的事件以及賬戶。
?
其中,無監(jiān)督機(jī)器學(xué)習(xí)引擎在數(shù)據(jù)輸入和結(jié)果輸出之間需要執(zhí)行以下幾個關(guān)鍵步驟:分別是動態(tài)特征提取、無監(jiān)督攻擊團(tuán)伙檢測、結(jié)果分類和排序等。
需要說明的一點,“無監(jiān)督”可以進(jìn)行自學(xué)習(xí),了解未知欺詐攻擊方式!
通常無監(jiān)督學(xué)習(xí)引擎會在動態(tài)特征提取這一步關(guān)注這樣幾個數(shù)據(jù)類別:例如用戶個人信息,例如用戶簽名、用戶昵稱等;用戶行為,包括登陸信息、瀏覽記錄等;設(shè)備信息,包括設(shè)備類型及版本、瀏覽器信息、IP地址等。
最重要的一點,不同賬戶之間的交互關(guān)系也在“關(guān)注”范圍之內(nèi)。
DataVisor全方位的反欺詐解決方案,除了無監(jiān)督學(xué)習(xí)引擎外,同時也會配合自動規(guī)則引擎以及全球智能信譽(yù)庫的使用。
自動規(guī)則引擎保留了規(guī)則系統(tǒng)的透明性,且無監(jiān)督機(jī)器學(xué)習(xí)引擎可以自動更迭規(guī)則。
吳中解釋道,實際上它的核心是無監(jiān)督機(jī)器學(xué)習(xí),相當(dāng)于具備一個自動無監(jiān)督的模型能夠自動產(chǎn)生異常的、欺詐群組的檢測,并生成一些人工可以理解的動態(tài)規(guī)則。
據(jù)小編了解,這個過程并不需要人工干預(yù)。
“我們會根據(jù)監(jiān)督到的結(jié)果動態(tài)去更新,裁減掉一些不適用的規(guī)則,保證規(guī)則的準(zhǔn)確率。簡單的可以理解為已經(jīng)有一個很好的算法知道現(xiàn)在欺詐者的相貌以及數(shù)量,任何一個規(guī)則都可以用數(shù)據(jù)來做驗證。”吳中解釋道。
此外,DataVisor還打造了全球智能信譽(yù)庫,為以上技術(shù)提供數(shù)據(jù)支持。
?
?
全球智能信譽(yù)庫主要通過挖掘、整合攻擊信號,進(jìn)行二度計算,提煉出更具有代表性的信號。據(jù)了解,信譽(yù)庫擁有來自不同領(lǐng)域總計超過30億用戶的欺詐行為數(shù)據(jù),精細(xì)到包括IP地址、UA信息、郵箱域名、設(shè)備類型等。
?
?
雖然類屬機(jī)器學(xué)習(xí),但無監(jiān)督學(xué)習(xí)對模型維護(hù)“沒那么多要求”。
DataVisor的UML引擎支持相對靈活的輸入數(shù)據(jù)格式與數(shù)量,結(jié)果可借助API或者UI呈現(xiàn)并使用。
另外,由于并不需要大量的調(diào)優(yōu)工作,所以調(diào)優(yōu)花費更低。
UML引擎能清楚地檢測出關(guān)聯(lián)賬戶之間有什么共同的屬性,給出相對透明并且更加合規(guī)的檢測原因,這一點借鑒了規(guī)則系統(tǒng)的優(yōu)點。
有人會問,客戶那么多,每家企業(yè)的數(shù)據(jù)又都是不同的,難道事先不會進(jìn)行針對數(shù)據(jù)的評估或者判斷嗎?如果會,這個判斷結(jié)果會影響我們最后監(jiān)督的結(jié)果嗎?
關(guān)于這個問題,吳中解釋,在介入業(yè)務(wù)時,會做基本的數(shù)據(jù)清洗和一些所謂的整理動作。
舉個例子,例如收集IP,收集上來的IP如果都是服務(wù)器內(nèi)部的,其實毫無作用,所以在前期通過數(shù)據(jù)清洗和圖表統(tǒng)計一下,這也可以做一些事前的排查,發(fā)現(xiàn)問題一般也會反饋,哪一點有問題,然后清理完成后模型才會保證比較好的效果。
談及與眾多客戶的合作,吳中表示,這種合作相當(dāng)于“產(chǎn)品+服務(wù)”的模式,以年度訂閱形式體現(xiàn)。
年度訂閱服務(wù)后,DataVisor會通過數(shù)據(jù)分析來提供結(jié)果。
追求的目標(biāo)更像是兩個團(tuán)隊的聯(lián)合與互補(bǔ),為了提高欺詐檢測率和覆蓋率。
與DataVisor的合作中,客戶內(nèi)部技術(shù)團(tuán)隊更多只需要做一些前期工作,例如數(shù)據(jù)準(zhǔn)備和清洗等。DataVisor則可以利用無監(jiān)督機(jī)器學(xué)習(xí)的方法發(fā)現(xiàn)未知的欺詐模式,客戶可以分析判斷DataVisor能夠自動發(fā)現(xiàn)多少新的欺詐模式、帶來多少增益以及減少多少損失等。
數(shù)據(jù)層面合作模式上,DataVisor也有幾種模式,例如SaaS云端的部署方式、私有云部署,也可以是本地部署。
四年前,謝映蓮和俞舫雙雙離開微軟在美成立DataVisor……
隨后不久,便收到來自陌陌赴美尋求合作的機(jī)會,DataVisor很快運用獨創(chuàng)的無監(jiān)督學(xué)習(xí)算法,幫助陌陌建立起一套領(lǐng)先的基于行為識別的全方位反欺詐檢測方案……
2016年,DataVisor又將“無監(jiān)督”反欺詐技術(shù)帶到中國……
?
后來,獨創(chuàng)的無監(jiān)督反欺詐技術(shù)成為其業(yè)務(wù)主線上的“專利產(chǎn)品”,此外還有多項專利正在申請中……
DataVisor,一炮打響、一路走來,總給人們帶來技術(shù)上的驚喜。
總結(jié)
以上是生活随笔為你收集整理的简直不得了!DataVisor推出轻量级UML,实力圈粉中小企业!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。