GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection
GCN-Based User Representation Learning for Unifying Robust
Recommendation and Fraudster Detection
點擊率預測:其主要思想是根據用戶的歷史行為對一組未評級的項目進行評級預測,然后從預測評級最高的項目中選擇個性化推薦。
欺詐檢測:推薦系統的評論評級數據通常來自于開放平臺,這可能會吸引一群惡意用戶故意插入虛假反饋,使推薦系統偏向于自己。(此類攻擊的出現可能會違反建模假設,即高質量的數據總是可用的,這些數據真實地反映了用戶的興趣和偏好。)
GCN:圖卷積神經網絡,用來做推薦任務,可以很好的利用rating圖的局部結構信息和用戶本身的信息來學習用戶的表示。
NRF:神經隨機森林,用來做異常檢測任務,NRF是一個很好的分類器。
在其端到端學習過程中,用戶在欺詐者檢測組件中被識別為欺詐者的概率自動決定該用戶的評級數據在推薦組件中的貢獻;而在推薦分量中輸出的預測誤差是欺騙者檢測分量中的一個重要特征。因此,這兩個組成部分可以相互增強。
item表示的學習:
user,item 二部圖
zv: item emb 隨機初始化 (user emb 不是隨機,而是根據特征初始化)
er: rating emb
‘+’ : concatenation
g : MLP
wb:參數
6 : relu激活函數
agg: 整合函數,最簡單的比如求平均,這里使用attentaion機制
user表示的學習:
zu: user emb ,根據特征初始化
g‘:l - lyear MLP
r: user 對 item 的評分
在異常檢測的時候,加入error u 的原因:認為正常用戶是更加穩定和可預測的,異常用戶的預測誤差會更大。所以error就可以給異常檢測提供一個強有力的信號。
zu*: dence emb , NRF的輸入
決策節點d:有一個決策函數fd,決定接收到的input zu將被轉發到左子樹還是右子樹
葉節點p:預測節點節點,遵循概率分布 p
有o個決策樹,每個決策樹都是標準的二叉樹
點擊預測:加入了異常概率作為權重
異常檢測:user emb 加入了誤差信息
聯合訓練:超參數平衡兩個任務權重
總結
以上是生活随笔為你收集整理的GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KerasSeq2seqGenerati
- 下一篇: Android官方开发文档Trainin