论文笔记(eTrust: Understanding Trust Evolution in an Online World)
eTrust:理解線上信任進(jìn)化
原文鏈接:eTrust: Understanding Trust Evolution in an Online World, KDD’12
原理:用戶偏好與項(xiàng)的向量?jī)?nèi)積 + 用戶與朋友相似度權(quán)重*朋友對(duì)項(xiàng)的時(shí)間衰減評(píng)分=用戶對(duì)項(xiàng)的評(píng)分
摘要
大部分關(guān)于線上信任的研究都假設(shè)用戶之間的信任關(guān)系是靜態(tài)的。正如社會(huì)科學(xué)家告訴我們的那樣,信任隨著人類的交互而進(jìn)化發(fā)展。在線信任進(jìn)化的研究面臨著獨(dú)特的挑戰(zhàn),因?yàn)橥ǔG闆r下可用的數(shù)據(jù)來(lái)自于被動(dòng)觀察(科學(xué)家在現(xiàn)實(shí)世界中調(diào)查一群人,記錄他們的各種信息)。本文利用社會(huì)科學(xué)理論開發(fā)了研究在線信任發(fā)展的方法。我們提出了一個(gè)進(jìn)化信任框架eTrust,它利用了在線產(chǎn)品評(píng)審中用戶偏好的動(dòng)態(tài)特性。
介紹
信任被廣泛的用于幫助線上用戶在應(yīng)用程序中收集可靠的信息,比如高質(zhì)量評(píng)論檢測(cè)和產(chǎn)品推薦。
Epinion 1等產(chǎn)品評(píng)審站點(diǎn)的一個(gè)重要特點(diǎn)是用戶之間存在信任網(wǎng)絡(luò)。這些網(wǎng)站為研究線上世界中的信任提供了一個(gè)明智的平臺(tái)。
圖一展示了在兩個(gè)不同時(shí)間點(diǎn)的線上評(píng)價(jià)系統(tǒng),有兩種物體:users、items。兩種動(dòng)作:建立用戶之間的信任關(guān)系、建立用戶對(duì)項(xiàng)的評(píng)級(jí)。評(píng)價(jià)系統(tǒng)隨著時(shí)間再進(jìn)化,當(dāng)新的用戶 u5 和新的項(xiàng) I5 被加入時(shí),新的信任關(guān)系和新的評(píng)級(jí)關(guān)系就會(huì)被創(chuàng)建。
Ziegler指出信任和用戶偏好相似性有很強(qiáng)的相關(guān)性,兩個(gè)用戶越相似,他們之間就越可能存在相似關(guān)系。換句話說(shuō),用戶之間的信任關(guān)系會(huì)隨著用戶偏好的變化而發(fā)展。
本文首次嘗試在線產(chǎn)品評(píng)審的背景下,利用用戶偏好的動(dòng)態(tài)特性來(lái)研究網(wǎng)絡(luò)信任的演化。這項(xiàng)工作的主要貢獻(xiàn)包括:
- 提供研究線上世界中信任演變的方法
- 提出了一個(gè)框架eTrust,通過(guò)利用在線產(chǎn)品評(píng)審用戶偏好的動(dòng)態(tài)來(lái)理解信任的演變
- 介紹了這項(xiàng)關(guān)于用戶偏好變化的eTrust研究的結(jié)果。
- 通過(guò)在線應(yīng)用程序評(píng)估eTrust,例如使用實(shí)時(shí)數(shù)據(jù)的評(píng)級(jí)和信任預(yù)測(cè)。
問(wèn)題陳述
t 時(shí)刻的用戶集合 Ut = {u1, u2, . . . , unt }
t 時(shí)刻的項(xiàng)集合 It = {I1, I2, . . . , Imt }
Ut ? Ut+1 and It ? It+1
t 時(shí)刻的信任網(wǎng)絡(luò) Xt ∈ Rnt×nt 【 Xt(i, j) = 1 if ui is trusted by uj at time t)】
t 時(shí)刻的評(píng)級(jí) Rt ∈ Rnt×mt
用戶可能對(duì)不同方面(facets)的項(xiàng)目有不同的偏好,我們假設(shè)項(xiàng)有K個(gè)潛在面,并且用戶對(duì)相同潛在面的項(xiàng)有著相似的偏好。 (這個(gè)地方可以用電影推薦來(lái)理解,比如:每個(gè)電影有3個(gè)潛在面:導(dǎo)演、演員、電影類型,對(duì)于這三個(gè)潛在面相同的電影用戶可能有著相同的喜好)
t 時(shí)刻用戶 ui 的偏好向量 pti ∈ RK+
項(xiàng) Ij 的特征向量 qj ∈ RK
t 時(shí)刻多面信任關(guān)系 Wt ∈ Rnt×nt×K 【wtivk 表示 t 時(shí)刻 ui 對(duì) uv 在 k 面的的信任關(guān)系】
則,在動(dòng)態(tài)用戶偏好的情況下的信任進(jìn)化問(wèn)題可以被稱述為:給定 T 時(shí)刻的切片,用戶 U、項(xiàng) I、用戶信任網(wǎng)絡(luò) X、用戶評(píng)級(jí) R,信任進(jìn)化 W 可以利用用戶的偏好 P 的變化來(lái)學(xué)習(xí)到。
信任進(jìn)化框架
eTrust - 模擬信任進(jìn)化
在評(píng)級(jí)系統(tǒng)中信任和用戶偏好的相似度有很強(qiáng)的聯(lián)系,反映在其評(píng)級(jí)信息中。本文探索了用戶偏好的動(dòng)態(tài)性,為評(píng)級(jí)系統(tǒng)建立了信任進(jìn)化模型。
rtij 為實(shí)際的評(píng)級(jí),r^tij 為預(yù)測(cè)的評(píng)級(jí),一個(gè)基于信任網(wǎng)絡(luò)的評(píng)級(jí)預(yù)測(cè)的方法,是最近鄰居模型(考慮用戶多方面信任關(guān)系)的變體:
Nti 是 ui 在 t 時(shí)刻信任的用戶集合
rtvjvj 是 uv 在 t 時(shí)刻之前對(duì) Ij的評(píng)級(jí)(tvj 就是用戶 uv 對(duì)項(xiàng) Ij 進(jìn)行評(píng)價(jià)時(shí)的時(shí)刻)
越早的評(píng)級(jí)反映的是用戶之前的偏好,應(yīng)該對(duì)當(dāng)前的評(píng)級(jí)有更小的影響,因此,我們選擇了指數(shù)時(shí)間函數(shù)。
其中,ηi ≥ 0 繪制 ui 的用戶特定衰變率,應(yīng)該從data中學(xué)習(xí)得到
wtivk 是在 t 時(shí)刻 ui 和 uv 在 k 面之間的信任強(qiáng)度。
由于信任和用戶偏好相似度之間有強(qiáng)烈而明顯的聯(lián)系,我們定義stivk ∈ RL是 t 時(shí)刻 ui 和 uv 在 k 面的偏好相似度向量,基于 t 時(shí)刻他們?cè)?k 面的偏好 pti (k) 、 ptv(k)
然后可以用 stivk 來(lái)定義 wtivk,其中 f 是 sigmoid 激活函數(shù)
latent factor model 沒(méi)有包含信任網(wǎng)絡(luò)的影響,neighborhood model 沒(méi)有考慮用戶偏好和項(xiàng)的特征。因此,我們將兩者結(jié)合起來(lái),在這個(gè)公式中,在 t 時(shí)刻 ui 對(duì) Ij 的評(píng)級(jí)由兩個(gè)因素決定,前部分捕獲了 ui 在 t 時(shí)刻的偏好和 item 的特征,后部分考慮了用戶信任用戶的影響。α ∈ [0, 1] 來(lái)調(diào)節(jié)兩部分的貢獻(xiàn)。
然后,信任進(jìn)化問(wèn)題就被嵌到了評(píng)級(jí)預(yù)測(cè)中,可以被下面的最小化問(wèn)題表達(dá):c(·) 模擬了用戶偏好的變化,λ 控制變化的速度,當(dāng) λ → 0,我們不考慮不同時(shí)間點(diǎn)用戶偏好的聯(lián)系。當(dāng) λ → +∞,不同時(shí)間點(diǎn)用戶的偏好向量被限制為相同。
由于用戶偏好的變化被認(rèn)為隨著時(shí)間平滑變化,可以如下定義函數(shù)c:
eTrust 應(yīng)用
評(píng)分預(yù)測(cè)
預(yù)測(cè) T+1 時(shí)刻用戶 ui 對(duì)項(xiàng) Ij 的評(píng)分:
其中,w 是從數(shù)據(jù)中學(xué)習(xí)得到的,qj 是不隨時(shí)間進(jìn)化的,對(duì)于每個(gè)用戶,ui,bi,ηi 在時(shí)間片上是相互獨(dú)立的可以直接應(yīng)用到 T+1 時(shí)刻。
定義用戶 ui 在 k 面的偏好變化速度為 Zik ,則用戶在 T+1 時(shí)刻 k 面的偏好 pT+1i(k) 可以用過(guò) T 時(shí)刻 k 面的偏好和偏好變化速度計(jì)算出來(lái):
在 T+1 時(shí)刻,新的用戶和新的項(xiàng)可能被引入,我們使用 Homophily 來(lái)解決冷啟動(dòng)問(wèn)題:相似的用戶更可能信任彼此。因此,對(duì)于一個(gè)新的用戶,我們先基于 profile 找到他的 top-l 相似用戶集合,然后通過(guò)平均他信任用戶的偏好來(lái)估計(jì)他的偏好。對(duì)于新的項(xiàng)也是同樣的方法。
信任預(yù)測(cè)
信任傳播模型(Trust propagation model)是一個(gè)流行的模型,它基于已知信任關(guān)系來(lái)得到新的信任關(guān)系的。但是用戶的信任關(guān)系通常是服從冪律分布 (pow-law distribution) 的,因此,在實(shí)際應(yīng)用中,沒(méi)有足夠的信息來(lái)應(yīng)用這一技術(shù)。此外,該傳播模型不能直接適用于信息少的新用戶。
eTrust 可以用戶信任預(yù)測(cè),給定時(shí)間 T 之前的信任網(wǎng)絡(luò)和評(píng)分,我們想要推薦 T+1 時(shí)刻的信任關(guān)系。通過(guò)優(yōu)化 eTrust 的目標(biāo)函數(shù)可以得到參數(shù) w(權(quán)重),然后用戶 ui 和用戶 uv 在 k 面的信任強(qiáng)度 wivk 便可以計(jì)算出來(lái)。然后整體的信任強(qiáng)度 wiv 可以如下計(jì)算得到:(對(duì)于一個(gè)新的用戶的偏好,用他關(guān)于 profiles 的 top-l 相似用戶的平均偏好來(lái)表示)
學(xué)習(xí)總結(jié)
1、作者在考慮用戶與用戶之間的信任關(guān)系時(shí),不是簡(jiǎn)單的信任和不信任關(guān)系,而是考慮了 K 個(gè)潛在面,用戶在不同潛在面對(duì)別的用戶有不同的信任關(guān)系。這樣的好處就是在推薦物品時(shí)不是簡(jiǎn)單的考慮用戶對(duì)鄰居的信任分?jǐn)?shù)大小,也考慮到了推薦商品的特性。(比如說(shuō):給用戶 a 推薦運(yùn)動(dòng)產(chǎn)品的時(shí)候可能更信任用戶 b,推薦電影的時(shí)候可能更信任用戶 c )
2、信任和用戶偏好相似性有很強(qiáng)的相關(guān)性,同時(shí),用戶之間的信任關(guān)系會(huì)隨著用戶偏好的變化而發(fā)展。
3、在考慮信任用戶對(duì)項(xiàng)的評(píng)級(jí)時(shí),采用指數(shù)時(shí)間函數(shù),表明時(shí)間越久遠(yuǎn)的評(píng)級(jí)的影響程度越小。
4、疑問(wèn):最近鄰居模型的分母為什么時(shí)那樣的呢?感覺(jué)分母應(yīng)該是鄰居個(gè)數(shù)。
5、用戶在不同方面的喜歡程度乘以用戶對(duì)別的用戶在不同方面的信任程度之和得到用戶對(duì)別的用戶的整體信任程度。
6、通過(guò)之前的偏好變化計(jì)算得到偏好變化速度,再計(jì)算得到下個(gè)時(shí)刻用戶的偏好。這是我覺(jué)得這篇論文提出的一個(gè)好的角度,但是這樣的計(jì)算方式是否合理呢?即每個(gè)時(shí)刻的偏好減去上一個(gè)時(shí)刻的偏好值是否穩(wěn)定,如果波動(dòng)很大的話,這樣計(jì)算就不太合適了,可以考慮換一種計(jì)算方式!!!
總結(jié)
以上是生活随笔為你收集整理的论文笔记(eTrust: Understanding Trust Evolution in an Online World)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 欺诈检测相关论文
- 下一篇: 事件抽取与事理图谱的N个问题