轻量级的网页Rank算法,365Rss.cn的Rank技术解释以及算法讨论(一)
寫這片文章,是想討論一下輕量級(相對于Google那種重型復雜的PageRank而言)的網頁Rank算法。
一般而言,一個網頁是否受歡迎,365Rss.cn所能想到的,應該涉及到3個分子因素:“點擊量”、“回復量”、“用戶評分”。
注:“分子因素”是我自己想的名詞,也即作為被除數的因素。它的數學名詞大學教過我忘了。
目前大部分國內站點都片面地關注并在數據庫里面記錄了以上3個因素。但是很少有網站把這些因素綜合起來進行數據挖掘、分析。365Rss.cn在一開始設計的時候就考慮到這3點因素,并設計了各自的權重。
一個網頁滿分100分。其中:
點擊量=20%
回復量=30%
用戶評分=50%
計算Rank的時候,365Rss.cn還為“點擊量”、“回復量”考慮到了一個分母因素:“網頁年齡”。
注:“分母因素”是我自己想的名詞,也即作為除數的因素。
為什么不為“用戶評分”考慮網頁年齡呢,因為一般而言,用戶打分后的平均分,并不因為該網頁存在的時間長短而成比例。相反,一定時間內的點擊和回復率,往往很大程度上決定該網頁是否受歡迎。
Rank計算公式如下:
Rank=(用戶評分總數/打分次數)*50 +(回復量/網頁年齡)*e*30+(點擊量/網頁年齡)*e*20
注:該公式的e為一個協調常數,具體數字是多少365Rss.cn小組暫未定。
今天太晚了,下次講365Rss.cn網站采用的改進型輕量級Rank算法。
轉載于:https://www.cnblogs.com/kaima/archive/2007/01/08/614437.html
總結
以上是生活随笔為你收集整理的轻量级的网页Rank算法,365Rss.cn的Rank技术解释以及算法讨论(一)的全部內容,希望文章能夠幫你解決所遇到的問題。