什么是pageRank
生活随笔
收集整理的這篇文章主要介紹了
什么是pageRank
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
什么是pageRank
- pageRank是google提出的算法,用于衡量特定網(wǎng)頁相對于搜索引擎中的其它網(wǎng)頁而言的重要程度
- 實(shí)現(xiàn)了將鏈接價(jià)值概念作為排名因素
算法原理:
-
入鏈 === 投票
- pageRank讓鏈接來投票,到一個(gè)頁面的超鏈接相當(dāng)于對該頁投一票
-
入鏈數(shù)量
- 如果一個(gè)頁面節(jié)點(diǎn)接收到的其它網(wǎng)頁指向的入鏈數(shù)量越多,那么這個(gè)頁面越重要
-
入鏈質(zhì)量
- 指向頁面A的入鏈質(zhì)量不同,質(zhì)量高的頁面會用過鏈接向其他頁面?zhèn)鬟f更多的權(quán)重,所以越是質(zhì)量高的頁面指向頁面A,則頁面A越重要
-
初始值
- google的每個(gè)頁面設(shè)置相同的PR值
- pageRank算法給每個(gè)頁面的PR初始值為1
-
迭代算法
- google不斷的重復(fù)計(jì)算每個(gè)頁面的pageRank。那么經(jīng)過不斷的重復(fù)計(jì)算,這些頁面的PR值會趨向于穩(wěn)定,即收斂狀態(tài)
- 在具體企業(yè)中應(yīng)怎樣確定收斂標(biāo)準(zhǔn)
- 每個(gè)頁面的PR值和上一次計(jì)算的PR值相等
- 設(shè)定一個(gè)差值標(biāo)準(zhǔn)(0.0001)。當(dāng)所有頁面和上一次計(jì)算的PR差值平均小于該標(biāo)準(zhǔn)時(shí),則收斂
- 設(shè)定一個(gè)百分比(99%).當(dāng)99%的頁面和上一次計(jì)算的PR相等。
站在互聯(lián)網(wǎng)的角度:
- 只出不入:PR值會為0
- 只入不出:PR值會很高
- 直接訪問網(wǎng)頁
修正了pageRank計(jì)算公式,增加阻尼系數(shù)
- 在公式的基礎(chǔ)上簡單增加了阻尼系數(shù)(damping factor) d
- 一般取之為d=0.85
-完整的pageRank計(jì)算公式 - d:阻尼系數(shù)
- M(i) 指向i的頁面集合
- L(j):頁面的出鏈數(shù)
- PR(pj):j頁面的PR值
- n:所有的頁面數(shù)
總結(jié)
以上是生活随笔為你收集整理的什么是pageRank的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel中offset函数的使用方法
- 下一篇: wifite 破解wifi密码