(简单介绍)PageRank算法
文章目錄
- 前言
- 引入
- 形式化
- PageRank
前言
這個是一個經典算法,還是有必要了解的,這里由于講得不會很詳細,所以要求你有一點數學知識,如果有,看完這篇就大概明白PageRank是個啥了。本篇不涉及證明之類的,而是主要搞清楚背景以及怎么做。
參考視頻:PageRank算法。
引入
我們可以看到,搜索華東師范大學之后,其官網網站排在第一,百度百科排在后面,這個排序結果是背后人為設置的還是自動生成的呢?當然是自動生成的,并且這個算法叫做PageRank算法。
形式化
即一個網頁重要不重要,一個是可以觀察是否有很多其他網頁指向它,另外就是指向它的網頁是不是重要的網頁。也就是說,如果有10個垃圾網頁指向你,還不如一個重量級“專家”網頁指向你。
一個例子,假設頁面A是100權重,由于兩個出度,給了頁面C和D各自50的權重,而頁面B是9個權重,由于三個出度,給了頁面C 3個權重。從而頁面C獲得53權重,頁面D或者50權重,從而頁面C比頁面D重要。
但是上面存在一個問題,我們需要先有頁面A和頁面B的權重,萬一頁面C也指向頁面A,那么就是先雞后蛋的問題了。
上面和我們通常的鄰接矩陣定義有點不一樣,通常是存在i到j的弧,那么gij=1,上面相反。不過沒事,習慣就好。這里相當于變成了第一列在描述第一個節點,依此類推。
注意,前面說了,列是描述一個節點,所以除以出度,是列除以。
PageRank
其中I0應該是可以隨意初始化,最終會趨于穩定。你可以理解為,通過很多次迭代之后,穩定了下來,先雞后蛋解決了,穩定下來的那個I就是各個網頁的PageRank值,例如上述是第8個節點值最大,那么就意味著第8個網頁最重要。
總結
以上是生活随笔為你收集整理的(简单介绍)PageRank算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: css教程 school,CSS 教程
- 下一篇: 战舰V3适配oneos系列01:bsp适