PageRank算法

PageRank算法

ID:39222659

大?。?92.71 KB

頁(yè)數(shù):3頁(yè)

時(shí)間:2019-06-27

PageRank算法_第1頁(yè)
PageRank算法_第2頁(yè)
PageRank算法_第3頁(yè)
資源描述:

《PageRank算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、PageRank算法[編輯]簡(jiǎn)單的假設(shè)一個(gè)由4個(gè)頁(yè)面組成的小團(tuán)體:A,B,C和D。如果所有頁(yè)面都鏈向A,那么A的PR(PageRank)值將是B,C及D的和。繼續(xù)假設(shè)B也有鏈接到C,并且D也有鏈接到包括A的3個(gè)頁(yè)面。一個(gè)頁(yè)面不能投票2次。所以B給每個(gè)頁(yè)面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的PageRank上。換句話說(shuō),根據(jù)鏈出總數(shù)平分一個(gè)頁(yè)面的PR值。最后,所有這些被換算為一個(gè)百分比再乘上一個(gè)系數(shù)q。由于下面的算法,沒(méi)有頁(yè)面的PageRank會(huì)是0。所以,Google通過(guò)數(shù)學(xué)系統(tǒng)給了每個(gè)頁(yè)面一個(gè)最小值。所以一個(gè)頁(yè)面的PageRank是由其他頁(yè)面的

2、PageRank計(jì)算得到。Google不斷的重復(fù)計(jì)算每個(gè)頁(yè)面的PageRank。如果給每個(gè)頁(yè)面一個(gè)隨機(jī)PageRank值(非0),那么經(jīng)過(guò)不斷的重復(fù)計(jì)算,這些頁(yè)面的PR值會(huì)趨向于正常和穩(wěn)定。這就是搜索引擎使用它的原因。[編輯]完整的這個(gè)方程式引入了隨機(jī)瀏覽的概念,即有人上網(wǎng)無(wú)聊隨機(jī)打開一些頁(yè)面,點(diǎn)一些鏈接。一個(gè)頁(yè)面的PageRank值也影響了它被隨機(jī)瀏覽的概率。為了便于理解,這里假設(shè)上網(wǎng)者不斷點(diǎn)網(wǎng)頁(yè)上的鏈接,最終到了一個(gè)沒(méi)有任何鏈出頁(yè)面的網(wǎng)頁(yè),這時(shí)候上網(wǎng)者會(huì)隨機(jī)到另外的網(wǎng)頁(yè)開始瀏覽。為了對(duì)那些有鏈出的頁(yè)面公平,(這裡的被稱為阻尼系數(shù)(dampingfactor)

3、,其意義是,在任意時(shí)刻,用戶到達(dá)某頁(yè)面后并繼續(xù)向后瀏覽的概率。就是用戶停止點(diǎn)擊,隨機(jī)跳到新URL的概率)的算法被用到了所有頁(yè)面上,估算頁(yè)面可能被上網(wǎng)者放入書簽的概率。所以,這個(gè)等式如下:是被研究的頁(yè)面,是鏈入頁(yè)面的數(shù)量,是鏈出頁(yè)面的數(shù)量,而N是所有頁(yè)面的數(shù)量。PageRank值是一個(gè)特殊矩陣中的特征向量。這個(gè)特征向量為R是等式的答案如果不鏈向,而且對(duì)每個(gè)j都成立時(shí),等于0這項(xiàng)技術(shù)的主要缺點(diǎn)是舊的頁(yè)面等級(jí)會(huì)比新頁(yè)面高。因?yàn)榧词故欠浅:玫男马?yè)面也不會(huì)有很多上游鏈接,除非它是某個(gè)站點(diǎn)的子站點(diǎn)。這就是PageRank需要多項(xiàng)算法結(jié)合的原因。PageRank似乎傾向于維基

4、百科頁(yè)面,在條目名稱的搜索結(jié)果中總在大多數(shù)或者其他所有頁(yè)面之前。原因主要是維基百科內(nèi)相互的鏈接很多,并且有很多站點(diǎn)鏈入。Google經(jīng)常處罰惡意提高PageRank的行為,至於其如何區(qū)分正常的鏈接交換和不正常的鏈接堆積仍然是商業(yè)機(jī)密

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。