基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究

基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究

ID:35065359

大?。?.07 MB

頁(yè)數(shù):54頁(yè)

時(shí)間:2019-03-17

基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究_第1頁(yè)
基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究_第2頁(yè)
基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究_第3頁(yè)
基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究_第4頁(yè)
基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究_第5頁(yè)
資源描述:

《基于改進(jìn)pagerank算法的網(wǎng)頁(yè)排序問(wèn)題研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、工學(xué)碩士學(xué)位論文基于改進(jìn)PageRank算法的網(wǎng)頁(yè)排序問(wèn)題研究周秋麗哈爾濱理工大學(xué)2016年3月國(guó)內(nèi)圖書(shū)分類號(hào):TP301工學(xué)碩士學(xué)位論文基于改進(jìn)PageRank算法的網(wǎng)頁(yè)排序問(wèn)題研究碩士研究生:周秋麗導(dǎo)師:李蘭英申請(qǐng)學(xué)位級(jí)別:工學(xué)碩士學(xué)科、專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)所在單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院答辯日期:2016年3月授予學(xué)位單位:哈爾濱理工大學(xué)ClassifiedIndex:TP301DissertationfortheMasterDegreeinEngineeringResearchonWebPageRankBasedonImprovedPageRankAlgorithmCandida

2、te:ZhouQiuliSupervisor:LiLanyingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈爾濱理工大學(xué)碩±學(xué)位論文原創(chuàng)性聲明,《巧十巧進(jìn)IaeRank算法的N1:學(xué)位本人鄭甫聲明:此處所捉史的碩.論義g—C》人在導(dǎo)師指導(dǎo)K,巧哈爾濱巧-火學(xué)攻讀碩學(xué)位期巧排巧問(wèn)題研究,是本問(wèn)獨(dú)義進(jìn)

3、巧研究X作所取利的成巧。踞本人所知,論文中除U巧明部分外不包工作做出克獻(xiàn)的個(gè)人和架體,含他人己發(fā)巧或撰馬過(guò)的研究成巧。對(duì)本文妍究均己化義中W明柳方式注明。本蘆明的法體結(jié)架將完全山木人承化。作者簽知^M期;加年巧日詞兩0臺(tái)多3哈爾濱理工大學(xué)碩古學(xué)位論文使用授權(quán)書(shū)Page民ank蔚法的網(wǎng)巧排巧問(wèn)題研巧》系本人住哈爾濱理I;大學(xué)《茲于改進(jìn)攻讀碩」:學(xué)伉期間在巧帥巧皆下完成的碩古學(xué)位論文。本論文的研免成巧巧哈^*義巧他單位的么義發(fā)表。本人完全爾鶴現(xiàn)X大學(xué)所巧,本論文的研究?jī)?nèi)蔣不得^意學(xué)?;舨⑾蜥旉P(guān)浪巧」、,問(wèn)丫解哈爾:火學(xué)關(guān)^保巧使用學(xué)位論義的規(guī)化’?木人

4、授化哈爾濱理.1?大學(xué)部N化交論文和電子版木,化許論文被盜閱和借閱采用影印,可W公化論文的全郁或部分內(nèi)、縮印或巧他復(fù)制手段保巧論文韓。本學(xué)位論義姑干-密朽適用授權(quán)B。保密□,化年解不保密。[3巧么Jl上相應(yīng)方框內(nèi)打VL:)(:年3口作者雜名:礦n期如追島獻(xiàn)六/?氣期:年巧H巧師綜名11;F>占多巧基于改進(jìn)PageRank算法的網(wǎng)頁(yè)排序問(wèn)題研究摘要現(xiàn)今互聯(lián)網(wǎng)信息技術(shù)迅猛發(fā)展,似乎在一夜之間,大數(shù)據(jù)(BigData)變成一個(gè)最流行的詞匯。用戶在利用搜索引擎便捷獲取各類信息的同時(shí),也面臨著如何從海量數(shù)據(jù)中剔除那些影響信息檢索效率及準(zhǔn)確度的冗余信息的問(wèn)

5、題。在一般情況下,鑒于用戶只關(guān)注返回目標(biāo)網(wǎng)頁(yè)的前幾頁(yè),因此對(duì)搜索結(jié)果進(jìn)行網(wǎng)頁(yè)排序,改善搜索質(zhì)量,提高用戶滿意度顯得尤為重要。對(duì)于網(wǎng)頁(yè),除了文本信息,頁(yè)面間的鏈接結(jié)構(gòu)也是人們獲取有用信息的重要途徑。經(jīng)典的網(wǎng)頁(yè)排序算法---PageRank正是使用網(wǎng)頁(yè)間的鏈接結(jié)構(gòu)對(duì)各網(wǎng)頁(yè)的權(quán)重值進(jìn)行迭代計(jì)算,很大程度上提高了對(duì)網(wǎng)頁(yè)權(quán)重計(jì)算的精準(zhǔn)度。但是PageRank算法仍存在許多待研究及待突破的不足,開(kāi)展相關(guān)研究具有重要應(yīng)用價(jià)值。本文首先闡述了基于MapReduce的PageRank算法的研究背景和意義,然后對(duì)該算法的國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了分析總結(jié)。在此基礎(chǔ)上,著重分析出算法中影響性能和準(zhǔn)確度的關(guān)鍵因素,即

6、迭代次數(shù)和“主題漂移”,進(jìn)而提出了改進(jìn)算法:子圖估算PageRank網(wǎng)頁(yè)排序算法及個(gè)性化智能推薦的權(quán)值分配方法。然后對(duì)所改進(jìn)算法進(jìn)行理論分析,包括算法的迭代次數(shù),時(shí)間復(fù)雜度和準(zhǔn)確性。最后,在MapReduce編程模型上實(shí)現(xiàn)PageRank算法及其改進(jìn)算法,并通過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)比分析證明算法的合理性、有效性。與傳統(tǒng)算法相比,改進(jìn)后的算法時(shí)間復(fù)雜度低,迭代次數(shù)少,準(zhǔn)確度較高。關(guān)鍵詞網(wǎng)頁(yè)排序;MapReduce;PageRank算法;子圖;用戶習(xí)性愛(ài)好-I-ResearchonWebPageRankBasedonImprovedPageRankAlgorithmAbstractWiththerap

7、iddevelopmentoftheInternetinformationtechnologytoday,itseemsthatovernight,bigdata(BigData)becomesoneofthemostpopularvocabulary.Althoughuserscanobtainallkindsofinformationbyusingsearchenginesconveniently,theyarealsoface

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。