基于web挖掘的個(gè)性化推薦算法研究

基于web挖掘的個(gè)性化推薦算法研究

ID:33627831

大小:977.19 KB

頁(yè)數(shù):86頁(yè)

時(shí)間:2019-02-27

基于web挖掘的個(gè)性化推薦算法研究_第1頁(yè)
基于web挖掘的個(gè)性化推薦算法研究_第2頁(yè)
基于web挖掘的個(gè)性化推薦算法研究_第3頁(yè)
基于web挖掘的個(gè)性化推薦算法研究_第4頁(yè)
基于web挖掘的個(gè)性化推薦算法研究_第5頁(yè)
資源描述:

《基于web挖掘的個(gè)性化推薦算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、ResearchonapersonalizedrecommendationalgorithmbasedonWebminingThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByZhangXiaoleiSupervisor:Prof.SunZhixinFebruary2014萬(wàn)方數(shù)據(jù)南京郵電大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工

2、作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過(guò)的研究成果,也不包含為獲得南京郵電大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過(guò)的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示了謝意。本人學(xué)位論文及涉及相關(guān)資料若有不實(shí),愿意承擔(dān)一切相關(guān)的法律責(zé)任。研究生簽名:_____________日期:____________南京郵電大學(xué)學(xué)位論文使用授權(quán)聲明本人授權(quán)南京郵電大學(xué)可以保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子文檔;允許論文

3、被查閱和借閱;可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索;可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本學(xué)位論文。本文電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。論文的公布(包括刊登)授權(quán)南京郵電大學(xué)研究生院辦理。涉密學(xué)位論文在解密后適用本授權(quán)書。研究生簽名:____________導(dǎo)師簽名:____________日期:_____________萬(wàn)方數(shù)據(jù)摘要隨著IT技術(shù)、web2.0技術(shù)以及云計(jì)算技術(shù)等的不斷發(fā)展,信息超載問題使人們?cè)诿鎸?duì)海量數(shù)據(jù)尋找滿足自己需求的信息時(shí)變得手足無(wú)措;同時(shí),信息檢索個(gè)

4、性缺失問題是用戶體驗(yàn)下降,系統(tǒng)用戶流失的重要原因之一。本文介紹個(gè)性化推薦技術(shù)對(duì)解決這兩大問題的作用與方法,并通過(guò)分析協(xié)同過(guò)濾算法思想原理及其所存在的不足,提出基于Web挖掘的個(gè)性化推薦算法,提高推薦系統(tǒng)的推薦質(zhì)量與性能。為了解決傳統(tǒng)的協(xié)同過(guò)濾算法中所存在的數(shù)據(jù)稀疏性、“冷啟動(dòng)”以及用戶參與度高等問題,引入Web使用挖掘技術(shù),通過(guò)挖掘用戶的Web日志,了解用戶的行為模式、興趣愛好并構(gòu)建“用戶-項(xiàng)目”興趣度矩陣,改變協(xié)同過(guò)濾算法的數(shù)據(jù)采集方式和數(shù)據(jù)表現(xiàn)形式:由顯示用戶評(píng)分轉(zhuǎn)變?yōu)殡[式用戶項(xiàng)目偏好度;其次,為了解

5、決傳統(tǒng)的協(xié)同過(guò)濾算法中相似度計(jì)算方法鄰居誤判問題、無(wú)法應(yīng)對(duì)新用戶或新項(xiàng)目“冷啟動(dòng)”問題等,引入單點(diǎn)作用度機(jī)制,從“用戶-項(xiàng)目”興趣度矩陣整體角度,考察用戶向量的每個(gè)分量在計(jì)算用戶相似度過(guò)程中的作用并加權(quán)影響相似度計(jì)算結(jié)果;最后,為了優(yōu)化傳統(tǒng)的協(xié)同過(guò)濾算法中鄰居集產(chǎn)生的方法,算法衡量用戶間項(xiàng)目推薦重要度的差異,對(duì)目標(biāo)用戶的相似用戶集進(jìn)行過(guò)濾產(chǎn)生最優(yōu)鄰居集。本文采集南京郵電大學(xué)Web服務(wù)器日志數(shù)據(jù)并對(duì)其進(jìn)行Web使用挖掘,構(gòu)建“用戶-項(xiàng)目”興趣度矩陣作為實(shí)驗(yàn)數(shù)據(jù)源,對(duì)基于Web挖掘的個(gè)性化推薦算法進(jìn)行實(shí)驗(yàn)仿真

6、與測(cè)試,使用MAE、覆蓋率、精確率和召回率四個(gè)算法評(píng)估指標(biāo)將其與傳統(tǒng)的基于PC的協(xié)同過(guò)濾算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明,基于Web挖掘的個(gè)性化推薦算法具有更高的推薦質(zhì)量。綜上所述,基于Web挖掘的個(gè)性化推薦算法通過(guò)分析傳統(tǒng)的協(xié)同過(guò)濾算法所存在的問題,從數(shù)據(jù)源獲取、相似度計(jì)算方法和鄰居產(chǎn)生方法三個(gè)方面對(duì)其進(jìn)行改進(jìn),引進(jìn)Web挖掘技術(shù)、單點(diǎn)作用度機(jī)制和推薦重要度機(jī)制提高推薦結(jié)果的可靠性和準(zhǔn)確性并得到了實(shí)驗(yàn)驗(yàn)證。關(guān)鍵詞:個(gè)性化推薦,協(xié)同過(guò)濾,Web挖掘,單點(diǎn)作用度,推薦重要度I萬(wàn)方數(shù)據(jù)AbstractWiththe

7、developmentofITtechnology,web2.0technologyandcloudcomputingtechnology,ononehand,theproblemofinformationoverloadmakeitdifficultthepeoplesearchinformationtosatisfiytheirneeds;ontheotherhand,thelackofpersonalityofInformationRetrivalreducestheuserexperiencean

8、dleadstotheuserchurn.Thethesisintroducesthepersonalizedrecommendationtechnologyandexplainsitseffectandmethodtosolvetheaboveproblems;elaboratesthetheoryofcollaborativefilteringandanalyzesitsshortages;presentsapersona

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。