資源描述:
《基于mapreduce-hadoop的lbsn興趣點(diǎn)推薦算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、分類號(hào)TP391密級(jí)公開UDC004.62學(xué)位論文編號(hào)D-10617-308-(2016)-02034重慶郵電大學(xué)碩士學(xué)位論文中文題目基于MapReduce的LBSN興趣點(diǎn)推薦算法研究英文題目TheLBSNPOIRecommendationAlgorithmBasedonMapReduce學(xué)號(hào)S130201036姓名李海廣學(xué)位類別工學(xué)碩士學(xué)科專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)指導(dǎo)教師袁正午教授完成日期2016年5月26日獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含他人已經(jīng)發(fā)表或撰寫過(guò)的研究成果,也不包含為獲得重
2、慶郵電大學(xué)或其他單位的學(xué)位或證書而使用過(guò)的材料。與我一同工作的人員對(duì)本文研究做出的貢獻(xiàn)均已在論文中作了明確的說(shuō)明并致以謝意。作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本人完全了解重慶郵電大學(xué)有權(quán)保留、使用學(xué)位論文紙質(zhì)版和電子版的規(guī)定,即學(xué)校有權(quán)向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文,允許論文被查閱和借閱等。本人授權(quán)重慶郵電大學(xué)可以公布本學(xué)位論文的全部或部分內(nèi)容,可編入有關(guān)數(shù)據(jù)庫(kù)或信息系統(tǒng)進(jìn)行檢索、分析或評(píng)價(jià),可以采用影印、縮印、掃描或拷貝等復(fù)制手段保存、匯編本學(xué)位論文。(注:保密的學(xué)位論文在解密后適用本授權(quán)書。)作者簽名:導(dǎo)師簽名:日期:年月日日期:年月日重慶郵電大學(xué)碩士學(xué)位論文摘要摘要移動(dòng)互聯(lián)網(wǎng)的高
3、速發(fā)展和快速普及使人們養(yǎng)成了隨時(shí)隨地上網(wǎng)的習(xí)慣,4G技術(shù)的快速發(fā)展和應(yīng)用更是使這種上網(wǎng)習(xí)慣得到鞏固和加強(qiáng),這也催生出了一種新的互聯(lián)網(wǎng)商業(yè)模式:基于位置的社交網(wǎng)絡(luò)服務(wù)?;谖恢玫纳缃痪W(wǎng)絡(luò)服務(wù)提供商給用戶在社交平臺(tái)上提供簽到服務(wù),這也是一種位置共享服務(wù),當(dāng)一個(gè)社交網(wǎng)絡(luò)用戶發(fā)布自己位置后,該用戶的好友可以在社交平臺(tái)上看到這個(gè)位置及這個(gè)位置所代表的商家,好友的消費(fèi)決策會(huì)因此產(chǎn)生一定的改變。正是由于這個(gè)原因,當(dāng)社交網(wǎng)絡(luò)服務(wù)提供商收集到足夠多的簽到數(shù)據(jù)后就可以利用個(gè)人偏好和好友關(guān)系對(duì)用戶進(jìn)行位置推薦。當(dāng)前的位置推薦算法主要是結(jié)合用戶的簽到位置和簽到時(shí)間使用協(xié)同過(guò)濾推薦方法為用戶推薦感興趣的地點(diǎn),然而在對(duì)簽
4、到點(diǎn)進(jìn)行聚類時(shí)使用的密度聚類方法大多時(shí)間復(fù)雜度很高,對(duì)時(shí)間維度的處理也比較粗略,因此本文在運(yùn)行速度和推薦準(zhǔn)確度兩個(gè)方面對(duì)傳統(tǒng)的興趣點(diǎn)推薦算法進(jìn)行改進(jìn)。首先,本文引入網(wǎng)格劃分思想對(duì)DBCSAN密度聚類算法進(jìn)行改進(jìn),使聚類的對(duì)象不再是單個(gè)的簽到點(diǎn),而是一個(gè)個(gè)包含很多簽到點(diǎn)的網(wǎng)格,每個(gè)網(wǎng)格在裝入簽到點(diǎn)之后即判斷其是不是稠密網(wǎng)格,這樣以來(lái)大大減少了判斷一個(gè)聚類對(duì)象是否是稠密簽到點(diǎn)的時(shí)間,而且使聚類對(duì)象的遍歷數(shù)量得到了很大的縮減。在對(duì)時(shí)間維度的處理方面,本文按照人們的生活工作時(shí)間規(guī)律將時(shí)間維度劃分為若干個(gè)時(shí)間段然后進(jìn)行聚類,而不是按照傳統(tǒng)的連續(xù)時(shí)間聚類,這種改進(jìn)使推薦算法計(jì)算出的用戶相似度更準(zhǔn)確。最后本
5、文采用MapReduce對(duì)基于網(wǎng)格的聚類算法進(jìn)行改進(jìn),從而進(jìn)一步提高推薦算法的運(yùn)行速度。通過(guò)將傳統(tǒng)的興趣點(diǎn)推薦算法、改進(jìn)后的基于網(wǎng)格的興趣點(diǎn)推薦算法和基于MapReduce的興趣點(diǎn)推薦算法進(jìn)行實(shí)驗(yàn)對(duì)比,證明了本文的改進(jìn)使推薦速度和推薦精度兩個(gè)方面都有所提升。關(guān)鍵詞:簽到位置,簽到時(shí)間,聚類,網(wǎng)格,并行化56重慶郵電大學(xué)碩士學(xué)位論文AbstractAbstractTherapiddevelopmentandrapidspreadofmobileInternetmakepeopledevelopahabitofsurfingtheInternetanytimeandanywhere,andther
6、apiddevelopmentandapplicationof4Gtechnologymakethissurfinghabitstobeconsolidatedandstrengthened,whichalsogavebirthtoanewInternetbusinessmodel:Location-basedSocialNetworkingService.Location-basedSocialNetworkingServiceprovidersprovidecheck-inservicetousersonthesocialnetworkplatform,whichisalocationsh
7、aringservice.Afterasocialnetworkuserpublishedhisownlocation,hisfriendscanseethislocationandthebusinessesrepresentedbythislocationonthesocialnetworkplatform.Suchbehaviorwouldhavesomeimpactonhisfriends'