資源描述:
《一種考慮雙重相似度的協(xié)同過濾推薦算法.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、第13卷第2期太原師范學(xué)院學(xué)報(自然科學(xué)版)Vo1.13No.22014年6月J0URNAIOFTAIYUANNORMALUNIVERSITY(NaturalScienceEdition)Jun.2014一種考慮雙重相似度的協(xié)同過濾推薦算法田野,張屹峰。(1.太原理.T-大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,山西太原030024;2.太原師范學(xué)院計算機(jī)中心,山西太原0300123.山西電力科學(xué)研究院電源中心,山西太原030001)[摘要]協(xié)同過濾算法為推薦系統(tǒng)提供了一種方法,但傳統(tǒng)的協(xié)同過濾方法推薦精度低.提出一種考慮用戶評分相似性的協(xié)同過濾算法,通過在皮爾遜相關(guān)系數(shù)
2、中加入項目數(shù)量相似度和用戶評分相似度兩個因素來計算用戶間的相似度,以產(chǎn)生更合理的鄰居用戶,提高推薦精度,完成對用戶的推薦,同時鄰居用戶的選取采用動態(tài)閾值設(shè)定方法.實驗結(jié)果表明,所提出的算法相比傳統(tǒng)方法選擇出的鄰居更為精確,推薦質(zhì)量更高.(關(guān)鍵詞]推薦系統(tǒng);協(xié)同過濾;相似度;項目數(shù)量相似度;用戶評分相似度(文章編號]1672-2027(2014)02—0058—05[中圖分類號]TP391(文獻(xiàn)標(biāo)識碼]A互聯(lián)網(wǎng)時代數(shù)據(jù)資源呈爆炸式增長,如何從海量數(shù)據(jù)中選擇滿足用戶的個性化需求已經(jīng)成為推薦領(lǐng)域內(nèi)迫切需要解決的問題.為了實現(xiàn)推薦功能,推薦系統(tǒng)需要根據(jù)已有用戶對資
3、源的評價,來預(yù)測目標(biāo)用戶對潛在資源的偏好.從1992年由Goldberg等人開發(fā)的第一個推薦系統(tǒng)Tapestry開始,隨著電子商務(wù)的發(fā)展,個性化推薦技術(shù)的研究取得了快速的發(fā)展和廣泛的應(yīng)用,各大型電子商務(wù)網(wǎng)站,如Amazon、淘寶網(wǎng)、當(dāng)當(dāng)網(wǎng)等,都采用了個性化推薦系統(tǒng).現(xiàn)有的推薦系統(tǒng)的技術(shù)有:關(guān)聯(lián)規(guī)則(AssociationRules)的推薦,基于內(nèi)容(Content—based)的推薦,協(xié)同過濾(CollaborativeFiltering)推薦和混合推薦(HybridRecommendation)技術(shù).其中協(xié)同過濾是推薦系統(tǒng)中應(yīng)用最為成功的技術(shù)之一,其基本
4、思想是分析興趣相似用戶的評價值,來預(yù)測目標(biāo)用戶對指定項目的喜好程度.協(xié)同過濾能有效地利用其他興趣相似用戶的評價信息,從而利用較少的用戶反饋,加快個性化學(xué)習(xí)的速度,同時利于發(fā)現(xiàn)用戶的隱藏興趣_1].協(xié)同過濾方法分為基于用戶的協(xié)同過濾方法[2和基于項目的協(xié)同過濾方法[3].基于用戶的方法考慮用戶的相似性,使用與目標(biāo)用戶興趣相似的用戶對待評價資源的綜合評價來預(yù)測目標(biāo)用戶對其評價,基于項目的方法考慮資源之間的相似性,使用目標(biāo)用戶評價過的資源集合來預(yù)測用戶可能感興趣的其他資源.皮爾遜系數(shù)法和向量空間相似度法是協(xié)同過濾技術(shù)中較常用的兩種計算相似度的方法,他們可以計算兩
5、個用戶或兩個項目的相似度,但是,傳統(tǒng)的協(xié)同過濾推薦算法存在弊端:僅僅依靠相似度作為選取目標(biāo)用戶的鄰居的指標(biāo),選出的鄰居不精確,推薦精度低.本文使用基于用戶的協(xié)同過濾方法,針對此問題,在皮爾遜相關(guān)系數(shù)中加入用戶選擇相似度和用戶評分相似度為鄰居用戶選取的兩個因素,更好地提高鄰居選取的質(zhì)量,進(jìn)而提高推薦精度.1相關(guān)工作針對推薦問題,許多研究者提出了相關(guān)的框架和解決思路,并取得較好的研究成果.文獻(xiàn)采用皮爾遜相關(guān)系數(shù)法確定用戶評價相似度,并基于用戶偏好對推薦信息進(jìn)行選擇,然而,皮爾遜相關(guān)系數(shù)雖然可以反映出兩個用戶對項目的相似程度,但在相同項目數(shù)量少時并不能體現(xiàn),如兩
6、個用戶僅有一個相同項目,則皮爾遜相關(guān)系數(shù)為1,這表明兩者高度相似,而事實卻相反,因此只有在相同項目大于l時,才能反映出其優(yōu)點.文獻(xiàn)[5]提出一種雙重鄰居選取策略的協(xié)同過濾推薦算法,根據(jù)用戶相似度計算結(jié)果,動態(tài)選取目標(biāo)用戶的興趣相似用戶集,并計算用戶間的信任度作為選取可信鄰居用戶的依據(jù),這種方法對鄰居選取采用了雙重收稿日期:2014—0卜23基金項目:山西省留學(xué)基金項目(2009—28),山西省自然科學(xué)基金項目(2009011022—2).作者簡介:田野(1980一),女,山西陽泉人,太原理工大學(xué)在讀博士,主要從事網(wǎng)絡(luò)安全、可信計算研究第2期田野等:一種考慮
7、雙重相似度的協(xié)同過濾推薦算法59計算策略,但計算時沒有考慮用戶對所選項目的評分相似性,因為兩個用戶對相同項目的評分差距越小,表明兩者對該項目的喜好程度越高.文獻(xiàn)[6]提出一種可信的服務(wù)選擇模型,針對目標(biāo)用戶本身的屬性特征及可信程度特征引入用戶相關(guān)性,利用層次分析法確定各因子權(quán)重,文獻(xiàn)E7]在可信web服務(wù)推薦上考慮了用戶評價相似度因素,得到可推薦用戶集合,以上兩種方法都考慮了對用戶本身或用戶評價,但在鄰居用戶時并沒有加入兩個用戶共同使用過的項目數(shù)量因素,這樣即使兩個用戶評價度相似,對共同評價數(shù)目很少,推薦度依然會高.本文針對以上兩個問題,提出一種考慮用戶評
8、分相似性的相似度度量方法,該方法加入用戶以往評價過的項目數(shù)量和用戶