資源描述:
《基于廣義內(nèi)容概率潛在語義分析模型的推薦》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、于廣義內(nèi)容概率潛在語義分析模型的推薦摘要:針對推薦系統(tǒng)中存在新項目及準確性難以把握等問題,提出一種基于廣義內(nèi)容概率潛在語義模型的推薦方法。該方法以概率潛在語義模型為基礎,引入兩組潛在變量及項目特征來建立廣義內(nèi)容概率潛在語義模型。該模型中兩組潛在變量分別表示用戶群體和項目群體,項目特征根據(jù)實際情況以特征詞的形式進行表示,且通過不對稱學習算法完成未知參數(shù)的訓練及預測。利用三個不同的數(shù)據(jù)集對所提方法進行實驗驗證,結果表明該方法具有良好的項目推薦品質。關鍵詞:概率潛在語義;項目特征;最大期望算法;潛在變量;項目推薦0引言隨著互聯(lián)網(wǎng)技術的發(fā)展及普及,如何根據(jù)需求
2、特征將符合消費期望的信息自動推薦給用戶,并為其提供中長期的意向資訊,已成為基于互聯(lián)網(wǎng)應用的重要技術發(fā)展方向之一。信息推薦技術的本質在一定程度上可理解為信息的主動協(xié)同過濾技術,該技術可以分為基于內(nèi)存的協(xié)同過濾和基于模型的協(xié)同過濾。在基于內(nèi)存的協(xié)同過濾技術方面,其主要研究內(nèi)容集中于基于用戶的協(xié)同過濾和基于項目的協(xié)同過濾。例如,Kim等[1]提出了基于協(xié)同標簽的協(xié)同過濾方法來增強推薦的質量;Lee等[2]提出了兩種方法共同預測的協(xié)同過濾技術提高了推薦的準確性,并且該方法對稀疏的數(shù)據(jù)具有魯棒性。在基于模型的協(xié)同過濾研究方面,其模型主要包括貝葉斯網(wǎng)絡[3]、奇異
3、值分解[4]、潛在語義分析(LatentSemanticAnalysis,LSA)以及概率潛在語義分析(ProbabilitisticLatentSemanticAnalysis,PLSA)[5-6]等。其中,PLSA作為協(xié)同過濾的方法[6]不僅具有LSA方法的優(yōu)良品性,同時具有良好的概率理論基礎,因此能較好滿足項目推薦的信息過濾要求,但仍然存在某些不足,如在噪聲干擾或在小訓練樣本的情況下,PLSA可能出現(xiàn)過擬合[7],從而影響項目推薦的準確性,并同時存在不能對新項目進行預測推薦的問題?;赑LSA方法存在的問題,提出了基于廣義內(nèi)容PLSA模型的推薦方
4、法。該方法以PLSA模型為基礎,引入兩個潛在變量,即用戶群體和項目群體,同時引入項目的特征。廣義內(nèi)容PLSA模型的訓練采用不對稱學習的方法。實驗分別利用三個不同的數(shù)據(jù)集進行,并與其他方法進行實驗對比。結果表明,所提方法具有良好的項目推薦品質。4結語針對PLSA模型中存在的新項目難以推薦及推薦準確性較低等問題,引入了用戶組和項目組兩個潛在變量以及項目的特征,提出一種基于廣義內(nèi)容的推薦方法GCPLSA,并通過實驗與GPLSA、IBCF等方法進行了對比,分別從新項目和準確性兩個方面說明該方法具有良好的物品推薦品質。參考文獻:KIMHN,JIAT,HAI,et
5、al.Collaborativefilteringbasedoncollaborativetaggingforenhancingthequalityofrecommendation[J].ElectronicCommerceResearchandApplications,2010,9(1):73-83.[2]LEEJS,OLAFSSONS.Twowaycooperativepredictionforcollaborativefilteringrecommendations[J].ExpertSystemswithApplications,2009,36
6、(3):5353-5361.[3]WANGKB,TANY.AnewcollaborativefilteringrecommendationapproachbasedonnaiveBayesianmethod[C]//ProceedingsoftheSecondInternationalConferenceonAdvancesinSwarmIntelligence.Berlin:Springer,2011:218-227.楊陽,向陽,熊磊.基于矩陣分解與用戶近鄰模型的協(xié)同過濾推薦算法[J].計算機應用,2012,32(2):395-398.[5]宋曉雷,
7、王素格,李紅霞.基于概率潛在語義分析的詞匯情感傾向判別[J].中文信息學報,2011,25(2):89-93.[6]HOFMANNT.CollaborativefilteringviaGaussionproblisticlantentsemanticanalysis[C]//Proceedingsofthe26thAnnualInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.NewYork:ACM,2003:259-266[7]張玉芳,朱俊,熊忠陽
8、.改進的概率潛在語義分析下的文本聚類算法[J].計算機應用,2011,31(3):674-67