資源描述:
《基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、南昌航空工業(yè)學院碩士學位論文基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)應(yīng)用研究姓名:游文申請學位級別:碩士專業(yè):@指導教師:葉水生20060901基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)應(yīng)用研究AnApplicationStudyofE-commerceRecommendationSystemBasedonDataMining作者:游文摘要導師:葉水生教授隨著電子商務(wù)的快速發(fā)展,許多電子商務(wù)網(wǎng)站上的商品數(shù)量和品種大量增加,用戶的數(shù)據(jù)訪問量急劇增長,這樣也給電子商務(wù)推薦帶來了很多挑戰(zhàn)。面對這些挑戰(zhàn),許多學者在現(xiàn)有推薦方法的基礎(chǔ)上設(shè)計并提出了各種新的推薦思想和推薦方法。本文采用先進
2、的WEB數(shù)據(jù)挖掘技術(shù)為電子商務(wù)系統(tǒng)提供推薦服務(wù),我們設(shè)計了一個電子商務(wù)推薦系統(tǒng)AutoRec。它支持多種類型的推薦(包括關(guān)聯(lián)規(guī)則算法、簡單近鄰算法等),具有獨立于電子商務(wù)系統(tǒng)的推薦引擎。我們在分析比較了各種算法的優(yōu)劣的基礎(chǔ)之上,設(shè)計了一個基于關(guān)聯(lián)規(guī)則項目預(yù)測的協(xié)作過濾算法,該算法綜合了關(guān)聯(lián)規(guī)則算法和近鄰算法(協(xié)作過濾算法中的一種)的優(yōu)點,為解決推薦系統(tǒng)中數(shù)據(jù)集稀疏的問題提出了新的思路,通過測試在推薦效果和推薦效率上有一定改進。關(guān)鍵詞:WEB數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則、協(xié)作過濾、電子商務(wù)、推薦系統(tǒng)、近鄰算法Abstract:Withtherapiddevelopmento
3、fE-Commerce,alargenumberofcommoditieswithdifferentvarietiesaddintothelistofmanyE-Commercewebsite,whichtakesgreatchallengestoE-Commercerecommendation.Facetothesechallenges,somescholarsputsomenewrecommendationideasandmethodsforwardbasedontheexistingmethods.Inthethesis,wedesignedanintel
4、ligentE-CommercerecommendationsystemAutoRec,whichadoptedadvanceddataminingtechniquestoproviderecommendationservicesforE-Commerce.Thesystemsupportsmulti-recommendation(includingAssociationRulealgorithm,SimpleNeighboralgorithmetc.)andhasindependentenginetoE-Commercesystem
5、.Wealsodesignedanewalgorithm,calledAssociationRuleItemBasedCollaborationAlgorithm(ARIBCF),whichintegratedassociationrulealgorithmandneighboralgorithm’svirtues.Ithelpssolvethesparsityproblemofrecommendationalgorithm,andperformswelloneffectandefficiency.Keywords:WEBDataMining;Associati
6、onRule;CollaborativeFiltering;E-Commerce;RecommendationSystem;NeighborAlgorithm基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)應(yīng)用研究第1章引言第1章引言1.1問題的提出隨著WWW上可用信息資源的爆炸性增長,越來越有必要給用戶提供某種工具來幫助用戶定位、分析和評價所需的信息。另一方面,伴著電子商務(wù)等網(wǎng)上交易的成功啟用,商業(yè)機構(gòu)也有必要追蹤和分析用戶的訪問模式,以利于更好的、更有針對性的進行一些宣傳和促銷活動。將數(shù)據(jù)挖掘和WWW這兩個領(lǐng)域結(jié)合起來,就形成了當前的另一熱門課題—Web數(shù)據(jù)挖掘技術(shù)
7、。廣泛的說,它是指從WorldWideWeb上發(fā)現(xiàn)和分析出有用的信息,包括從Internet上數(shù)百萬的站點及在線數(shù)據(jù)庫中進行信息檢索和資源發(fā)現(xiàn),以及從一個或多個Web服務(wù)器上分析和發(fā)現(xiàn)用戶訪問模式等方面。1.1.1Web數(shù)據(jù)挖掘概述基于WWW的數(shù)據(jù)挖掘有其自身的特點,其技術(shù)的復雜程度也更高。這是因為WWW上的數(shù)據(jù)是無序的,非結(jié)構(gòu)的。WWW是一個由多個無結(jié)構(gòu)的,通過超鏈接的數(shù)據(jù)源所構(gòu)成的、并且不斷更新和變化的系統(tǒng)。因此,Web挖掘必須考慮到Web系統(tǒng)動態(tài)和異構(gòu)的特征,以及Web數(shù)據(jù)非結(jié)構(gòu)的特征。另外,Web固有的超鏈接結(jié)構(gòu)以及Web用戶訪問模式也會為訪問者提供一些
8、有用的信息。網(wǎng)站的所有訪