資源描述:
《工商管理基于Web挖掘的電子商務(wù)應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于Wcb挖掘的電子商務(wù)應(yīng)用研究基于Web挖掘的電子商務(wù)應(yīng)用研究是小柯論文網(wǎng)通過網(wǎng)絡(luò)搜集,并山木詁工作人員整理后發(fā)布的,基于Web挖掘的電子商務(wù)應(yīng)用研究是篇質(zhì)雖較高的學(xué)術(shù)論文,供木站訪問者學(xué)習(xí)和學(xué)術(shù)交流參考Z用,不可用于其他商業(yè)冃的,基于Web挖掘的電子商務(wù)應(yīng)用研究的論文版權(quán)歸原作者所有,因網(wǎng)絡(luò)整理,有些文章作者不詳,敬請諛解,如需轉(zhuǎn)摘,請注明岀處小柯論文網(wǎng),如果此論文無法滿足您的論文要求,您可以rfH青本站幫您代寫論文,以下是正文。L摘要]近年來,隨著lnternet/Web技術(shù)的快速普及和迅猛發(fā)展,使各種信息可以以非常低的成本在網(wǎng)絡(luò)上獲得,由于www在全球互連互通,可以從中取得的
2、數(shù)據(jù)量難以計算,而且WWW的發(fā)展趨勢繼續(xù)看好,特別是電了商務(wù)的蓬勃發(fā)展為網(wǎng)絡(luò)應(yīng)用提供了強人支持,如何在www這個全球最人的數(shù)據(jù)集合屮發(fā)現(xiàn)有用信息正在成為數(shù)據(jù)挖掘研究的熱點。[關(guān)鍵詞]web數(shù)據(jù)挖掘電子商務(wù)隨著以數(shù)據(jù)庫、數(shù)據(jù)倉庫等數(shù)據(jù)倉儲技術(shù)為基礎(chǔ)的信息系統(tǒng)在各行各業(yè)的應(yīng)用,使海量數(shù)據(jù)不斷產(chǎn)生。隨之而來的問題是如此多的數(shù)據(jù)讓人難以消化,無法從表面上看出他們所蘊涵的有用信息。如何從大量的數(shù)據(jù)中找到真正有用的信息成為人們關(guān)注的焦點,數(shù)據(jù)挖掘技術(shù)也正是伴隨著這種需求從研究走向應(yīng)用。近年來,隨著Internet/Web技術(shù)的快速普及和迅猛發(fā)展,使各種信息可以以非常低的成本在網(wǎng)絡(luò)上獲得,由于In
3、temet/WWW在全球互連互通,可以從屮取得的數(shù)據(jù)量難以計算,ifuTLIntenietAVWW的發(fā)展趨勢繼續(xù)看好,特別是電子商務(wù)的蓬勃發(fā)展為網(wǎng)絡(luò)應(yīng)用提供了強大支持,如何在WWW這個全球授大的數(shù)據(jù)集合中發(fā)現(xiàn)冇川信息無疑將成為數(shù)據(jù)挖掘研究的熱點。二、Web挖掘概述數(shù)據(jù)挖掘就是從數(shù)據(jù)庫中抽収隱含的、以前未知的、具有潛在應(yīng)用價值的信息的過程。Web挖掘是將數(shù)據(jù)挖掘的思想和方法應(yīng)用到Web頁面內(nèi)容、頁面Z間的結(jié)構(gòu)、用戶訪問信息等各種Web數(shù)據(jù)屮,從屮抽取隱含的、以前未知的、具有潛在應(yīng)用價值的信息。Web挖掘?qū)υ诤棋木W(wǎng)絡(luò)屮發(fā)現(xiàn)有價值的知識、改進網(wǎng)站設(shè)計、提供更好的網(wǎng)上服務(wù)有重要的作用。We
4、b挖掘是針對包括Web頁面內(nèi)容,貝面Z間的結(jié)構(gòu),用戶訪問信息等在內(nèi)的各種Web數(shù)據(jù)源。在一定基礎(chǔ)上應(yīng)川數(shù)據(jù)挖掘的方法以發(fā)現(xiàn)冇用的隱含的知識的過程。Web挖掘與傳統(tǒng)的數(shù)據(jù)挖掘相比有具自身的特點。Web本身是半結(jié)構(gòu)化或無結(jié)構(gòu)的數(shù)據(jù),缺乏機器可理解的語義Web挖掘的對象是大量,異質(zhì),分布的Web文檔,對Web服務(wù)器上的口志、用戶信息等數(shù)據(jù)所開展的挖掘工作也屬于Web數(shù)據(jù)挖掘的范疇。Web信息的多樣性決定了挖掘任務(wù)的多樣性。按照Web處理対象的不同,一?般將Web挖掘分為三類:Web內(nèi)容挖掘,Web結(jié)構(gòu)挖掘和Web使用記錄挖掘。1.Web內(nèi)容挖掘Web內(nèi)容挖掘是指對Web頁面及后臺交易數(shù)據(jù)庫
5、進行挖掘,從Web文檔內(nèi)容及其描述中的內(nèi)容信息屮獲取有價值的知識的過程。它是數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)信息處理上的應(yīng)用,主要方法有IR(informationretrieve)和數(shù)據(jù)庫方法。它乂可分為Web文本挖掘和Web多媒體挖掘兩種數(shù)據(jù)挖掘方式。Web內(nèi)容挖掘多為這種方式的挖掘,它和平常的平面文本挖掘的功能及方法比較類似。Web文檔多為HTML、XML等自然語言,因此可利用Web文檔屮的標記,利用這些信息可以提高Web文本挖掘的性能。在對Web文檔進行分類分析屮,可以基于一組預(yù)先分好的文檔為每一類文檔賦予一個類標簽。由于超鏈接里包括了有關(guān)頁面內(nèi)容的高質(zhì)量信息,因此可以利用這些信息対文檔進
6、行分類,并U這種分類比基于關(guān)鍵字的分類更加準確。隨著網(wǎng)絡(luò)帶寬的擴人,多媒體信息在網(wǎng)上迅速增加,這對Web內(nèi)容挖掘提出了新的要求。Web多媒體挖掘的挖掘上要是指基于音頻的挖掘、基于圖片的靜態(tài)圖像的挖掘和基于視頻的動態(tài)圖像的挖掘。2.Web結(jié)構(gòu)挖掘Web結(jié)構(gòu)挖掘是対Web的組織結(jié)構(gòu)和鏈接關(guān)系進行挖掘,從人為的鏈接關(guān)系中獲得有價值的知識。由于文檔Z間互連,WWW能提供除文檔內(nèi)容以外的有用信息。Web結(jié)構(gòu)挖掘通過分析一個網(wǎng)頁鏈接和被鏈接的網(wǎng)頁數(shù)量和對象,建立Web自身的鏈接結(jié)構(gòu)模式。這種模式可以用于網(wǎng)頁分類,并由此獲得有關(guān)不同頁面間的相似度和關(guān)聯(lián)度的信息。Web貝面除了包含貝面以外還包括一個
7、頁面指向另一個貝面的超鏈接。超鏈接里包含大雖人類潛在的語義,它可用于分析岀權(quán)威性語義。當(dāng)一個Web頁面的作者建立指向另一個頁面的指針時,可以看作是作者對另一個頁面的注解,即對另一個頁面的認可。把一個頁面的來白不同作者的注解收集起來,可以用來反應(yīng)頁面的重要性。這樣,Web結(jié)構(gòu)挖掘有助于用戶找到相關(guān)主題的權(quán)威站點。3.Web使用記錄挖掘Web使用記錄挖掘是対用戶訪問Web時在服務(wù)器上留下的訪問記錄進行挖掘。它通過挖掘WebFl志文件及其相關(guān)數(shù)據(jù)來發(fā)現(xiàn)用戶訪問W