資源描述:
《web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究 》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究〔摘要〕當(dāng)今互聯(lián)網(wǎng)擁有海量的數(shù)據(jù),如何對(duì)這些Web上的數(shù)據(jù)進(jìn)行挖掘提取有用的模式,輔助企業(yè)獲得成功,是一個(gè)刻不容緩的問(wèn)題。本文對(duì)Web數(shù)據(jù)挖掘的基本內(nèi)容和相應(yīng)的技術(shù)作了介紹,并對(duì)Web數(shù)據(jù)挖掘在電子商務(wù)中可應(yīng)用的范圍作了說(shuō)明?! 碴P(guān)鍵字〕Web數(shù)據(jù)挖掘、電子商務(wù) 引言 在電子商務(wù)領(lǐng)域,通過(guò)Web數(shù)據(jù)挖掘,不僅可以從大量多種多樣信息的Web頁(yè)面中提取出我們需要的有用的知識(shí),還可以得到關(guān)于群體用戶訪問(wèn)行為和方式的普遍知識(shí),用以改進(jìn)Web服務(wù)設(shè)計(jì)。更重要的是,通過(guò)對(duì)用戶特征的理
2、解和分析,如對(duì)用戶訪問(wèn)行為、頻度、內(nèi)容等的分折,提取出用戶的特征,從而為用戶定制個(gè)性化的界面,有助于開(kāi)展有針對(duì)性的電子商務(wù)活動(dòng)。[1][2] 1.Web數(shù)據(jù)挖掘簡(jiǎn)介 當(dāng)今Web上存在著大量的數(shù)據(jù),獲取有用信息成為人們關(guān)注的焦點(diǎn)。但Web是無(wú)結(jié)構(gòu)的、動(dòng)態(tài)的,Web頁(yè)面極其復(fù)雜。這樣就使得人們從成千上萬(wàn)的Web站點(diǎn)中找到有用的數(shù)據(jù)變得比較困難。于是,人們就越來(lái)越關(guān)注如何開(kāi)發(fā)和利用Web上的數(shù)據(jù)資源?! eb數(shù)據(jù)挖掘就是解決上述問(wèn)題的一個(gè)途徑。當(dāng)數(shù)據(jù)挖掘技術(shù)應(yīng)用于網(wǎng)絡(luò)環(huán)境下的Web中就成為Web數(shù)據(jù)挖掘。Web數(shù)
3、據(jù)挖掘就是從Web文檔和Web活動(dòng)中抽取感興趣的潛在的有用模式和隱藏的信息?! eb挖掘可以分為三類(lèi):Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用挖掘[3]。Web內(nèi)容挖掘是用來(lái)提取文字、圖片或其他組成網(wǎng)頁(yè)內(nèi)容成分的信息;Web結(jié)構(gòu)挖掘是用來(lái)提取網(wǎng)絡(luò)的拓?fù)湫畔?,即網(wǎng)頁(yè)之間的銜接的信息;Web使用挖掘是用來(lái)提取關(guān)于客戶如何運(yùn)用瀏覽器瀏覽和使用這些銜接的信息?! ?.Web數(shù)據(jù)挖掘的技術(shù)介紹 從電子商務(wù)的角度出發(fā),進(jìn)行Web上的數(shù)據(jù)挖掘,主要就是進(jìn)行客戶訪問(wèn)信息的挖掘,得到客戶端瀏覽行為和訪問(wèn)模式,從而找到有用的市
4、場(chǎng)信息。在Web數(shù)據(jù)挖掘的模式發(fā)現(xiàn)中,常有以下幾種數(shù)據(jù)挖掘技術(shù)的使用: 2.1路徑分析:使用路徑分析技術(shù)進(jìn)行Web使用模式挖掘,最常用的就是網(wǎng)站結(jié)構(gòu)圖。它可以被用于判定在一個(gè)web站點(diǎn)中最頻繁訪問(wèn)的路徑,還有一些其他的有關(guān)路徑的信息通過(guò)路徑分析可以得出,比如:70%的用戶端在訪問(wèn)/class/book2時(shí),是從/class開(kāi)始,經(jīng)過(guò)/class/new,/class/book,/class/book1,最后才到的/class/book2。這條規(guī)則說(shuō)明在/class/book2頁(yè)面上有有用的信息,但因?yàn)榭蛻魧?duì)站點(diǎn)進(jìn)行的是
5、迂回繞行的訪問(wèn),所以這個(gè)有用信息并不明顯。如果這個(gè)頁(yè)面對(duì)網(wǎng)站來(lái)說(shuō)比較重要,可以通過(guò)此路徑分析改進(jìn)頁(yè)面及網(wǎng)站結(jié)構(gòu)的設(shè)計(jì),從使客戶更容易的訪問(wèn)/class/book2?! ?.2關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則主要關(guān)注事物內(nèi)的關(guān)系。在Web使用挖掘中,關(guān)聯(lián)規(guī)則挖掘就是挖掘出用戶在一個(gè)訪問(wèn)期間從服務(wù)器上訪問(wèn)的頁(yè)面/文件之間的關(guān)系,找出在某一次服務(wù)器會(huì)話中最經(jīng)常一起出現(xiàn)的相關(guān)畫(huà)面。例如,40%的客戶再購(gòu)買(mǎi)了CD之后又購(gòu)買(mǎi)了CD清潔劑。利用挖掘出來(lái)的這些相關(guān)性,我們可以更好的組織站點(diǎn),實(shí)施有效的市場(chǎng)策略?! ?.3序列模式:序列模式挖掘就是挖掘
6、出交易集之間有時(shí)間序列關(guān)系的模式,在Web日志中發(fā)現(xiàn)所有滿足用戶規(guī)定的最小支持度的大序列模式。序列模式的發(fā)現(xiàn)就是在時(shí)間戳有序的事務(wù)集中,找到那些“一些項(xiàng)跟隨另一個(gè)項(xiàng)”的內(nèi)部事務(wù)模式。例如:在/class/book1上進(jìn)行過(guò)在線定購(gòu)的顧客,有60%的人在過(guò)去15天內(nèi)也在/class/bag1處下過(guò)訂單。發(fā)現(xiàn)序列模式能夠便于進(jìn)行電子商務(wù)的組織預(yù)測(cè)客戶的訪問(wèn)模式,對(duì)客戶開(kāi)展有針對(duì)性的廣告服務(wù)。通過(guò)系列模式的發(fā)現(xiàn),能夠在服務(wù)器方選取有針對(duì)性的頁(yè)面,以滿足訪問(wèn)者的特定要求?! ?.4分類(lèi)規(guī)則:分類(lèi)技術(shù)主要是根據(jù)用戶群的特征挖掘用戶
7、群的訪問(wèn)特征。在Web數(shù)據(jù)挖掘中,分類(lèi)規(guī)則的發(fā)現(xiàn)就是給出識(shí)別一個(gè)特殊群體的公共屬性的描述,這個(gè)描述可以用來(lái)分類(lèi)新的項(xiàng),例如:在/class/book2進(jìn)行過(guò)在線定購(gòu)的顧客中有55%是20-30歲生活在南方的年輕人。得到這一分類(lèi)后,就可以進(jìn)行適合這一類(lèi)客戶的商務(wù)活動(dòng)?! ?.5聚類(lèi):聚類(lèi)技術(shù)是對(duì)符合某一訪問(wèn)規(guī)律特征的用戶進(jìn)行用戶特征挖掘。聚類(lèi)分析可以從Web訪問(wèn)信息數(shù)據(jù)中聚集出具有相似特性的那些客戶。在Web事務(wù)日志中,聚類(lèi)顧客信息或數(shù)據(jù)項(xiàng)能夠便于開(kāi)發(fā)和執(zhí)行未來(lái)的市場(chǎng)戰(zhàn)略。這種市場(chǎng)戰(zhàn)略包括:自動(dòng)給一個(gè)特定的顧客聚類(lèi)發(fā)送銷(xiāo)售
8、郵件,為一個(gè)顧客聚類(lèi)動(dòng)態(tài)地改變一個(gè)特殊的站點(diǎn)等。3.在電子商務(wù)中的應(yīng)用介紹 盡管.DataMining:ConceptsandTechniques[J].SanMateoCA:MorganKaufmann,2000