數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文

數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文

ID:25603545

大?。?3.00 KB

頁(yè)數(shù):6頁(yè)

時(shí)間:2018-11-21

數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文_第1頁(yè)
數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文_第2頁(yè)
數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文_第3頁(yè)
數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文_第4頁(yè)
數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文_第5頁(yè)
資源描述:

《數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用論文【摘要】隨著信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)在信息的利用和提取中發(fā)揮著日益重要的作用。本文通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)以及圖書(shū)館個(gè)性化服務(wù)相關(guān)內(nèi)容的介紹,探討了數(shù)據(jù)挖掘在數(shù)字化圖書(shū)館中的應(yīng)用,說(shuō)明數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書(shū)館應(yīng)用的必要性,以及在提升圖書(shū)館服務(wù)質(zhì)量和服務(wù)水平方面的發(fā)揮的重要作用。【關(guān)鍵詞】數(shù)據(jù)挖掘個(gè)性化服務(wù)數(shù)字圖書(shū)館一、數(shù)據(jù)挖掘技術(shù)概述數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、新穎的、可被人理解的、但又是潛在有用的模式的過(guò)程。其

2、主要特點(diǎn)是對(duì)數(shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘根據(jù)其主要研究對(duì)象的數(shù)據(jù)結(jié)構(gòu)形式的不同,一般分為數(shù)據(jù)挖掘、文本數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘三類(lèi)。1.數(shù)值數(shù)據(jù)挖掘..,通常稱(chēng)為數(shù)據(jù)挖掘,它的任務(wù)一般可以分為描述和預(yù)測(cè)兩類(lèi),具體地說(shuō),挖掘功能包括發(fā)現(xiàn)概念/類(lèi)描述、關(guān)聯(lián)、分類(lèi)、預(yù)測(cè)、聚類(lèi)、趨勢(shì)分析、偏差分析和類(lèi)似性分析。常見(jiàn)的數(shù)據(jù)挖掘方法主要有:歸納學(xué)習(xí)方法、仿生物技術(shù)、公式發(fā)現(xiàn)、統(tǒng)計(jì)分析方法、模糊數(shù)學(xué)方法、決策樹(shù)、遺傳算法、貝葉斯信念網(wǎng)絡(luò)、粗糙集及可視化技術(shù)等,由于各

3、種方法都有自身的功能特點(diǎn)以及應(yīng)用領(lǐng)域。2.文本數(shù)據(jù)挖掘是面向文本信息的數(shù)據(jù)挖掘。當(dāng)數(shù)據(jù)挖掘的對(duì)象完全由文本類(lèi)型組成時(shí),結(jié)合使用數(shù)據(jù)挖掘算法與信息檢索算法對(duì)巨量文本信息進(jìn)行自動(dòng)化信息處理與分析的過(guò)程叫文本數(shù)據(jù)挖掘。它包括特征提取、文本摘要、文本分類(lèi)與聚類(lèi)、概念操作以及探索性數(shù)據(jù)分析等工作。文本數(shù)據(jù)挖掘所應(yīng)用的技術(shù)包含用于表示文檔的詞頻反文獻(xiàn)頻率向量表示法、詞串表示法,用于文本分類(lèi)的貝葉斯分類(lèi)算法、詞集合算法,..基于概念的文本聚類(lèi)算法以及K—最近鄰參照分類(lèi)算法等。3.基于Web的數(shù)據(jù)挖掘。Web數(shù)據(jù)挖掘的定義是:針對(duì)包

4、括Web頁(yè)面內(nèi)容、頁(yè)面之間的結(jié)構(gòu)、用戶(hù)訪問(wèn)信息、電子商務(wù)信息等在內(nèi)的各種Web數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘方法以發(fā)現(xiàn)有用的知識(shí)來(lái)幫助人們從中提取知識(shí),改進(jìn)站點(diǎn)設(shè)計(jì),更好地開(kāi)展電子商務(wù)。通過(guò)Web數(shù)據(jù)挖掘,我們可以從數(shù)以?xún)|計(jì)存儲(chǔ)大量多種多樣信息的Web頁(yè)面中提取出我們需要的有用的知識(shí),包括用戶(hù)訪問(wèn)行為、頻度、內(nèi)容等內(nèi)容,根據(jù)這些內(nèi)容和知識(shí),來(lái)改進(jìn)站點(diǎn)設(shè)計(jì),優(yōu)化我們的Web頁(yè)面,包括頁(yè)面內(nèi)容安排、頁(yè)面間關(guān)聯(lián)結(jié)構(gòu)優(yōu)化以及開(kāi)展有針對(duì)性活動(dòng)和特色服務(wù)內(nèi)容等,使更多用戶(hù)能夠更方便、更快捷的找到所需要的信息和享受到所提供的服務(wù)。Web數(shù)據(jù)挖

5、掘在數(shù)字圖書(shū)館的開(kāi)發(fā)和利用將發(fā)揮越來(lái)越重要的作用。根據(jù)Web數(shù)據(jù)挖掘?qū)ο蟮牟煌煞譃椋篧eb結(jié)構(gòu)挖掘、Web內(nèi)容挖掘和Web日志。二、圖書(shū)館的個(gè)性化服務(wù)概述所謂個(gè)性化服務(wù),就是服務(wù)要體現(xiàn)個(gè)性,同時(shí)具有主動(dòng)性的特點(diǎn),實(shí)現(xiàn)個(gè)性化服務(wù)的關(guān)鍵是在“信息找人”過(guò)程中什么信息找什么人。其本質(zhì)就是對(duì)于不同的人、不同的要求提供不同的服務(wù),以滿(mǎn)足不同用戶(hù)的特定需求。常見(jiàn)的服務(wù)方式有個(gè)性化推薦、個(gè)性化檢索、個(gè)性化網(wǎng)站。個(gè)性化推薦服務(wù)如信息推送服務(wù),一種按用戶(hù)指定時(shí)間或發(fā)生的事件把用戶(hù)選定的數(shù)據(jù)自動(dòng)發(fā)送給用戶(hù)的技術(shù),其本質(zhì)就是主動(dòng)性服務(wù),

6、幾乎不需要用戶(hù)做什么事,系統(tǒng)自動(dòng)按照用戶(hù)的信息需求提供相應(yīng)的服務(wù)。個(gè)性化主動(dòng)服務(wù)將使用戶(hù)通過(guò)盡可能小的努力獲得盡可能好的服務(wù)。數(shù)字圖書(shū)館的個(gè)性化信息服務(wù)首先就是要為用戶(hù)創(chuàng)建個(gè)性化的信息資源庫(kù),即個(gè)人數(shù)據(jù)庫(kù)。通過(guò)圖書(shū)館網(wǎng)絡(luò),用戶(hù)向圖書(shū)館系統(tǒng)提交所定制的個(gè)性化信息,用于構(gòu)建個(gè)人信息數(shù)據(jù)庫(kù),建立個(gè)性化網(wǎng)站。針對(duì)不同的個(gè)人信息,即對(duì)不同的用戶(hù)采用不同的服務(wù)策略,提供不同的服務(wù)內(nèi)容,如提供個(gè)人書(shū)架和信息檢索服務(wù)等,不同人的個(gè)人書(shū)架內(nèi)容是不完全相同的;對(duì)于相同的檢索提問(wèn),系統(tǒng)反饋給專(zhuān)家的以及普通用戶(hù)的內(nèi)容應(yīng)該有所區(qū)別的。三、數(shù)據(jù)

7、挖掘在圖書(shū)館個(gè)性化服務(wù)中應(yīng)用1.優(yōu)化館藏資源配置,提高資源利用率傳統(tǒng)圖書(shū)館資源的配置、服務(wù)的提供,由于受人工采集信息的影響,因此不可避免的受到采集者的知識(shí)層次、知識(shí)結(jié)構(gòu)以及個(gè)人愛(ài)好等因素的影響,而帶有主觀性。采用數(shù)據(jù)挖掘技術(shù)則可以較好的解決這一問(wèn)題。(1)利用數(shù)據(jù)挖掘技術(shù),對(duì)流通記錄、檢索請(qǐng)求等日志數(shù)據(jù)進(jìn)行分析,就可以得到各類(lèi)文獻(xiàn)流通借閱情況,了解讀者的借閱行為和愛(ài)好。根據(jù)這些信息,有針對(duì)性的補(bǔ)充和豐富文獻(xiàn)資源,剔除過(guò)時(shí)文獻(xiàn)資源,或減少文獻(xiàn)信息資源的副本數(shù),甚至可以根據(jù)這些挖掘信息,調(diào)整圖書(shū)館的人力、物力資源的分配,

8、從而達(dá)到資源優(yōu)化配置,合理布局目的。(2)對(duì)數(shù)字圖書(shū)館的結(jié)構(gòu)進(jìn)行挖掘,目的是發(fā)現(xiàn)數(shù)字圖書(shū)館頁(yè)面的結(jié)構(gòu)和結(jié)構(gòu)模式,在此基礎(chǔ)上對(duì)頁(yè)面進(jìn)行分類(lèi)和聚類(lèi),或?qū)ο嚓P(guān)網(wǎng)頁(yè)進(jìn)行分析,從而可以評(píng)價(jià)網(wǎng)頁(yè)的質(zhì)量,優(yōu)化檢索方式,指導(dǎo)網(wǎng)站建設(shè),便利用戶(hù)對(duì)數(shù)字圖書(shū)館使用,提高數(shù)字圖書(shū)館的利用率。2.完善信息資源建設(shè),提升個(gè)性化服務(wù)質(zhì)量通過(guò)對(duì)流通記錄、檢索請(qǐng)求等日志信息的挖

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。