資源描述:
《數(shù)字資源長期協(xié)同保存問題探究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、數(shù)字資源長期協(xié)同保存問題探究[摘要]本文首先闡述了數(shù)字資源長期協(xié)同保存的含義、意義,介紹了國外數(shù)字資源長期協(xié)同保存現(xiàn)狀,并提出構(gòu)建基于LOCKSS的數(shù)字資源長期協(xié)同保存網(wǎng)絡(luò)。[關(guān)鍵詞]數(shù)字資源;長期保存;信息保存;協(xié)同;保存網(wǎng)絡(luò)[中圖分類號1G250.7[文獻(xiàn)標(biāo)識碼]A引言目前網(wǎng)絡(luò)環(huán)境下,海量的數(shù)字資源面臨著長期保存的危機(jī)問題,每時(shí)每該都會有大量數(shù)字資源失去價(jià)值甚至消失,大部分?jǐn)?shù)字資源分布于不同的網(wǎng)絡(luò)、地域,如果要把資源的價(jià)值發(fā)揮出來,就需要不同機(jī)構(gòu)長期協(xié)同保存,從數(shù)字資源長期協(xié)同保存及可持續(xù)性信息服務(wù)能力角度,數(shù)字資源保存是提供
2、信息服務(wù)的前提與基礎(chǔ)。1數(shù)字資源長期協(xié)同保存1.1數(shù)字資源保存數(shù)字資源就是數(shù)字化信息資源,是經(jīng)過數(shù)字技術(shù)處理,通過網(wǎng)絡(luò)以數(shù)字形式發(fā)布、存取、利用的信息資源總和。數(shù)字資源具有分布離散性、復(fù)合性、動態(tài)開放性、交互性、關(guān)聯(lián)性、嵌套性、集合性、可重組性、軟硬件強(qiáng)依賴性等復(fù)雜性特征[1]。目前,數(shù)字資源已經(jīng)成為國家的重要戰(zhàn)略資源或數(shù)字資本[2]。隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、電子商務(wù)、電子政務(wù)、學(xué)術(shù)科研、數(shù)字出版等電子化事務(wù)活動的普及和發(fā)展,數(shù)字資源數(shù)量急劇增長,越來越多的有價(jià)值的信息內(nèi)容只能以數(shù)字形式來管理、保存、利用,數(shù)字資源每年還以50%
3、-100%的速度增長,而且整序數(shù)字信息的異構(gòu)資源系統(tǒng)數(shù)量也急劇增加,數(shù)字資源局部有序化但整體呈無序化的狀況日趨嚴(yán)重,使用戶對其存取、管理和服務(wù)的質(zhì)量要求與日俱增,如何優(yōu)化數(shù)字資源利用環(huán)境,如何組織、有效獲取和長期保存信息成為人們關(guān)注的重點(diǎn)。數(shù)字資源保存指的是長期的存儲、保存和存取、訪問數(shù)字資源。維基百科全書Wiki有關(guān)數(shù)字資源保存定義指的是在一定時(shí)間內(nèi)管理數(shù)字信息,是一系列的過程和活動,保障所有類型文件、科學(xué)和文化遺產(chǎn)能夠以數(shù)字化的格式提供訪問、利用[3]。數(shù)字資源長期協(xié)同保存就是對組織機(jī)構(gòu)擁有的數(shù)字資源進(jìn)行長期協(xié)同存儲的相關(guān)活動
4、。數(shù)字資源協(xié)同保存是一項(xiàng)涉及多個主體機(jī)構(gòu)對數(shù)字資源的長期保存及管理活動,通過長期協(xié)同保存,能夠確保數(shù)字資源未來的可讀性、可用性、可理解性、完整性和真實(shí)性,并能夠?yàn)楣娞峁┬畔⒎?wù)。1.2國外研究現(xiàn)狀從20世紀(jì)90年代中期開始,國外圍繞數(shù)字資源長期保存研究已經(jīng)從數(shù)字資源保存價(jià)值、意義、保存流程規(guī)范、保存過程涉及的多方權(quán)益以及合作與共享等較為宏觀層面的研究向數(shù)字資源保存對象、保存專門技術(shù)、保存方法評估、保存成本核算等較為微觀的角度演化[4]。在數(shù)字資源協(xié)同保存技術(shù)方面,大多依據(jù)OAIS(OpenArchivalInformationS
5、ystem)參考模型,開發(fā)一些數(shù)字保存軟件與工具,比如DSpace、Fedora、Green-stone等,都結(jié)合自身的保存需要與保存對象的特點(diǎn),為各個數(shù)字資源保存機(jī)構(gòu)開展數(shù)字資源長期協(xié)同保存提供了充足的技術(shù)支持;美國國家數(shù)字信息基礎(chǔ)設(shè)施和保存計(jì)劃(NDIPP計(jì)劃)于2000年實(shí)施;美國eScholarship數(shù)字資源庫自從2002年4月已經(jīng)在加州大學(xué)圖書館啟動;2002年11月發(fā)布麻省理工學(xué)院的數(shù)字資源庫DSpace;隨后俄亥俄州立大學(xué)、加州理工學(xué)院、佛羅里達(dá)州立大學(xué)、加利福尼亞大學(xué)等都開展數(shù)字資源長期協(xié)同保存實(shí)踐活動;其他國家
6、如英國、德國、荷蘭、加拿大等也實(shí)施數(shù)字資源長期協(xié)同保存項(xiàng)目。如數(shù)字信息保存聯(lián)合會(DPC)、PADI(PreservingAccesstoDigitalInformation)等。對于數(shù)字資源長期協(xié)同保存中的合作策略等方面,LizBishoff提出數(shù)字遺產(chǎn)的協(xié)同保存目前只是起步階段,面臨著信息保存技術(shù)、經(jīng)費(fèi)、保存及管理策略等方面的制約因素,通過數(shù)字資源協(xié)同保存,能夠減少數(shù)字交換中間出現(xiàn)的諸多問題[5]。在數(shù)字資源長期協(xié)同保存及可持續(xù)性研究方面,Lavoie(2003)最早研究數(shù)字資源長期協(xié)同保存可持續(xù)性問題。Bradley(200
7、5)指出數(shù)字資源長期協(xié)同保存可持續(xù)性的最大威脅來自長期保存經(jīng)費(fèi)欠保障。Hunter(2006)認(rèn)為數(shù)字資源的保存價(jià)值是影響保存投資的關(guān)鍵因素。JISC(2007)的espida項(xiàng)目使用平衡計(jì)分卡方法評估數(shù)字資源的保存價(jià)值。美國BRTF課題組(2008,2010)發(fā)布了兩個研究報(bào)告,探討數(shù)字資源長期協(xié)同保存可持續(xù)性經(jīng)濟(jì)風(fēng)險(xiǎn),提出實(shí)現(xiàn)數(shù)字長期保存經(jīng)濟(jì)可持續(xù)性的一般原則。2數(shù)字資源長期協(xié)同保存的意義在社會信息化長期建設(shè)過程中,必定會形成大量的數(shù)字信息資源,要構(gòu)建數(shù)字資源長期協(xié)同保存網(wǎng)絡(luò),并實(shí)施長期數(shù)字保存戰(zhàn)略,協(xié)同保存網(wǎng)絡(luò)是一個虛擬化的
8、系統(tǒng)平臺,整合了異地分布的多個機(jī)構(gòu)或長期保存系統(tǒng),為用戶提供協(xié)同工作與信息共享的環(huán)境,能夠協(xié)調(diào)與整合數(shù)字資源,實(shí)現(xiàn)保存職責(zé)與成本的分散,更好地完成數(shù)字資源長期保存的目標(biāo)。但是在其長期保存過程中面臨著諸多問題亟待解決,如何以最優(yōu)成本、最佳效益進(jìn)行保存