資源描述:
《數(shù)字資源長期保存的關鍵問題探討》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、數(shù)字資源長期保存的關鍵問題探討 1 引言隨著數(shù)字信息的激增、數(shù)字化環(huán)境的形成,廣大用戶日益依賴數(shù)字資源和網(wǎng)絡化服務。數(shù)字資源長期保存日益受到重視,是一個新的復雜的問題。我國在這方面尚處于起步階段,而在歐美、澳大利亞等國家,數(shù)字資源長期戰(zhàn)略保存方面的研究和應用已經取得長足進展,一些國家已經開始應用性部署,積累了大量的知識和經驗。2004年7月在北京召開的“中歐數(shù)字資源長期保存國際研討會”對于推動我國數(shù)字資源長期保存的研究和應用,具有重要意義?! ? 數(shù)字資源長期保存的關鍵問題分析 2.1 標準
2、問題數(shù)字信息的長期保存主要涉及到兩個方面,一是防止數(shù)字信息被非法變更與破壞,另一個是維護數(shù)字信息的長期真實可讀。前者,IT界極為重視,國內外已開發(fā)了不少技術產品來防范非法變更與破壞數(shù)字信息,只要技術措施與管理手段科學地融合,就有可能在一定程度上解決問題。然而,對于維護數(shù)字信息長期有效讀出,全球范圍都在研究與努力,但至今仍在探索完美的解決方案。因為,它涉及的問題太多,其中最重要的是標準問題。標準是緩解技術更新與數(shù)字信息讀出矛盾的一劑良方,但在這方面存在一些問題,一是某些標準,特別是行業(yè)標準嚴重滯后
3、;二是完全按照標準操作,目前還有難度。制定標準應當廣泛地征求相關技術人員與管理人員的意見,但現(xiàn)在有些行業(yè)標準的制定,僅僅是少數(shù)人在撰寫,有些甚至是閉門造車,使指導與規(guī)范大家行為的標準嚴重滯后于國際發(fā)展水平。三是現(xiàn)實工作中存在標準兼容與選擇的問題,如甲軟件與乙軟件都是符合標準的,但甲與乙又各有特點,這個特點就不在標準范圍之內了,這為我們提出了一個棘手的問題,我們應當以哪個軟件為主。如果以甲軟件為主,則乙軟件形成的非標準數(shù)據(jù),或另類標準特色信息就要向甲軟件形成的平臺上遷移。因此,作為被保存的數(shù)字信息
4、應當采用最穩(wěn)定的技術與通用的標準歸檔,與相關行業(yè)標準及國際標準相互兼容,這也是我們首先應考慮解決的問題。在數(shù)字資源長期保存中,標準化試圖以某一為公共接受的標準來進行數(shù)字資源的存儲、描述、組織與檢索,其中OAIS參考模型是一項重要內容。OAIS是由美國國家航空和航天局與美國太空數(shù)據(jù)系統(tǒng)委員會(CCSDS)聯(lián)合制定的標準,規(guī)定了數(shù)字資源長期保存的術語、概念和參考框架,確定了一個存檔系統(tǒng)的基本功能,提出了一個管理數(shù)字對象和信息包的信息模型。在一致性方面起了很重要的作用,并逐漸成了眾多存儲項目遵循的標準
5、,被廣泛的用于開發(fā)保存工具和存儲系統(tǒng)?! ?.2 管理問題在數(shù)字資源長期保存中,管理是從整體上進行宏觀規(guī)劃、組織和控制,是數(shù)字資源長期保存的基礎與保障。內容主要包括:保存政策、責任體系及合作機制、知識產權等。保存政策是有效實施數(shù)字資源長期保存的管理上的保證,內容應該涉及技術、組織、人文、法律、權益管理等方面,還應該包括國際國內合作、商業(yè)運作、相關者培訓、質量管理和審計策略等內容。對于保存目標,許多專家認為基本的選擇標準是首先保存那些容易丟失的、與未來有關聯(lián)的、有重要價值的數(shù)字資源,保存重要的科學
6、數(shù)據(jù),特別是“原始數(shù)據(jù)”。數(shù)字資源長期保存不僅僅是圖書館、檔案館、博物館等(3)檔案數(shù)據(jù)存儲介質 盤、磁帶都可以考慮作為檔案數(shù)據(jù)存儲介質。(4)用于數(shù)據(jù)交換的臨時存儲介質 一般說來,軟盤具有廣泛的通用性和便于攜帶的特點,可作為普通計算機用戶交換數(shù)據(jù)的介質,但其不穩(wěn)定性,不適于作為重要數(shù)據(jù)的交換介質。相對而言,CD-ROM、活動硬盤以及U盤等更合適?! ?.4 數(shù)字資源長期保存的關鍵技術問題對于數(shù)字資源,必須采取積極的維護和保存措施,否則等到媒體開始老化或技術已被淘汰再去恢復將為時已晚,造成的損失
7、也是不可估量的。保證數(shù)字信息的長期讀取涉及到很多方面,既有技術因素,也有非技術的,如政策、標準、資金、人員、管理等等。但最重要的還是要有一整套保存數(shù)字信息的關鍵技術。目前常用的保存數(shù)字信息的關鍵技術方法主要有:(1)遷移(Migration) 遷移是目前實際運行中使用比較成熟和頻繁的方法。為保證當前存儲的數(shù)字信息總能被當前系統(tǒng)讀取,采用數(shù)據(jù)“遷移”的方法,持續(xù)地將數(shù)字信息從舊的軟硬件環(huán)境轉換到新的計算機環(huán)境,是一種隨著技術變化定期改變信息格式的處理過程。例如,把e,數(shù)據(jù)恢復或數(shù)據(jù)考古) 是從原始
8、的字節(jié)流中恢復數(shù)字資源的原貌,并保證數(shù)據(jù)資源的可讀性和可用性。數(shù)據(jù)恢復包括數(shù)據(jù)災難恢復、數(shù)據(jù)格式恢復等。數(shù)據(jù)恢復是具有技術挑戰(zhàn)的技術方法,值得注意的是,如果已經無法獲取數(shù)字資源的原貌,就無法評估數(shù)據(jù)恢復的成果。因此在正常的圖書館數(shù)字資源保存過程中,不贊成使用這種方法作為長期保存的技術方法,而是采用更為實際的運作方法。該方法僅在其長期保存方法無法發(fā)揮作用時使用??傊_定某種方案是否適用,需要充分考慮它的可行性、可持續(xù)性、實用性和合理性?! ?.5 數(shù)字信息的安全問題數(shù)字信息日益增多,較易受到干擾