深圳市檔案局 李國慶
2002年12月8日,國家檔案局在深圳召開了“檔案信息化建設現(xiàn)場演示會”,深圳市檔案局館向與會代表成功地演示了深圳數(shù)字檔案館應用系統(tǒng)的各項主要功能,這標志著“深圳數(shù)字檔案館系統(tǒng)工程建設”項目已經(jīng)取得了階段性成果:該項目課題組歷經(jīng)兩年的努力,對數(shù)字檔案館的基本理論、框架結(jié)構(gòu)、基礎設施、應用技術(shù)和實現(xiàn)模式的研究、開發(fā),都取得了長足的進展和可喜的成就。
一、對“數(shù)字檔案館”的認識
數(shù)字檔案館是近年來檔案界提出的新概念,暫時還沒有取得統(tǒng)一的認識和提法。綜合目前的各種提法,較為完整的表述應該是:數(shù)字檔案館是建立在現(xiàn)代信息技術(shù)普遍應用基礎上,利用數(shù)字化手段,以綜合檔案信息資源為處理核心,對數(shù)字檔案信息資源進行收集、管理,通過高速寬帶通信網(wǎng)絡設施相連接和提供利用,實現(xiàn)檔案信息資源共享的超大規(guī)模、分布式數(shù)字信息系統(tǒng)。從目前國內(nèi)外有關(guān)情況和發(fā)展趨勢看,有各種類型的數(shù)字檔案館??綜合性的、行業(yè)的、專題的、甚至個人的,本文所論述的是國家綜合性數(shù)字檔案館。
以“有序的信息空間和開放的信息環(huán)境”為特征的完整意義上的數(shù)字檔案館,不是封閉的檔案館信息網(wǎng)絡,而是包含在辦公自動化系統(tǒng)、計算機輔助設計和管理系統(tǒng)、公共信息數(shù)據(jù)管理系統(tǒng)等更為廣闊的大系統(tǒng)之中,由分布式檔案信息資源構(gòu)成的具有強大服務功能的跨機構(gòu)、跨地域的信息系統(tǒng)。數(shù)字檔案館建設,應該納入各地政府信息化建設總體規(guī)劃,成為政府信息系統(tǒng)的一個重要組成部分。
數(shù)字檔案館的含義有廣義和狹義之分。廣義數(shù)字檔案館是指存儲和利用檔案信息資源的信息空間,是一個由眾多檔案資源庫群、檔案信息資源處理中心、檔案用戶群構(gòu)成的數(shù)字檔案館群體。狹義數(shù)字檔案館是指其中的個體檔案館,其含義除了館藏檔案數(shù)字化工作外,還涉及檔案信息的采集、整理、存儲、檢索、傳遞、保管、保護、利用、鑒定、統(tǒng)計等全過程,代表的是一種信息環(huán)境和基礎設施的構(gòu)建,包括軟、硬件系統(tǒng)的設計和組織實體的建立。
二、深圳數(shù)字檔案館的五大建設任務
基于上述理論認識,深圳數(shù)字檔案館在建設中確定了五大任務:軟硬件基礎設施建設、應用系統(tǒng)開發(fā)、數(shù)字信息資源建設、標準規(guī)范體系建設、人才隊伍建設。
(一)基礎設施建設
深圳數(shù)字檔案館的基礎設施建設主要包括網(wǎng)絡環(huán)境、硬件環(huán)境和系統(tǒng)軟件建設三部分。根據(jù)三種不同的服務對象和范圍,網(wǎng)絡環(huán)境分為檔案館內(nèi)部網(wǎng)、與政府連接的政務網(wǎng)、與互聯(lián)網(wǎng)連接的公眾網(wǎng)三個層次,并實行三網(wǎng)物理隔離。根據(jù)數(shù)字檔案館的功能需要,數(shù)字檔案館的基礎硬件設施主要包括網(wǎng)絡設備、服務器、檔案數(shù)字化加工等設備以及其他支撐設備等,并要建設大容量的分布式資源數(shù)據(jù)庫、大規(guī)模并發(fā)用戶的訪問服務管理系統(tǒng)。在進行數(shù)字檔案館系統(tǒng)軟件建設,尤其是在選擇操作系統(tǒng)的過程中,遵循了通用、實用、可靠、節(jié)省、成熟、方便維護等原則,選擇了目前世界上流行的windows、UNIX、MNUX等操作系統(tǒng)。
(二)應用系統(tǒng)開發(fā)
深圳數(shù)字檔案館應用系統(tǒng)的建設目標是建成一個可擴展的網(wǎng)絡應用系統(tǒng)、其功能涵蓋檔案的數(shù)字化加工、電子檔案信息的采集、處理、存儲、歸檔、組織、發(fā)布、利用及數(shù)字資源管理全過程。所采用的許多關(guān)鍵技術(shù),屬于當前計算機技術(shù)、信息技術(shù)、人工智能領域中最先進、最有發(fā)展前途的前沿科學,例如:大量并發(fā)查詢、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、海量數(shù)據(jù)存儲、網(wǎng)絡安全、圖象分類、智能檢索、人工語言向自然語言轉(zhuǎn)換、視頻點播、虛擬現(xiàn)實技術(shù)等。這些技術(shù)在數(shù)字檔案館工程項目中的應用,將大大提高數(shù)字檔案館系統(tǒng)的技術(shù)含量,確保其技術(shù)的先進性。應用系統(tǒng)的構(gòu)成及其功能將在下一個論題具體闡述。
(三)數(shù)字信息資源建設
深圳數(shù)字檔案館數(shù)字信息資源建設的定位是分布式文件、檔案數(shù)字資源構(gòu)成的具有強大服務功能的跨機構(gòu)、跨地域的信息系統(tǒng)。這個系統(tǒng)突破了傳統(tǒng)“檔案信息”的內(nèi)涵、建立了廣義“檔案信息”概念,其采集、存儲、管理的信息數(shù)據(jù)構(gòu)成形式包括:文本文件、圖形文件、圖像文件、影像文件、聲音文件及其他文件(如命令文件,亦稱計算機程序)等。其來源和采集范圍包括:傳統(tǒng)檔案館的館藏、立檔單位的檔案文件材料、有檔案性質(zhì)的行業(yè)及專題信息資源庫和互連網(wǎng)上其它具有檔案價值的信息等。通過對各類信息的整合,形成一個社會綜合信息資源庫,以滿足社會各方面對檔案信息資源的需要。
(四)標準規(guī)范體系建設
深圳數(shù)字檔案館在建設過程中,采用、研制、建立了一套相關(guān)的行政法規(guī)、業(yè)務規(guī)范、技術(shù)標準和管理規(guī)則。深圳數(shù)字檔案館的標準規(guī)范體系包括管理業(yè)務、技術(shù)二個層面。管理性標準規(guī)范包括計算機安全法規(guī)與標準,數(shù)字檔案館工作人員、用戶及設備管理規(guī)范,利用管理規(guī)定,以及數(shù)字檔案館信息資源合法性的確認等;業(yè)務性標準規(guī)范包括術(shù)語標準以及相關(guān)的電子文件和電子檔案管理的標準、規(guī)范;技術(shù)性標準規(guī)范包括數(shù)字檔案館軟硬件基礎設施建設技術(shù)標準,軟件系統(tǒng)工作平臺技術(shù)標準,數(shù)據(jù)存儲壓縮格式規(guī)范,數(shù)據(jù)長期保存格式規(guī)范,數(shù)據(jù)加密算法規(guī)范,網(wǎng)絡數(shù)據(jù)傳輸規(guī)范和數(shù)字水印標準等。
(五)人才隊伍建設
深圳數(shù)字檔案館的人才隊伍建設貫徹以管理型人才為基礎,以復合型人才為重點的指導思想。根據(jù)數(shù)字檔案館業(yè)務工作的劃分,所需人才的類型有:檔案采集、處理與數(shù)據(jù)庫加工人才;信息技術(shù)及計算機系統(tǒng)和網(wǎng)絡設計與開發(fā)人才;檔案信息分析、研究與咨詢?nèi)瞬牛粩?shù)字檔案館理論與方法研究人才;數(shù)字檔案館系統(tǒng)運營與服務的管理人才。對人才隊伍業(yè)務素質(zhì)的要求是具有較全面的知識結(jié)構(gòu)以及敏銳的信息意識、良好的信息道德、較強的信息能力,以適應數(shù)字檔案館的建設和正常運行的需要。
三、深圳數(shù)字檔案館的階段性成果
經(jīng)過兩年的努力,深圳數(shù)字檔案館建設的上述各項任務均取得了階段性成果。主要表現(xiàn)是:
1、在《深圳數(shù)字檔案館總體規(guī)劃書》指導下,完成了《第一期工程需求報告》、《工程實施方案》、《數(shù)字檔案館應用需求分析報告》等綜合性、指導性文件,并付諸實施。
2、完成了《電子郵件公文歸檔與管理規(guī)則》(行業(yè)標準項目)、《電子文件元數(shù)據(jù)標準》、《電子文件生命周期表》、《通用電子文件保管期限表》等一批標準、規(guī)范的起草工作。
3、應用系統(tǒng)的研制開發(fā)已經(jīng)基本成型,正在進一步完善,其中數(shù)字化加工處理軟件已經(jīng)投入運行。
4、已經(jīng)建成檔案數(shù)字化加工生產(chǎn)線,日加工能力不斷提高,完成了相當數(shù)量的館藏紙質(zhì)檔案、照片檔案的數(shù)字化,同時為部分立檔單位進行檔案數(shù)字化加工,建立了一定規(guī)模的數(shù)據(jù)庫。
5、深圳市檔案館新館舍(數(shù)字檔案館所在地)正在進行網(wǎng)絡布點、布線,有關(guān)設備正分批購置,陸續(xù)到位。數(shù)字檔案館的具體運作機構(gòu),已由市編辦正式下文成立予以定編,為數(shù)字檔案館的運行打下了良好基礎。
四、深圳數(shù)字檔案館應用系統(tǒng)的四大功能模塊
根據(jù)數(shù)字檔案館的總體要求,按照檔案信息的數(shù)據(jù)流向,深圳數(shù)字檔案館的應用系統(tǒng)共包括:電子檔案信息收集、電子檔案信息管理、電子檔案信息利用、電子檔案信息安全維護四個功能模塊。
(一)電子檔案信息收集模塊。負責各類電子檔案信息的采集并將其輸入系統(tǒng)。根據(jù)數(shù)字檔案館數(shù)字信息資源的來源,在此模塊下設立了三個子系統(tǒng):1、館藏資源數(shù)字化系統(tǒng),包括紙質(zhì)檔案掃描子系統(tǒng)、縮微膠片數(shù)字化子系統(tǒng)、視頻資料數(shù)字化子系統(tǒng)、音頻資料數(shù)字化子系統(tǒng);2、信息接收系統(tǒng),通過卸載報盤和網(wǎng)絡在線的方式,接收立檔單位的電子檔案和應歸檔電子文件及其元數(shù)據(jù),以及下屬檔案館的電子檔案信息;3、信息搜尋系統(tǒng),通過網(wǎng)絡在線采集現(xiàn)有的各種信息資源庫,如國土信息資源庫、人口統(tǒng)計信息資源庫等;采集各網(wǎng)站的網(wǎng)頁、歷史照片、有關(guān)新聞報道、統(tǒng)計數(shù)據(jù)、歷史事件的聲像資料等其他社會零散信息,作為數(shù)字檔案館數(shù)字資源建設的補充。
(二)信息管理模塊。主要負責對采集到的信息進行整理、分類、管理,使大量無序的信息有序化。其功能主要包括:電子檔案標準化、元數(shù)據(jù)著錄、分類號主題詞自動標引、多媒體檔案標引、目錄管理、檔案鑒定、報表打印、信息統(tǒng)計等。其中電子檔案標準化子系統(tǒng)對收集來的符合或通過轉(zhuǎn)換使其符合一定規(guī)范(包括電子文件元數(shù)據(jù)標準、數(shù)據(jù)交換標準、文件的語言格式、數(shù)據(jù)交換的物理存儲介質(zhì)標準和數(shù)據(jù)交換的邏輯格式標準等)的數(shù)字信息及其元數(shù)據(jù),根據(jù)采集時所帶的目錄信息,采取一定的分類方案,將這些數(shù)據(jù)有序地存儲到系統(tǒng)中。元數(shù)據(jù)著錄子系統(tǒng)是對采集來的數(shù)字檔案信息進行內(nèi)容、結(jié)構(gòu)、背景信息等相應項目的元數(shù)據(jù)進行檢查和缺項補著錄,建立元數(shù)據(jù)庫。分類號主題詞自動標引子系統(tǒng)含有按邏輯關(guān)系將符合《中國檔案主題詞表》有關(guān)要求的主題詞和符合《中國檔案分類法》有關(guān)要求的信息分類號組合在一起所形成的一套分類號主題詞對照表,系統(tǒng)可以從“對照表”中自動提取相應的分類號?主題詞,完成標引任務。檔案輔助鑒定子系統(tǒng)可以對數(shù)字檔案信息進行批量的內(nèi)容鑒定和技術(shù)鑒定:內(nèi)容鑒定是根據(jù)檔案開放所必須具備的條件,檔案價值判定、保管期限劃分的標準,檔案真?zhèn)舞b別的主要依據(jù)等要素,同檔案文件的來源、類別、責任人、形成時間、存儲介質(zhì)等眾多信息相結(jié)合,制訂鑒定規(guī)則,利用計算機的智能技術(shù),建立起專家智能鑒定系統(tǒng),進行檔案信息的批量輔助鑒定;在此基礎上再由專家對輔助鑒定過的檔案信息進行直接鑒定,予以確認,不僅可以大大減少全部由人工直接鑒定的工作量,同時能保證鑒定的質(zhì)量。技術(shù)鑒定子系統(tǒng)是對電子文件各方面的技術(shù)狀況進行全面檢查,包括對文件信息真實性、完整性、可讀性分析以及對文件載體狀況的檢測(該系統(tǒng)目前正在研制當中)。統(tǒng)計報表子系統(tǒng)能對系統(tǒng)中的基本數(shù)據(jù)進行匯總,形成統(tǒng)計表,包括規(guī)范化統(tǒng)計表和自定義統(tǒng)計表,如檔案館基本情況年報、全年檔案利用統(tǒng)計表、溫濕度統(tǒng)計表等。
(三)信息利用模塊。負責對數(shù)字檔案館管理的海量電子檔案信息,運用計算機和網(wǎng)絡技術(shù)向社會提供超越時空界限的利用服務,可以使具備上網(wǎng)條件的用戶在任何地點、時間得到權(quán)限許可的檔案信息,真正實現(xiàn)數(shù)字檔案信息資源的共享。該模塊包括:檔案信息開發(fā),綜合智能查詢,網(wǎng)站信息發(fā)布,光盤發(fā)布等子系統(tǒng)。其中檔案信息開發(fā)子系統(tǒng)的主要功能是進行檔案信息的編研規(guī)范化和素材編輯。綜合智能查詢子系統(tǒng)可提供館藏電子檔案的文檔、圖形圖象、語音資源、視頻資源的查詢閱覽及虛擬演播等服務。網(wǎng)站信息發(fā)布子系統(tǒng)能夠?qū)^藏電子檔案通過互連網(wǎng)進行發(fā)布,提供對外信息服務。光盤發(fā)布子系統(tǒng)能將允許發(fā)布的多媒體信息資料,包括目錄數(shù)據(jù)及原文以一定的格式遷移到光盤上,形成發(fā)布盤,既能在網(wǎng)上運行閱讀,又能提供給用戶進行單機閱讀。
(四)電子檔案信息安全維護模塊。深圳數(shù)字檔案館的安全維護,從物理安全、信息資源安全和安全保密管理幾方面著手,采取了一系列措施:
1、數(shù)據(jù)遷移、備份、恢復。數(shù)字檔案館的應用系統(tǒng)分布在三網(wǎng)物理隔離的網(wǎng)絡環(huán)境中,無法直接通信,這就產(chǎn)生了信息隔膜,必須進行數(shù)據(jù)遷移。本系統(tǒng)采用的方法是先從一個網(wǎng)絡的數(shù)據(jù)庫中將數(shù)據(jù)導出到可寫光盤、熱拔插硬盤等介質(zhì),再將這些介質(zhì)接到另一個網(wǎng)絡,將數(shù)據(jù)導入其數(shù)據(jù)庫中。深圳數(shù)字檔案館系統(tǒng)的主要設備、軟件、數(shù)據(jù)、電源等都有備份,并有技術(shù)措施和組織措施可以在發(fā)生故障后較短時間內(nèi)恢復系統(tǒng)運行。服務器采用雙機備份,主工作機出現(xiàn)故障后,備份機自行啟動工作。數(shù)據(jù)脫機備份使用光盤,災難恢復采用磁帶機。服務器的UPS電源保證在停電后十小時內(nèi)仍可保持正常工作;軟件備份利用關(guān)系數(shù)據(jù)庫系統(tǒng)自身提供的功能,對元數(shù)據(jù)和存儲文件的對象數(shù)據(jù)庫進行備份恢復。
2、計算機病毒防治。采用國家有關(guān)主管部門批準的查毒、殺毒軟件,適時對服務器和客戶端查毒、殺毒,并制定嚴格的防毒制度。
3、身份鑒別。深圳數(shù)字檔案館系統(tǒng)鑒別主體身份的方法主要有二種:一是只有該用戶了解的秘密,如口令、密鑰等;二是用戶攜帶的能證明用戶身份的物品,如智能卡;三是只有該用戶具有的獨一無二的特征或能力,如指紋、聲音、視網(wǎng)膜等。凡政務網(wǎng)上的在線移交、信息檢索都要進行身份鑒別。
4、訪問控制。對用戶進行操作權(quán)的限制,包括功能權(quán)限制和數(shù)據(jù)權(quán)限制,主要防范用戶的越權(quán)訪問。
5、信息加密。分傳輸加密和存儲加密。信息傳輸加密用來防止通信線路上的竊聽、泄漏、篡改和破壞,其方式通常有鏈路加密、網(wǎng)絡層加密、應用層加密等,深圳數(shù)字檔案館系統(tǒng)采用應用層加密。凡是需要在網(wǎng)絡上傳輸?shù)臄?shù)據(jù),傳輸前必須加密。信息存儲時,對每份原文進行了加密。加密協(xié)議采用的是國際標準協(xié)議DES和RSA,具有一定的權(quán)威性。
6、信息完整性校驗。其作用是防止信息被非法篡改、插入和刪除。本系統(tǒng)采用數(shù)字水印技術(shù)保護信息的完整性。
7、安全審計。深圳數(shù)字檔案館系統(tǒng)利用數(shù)據(jù)庫、操作系統(tǒng)、安全保密產(chǎn)品和應用軟件的審計功能來完成安全審計。
五、數(shù)字檔案館與傳統(tǒng)檔案館的關(guān)系
數(shù)字檔案館的建成,并不意味著傳統(tǒng)檔案館的消亡。由于各自的主要功能不同,加之各自具備適應某種社會需求的特殊優(yōu)勢,決定了數(shù)字檔案館和傳統(tǒng)檔案館將長期共存,它們之間是一種互為補充、互相依存的關(guān)系。
(一)數(shù)字檔案館不可取代傳統(tǒng)檔案館
數(shù)字檔案館在向社會提供服務中,與傳統(tǒng)檔案館相比具有明顯優(yōu)勢,但這并不說明數(shù)字檔案館可以取代傳統(tǒng)檔案館,在現(xiàn)代社會傳統(tǒng)檔案館具有自身的優(yōu)勢,具有繼續(xù)存在和發(fā)展的生命力。
1、傳統(tǒng)檔案館的館藏主要是原始檔案的實體,在歷史真跡、憑證價值方面具有法律效力上的優(yōu)勢。當人們需要獲得法律援助時,除了在網(wǎng)上搜尋有利的信息外,還要索取不易被篡改的檔案實體原件作為原始憑證。這一社會功能的有效發(fā)揮,非傳統(tǒng)檔案館莫屬。
2、傳統(tǒng)檔案館館藏的重要檔案原件以紙質(zhì)為主,許多重要的原件進行了縮微拍攝。紙質(zhì)和膠片的壽命都遠遠超過數(shù)字化信息,且不易被篡改。據(jù)測試,機讀磁帶、唱片、硬盤的壽命僅十至幾十年,其中磁帶至多20年,壽命最長的是CD-ROM,但也只有30年左右。要想延長數(shù)字化信息的保存期限,只有不斷地重新復制。要長久保存歷史檔案文化財富,目前最可靠的還是傳統(tǒng)檔案館。
3、傳統(tǒng)檔案館以其豐富的歷史檔案和珍藏的孤本原件可供有關(guān)社會人士休閑觀賞,充分發(fā)揮檔案珍品的社會價值,盡管憑借汁算機從網(wǎng)絡上也可以搜尋、閱讀多媒體珍品信息,但從觀賞、品味的角度來講,人們更看重珍品的實體原件。在人民生活水平、文化素養(yǎng)不斷提高的現(xiàn)在和將來,這一社會需求將日益突現(xiàn)。
4、數(shù)字化信息必須借助于一定的硬件和軟件才能被用戶所利用,由于經(jīng)濟和技術(shù)發(fā)展的不平衡,在一些經(jīng)濟欠發(fā)達地區(qū),計算機和網(wǎng)絡的應用在相當長時間內(nèi)還不會普及到全體社會公眾,許多人還要造訪傳統(tǒng)檔案館,查閱、利用檔案。傳統(tǒng)檔案館的社會服務功能,還將繼續(xù)沿用很長時間。
(二)數(shù)字檔案館與傳統(tǒng)檔案館互相依存
數(shù)字檔案館與傳統(tǒng)檔案館都因社會的需求和各自的優(yōu)勢而得以生存和發(fā)展,然而由于各自都有某些弱點而必須互相依存,不能孤立地存在。
1、在檔案信息資源建設上,傳統(tǒng)檔案館館藏檔案原件是數(shù)字檔案館數(shù)字化檔案信息的重要來源;數(shù)字檔案館為傳統(tǒng)檔案館進一步豐富館藏提供線索和可能。傳統(tǒng)檔案館保存的本轄區(qū)或本專業(yè)系統(tǒng)立檔單位移交的檔案以及征集進館的珍貴檔案原件,通過數(shù)字化加工,進入數(shù)字檔案信息資源庫,成為數(shù)字檔案館數(shù)字化檔案信息中最基本的、重要的核心組成部分。離開了這一來源,數(shù)字檔案館將難以構(gòu)建完整的、有權(quán)威的信息資源庫。然而傳統(tǒng)檔案館的館藏檔案主要是根據(jù)國家規(guī)定,通過接收立檔單位移交的檔案積累起來的,而對于散存的重要檔案以及其他專門行業(yè)檔案信息的收集,卻因缺乏線索和有效途徑而難以實現(xiàn)。數(shù)字檔案館恰好在這方面具備優(yōu)勢。數(shù)字檔案館保存的數(shù)字信息,不僅有傳統(tǒng)檔案館館藏檔案的數(shù)字化信息,還包括電子政府形成的電子文件及時歸檔、政府綜合信息的及時采集。同時,數(shù)字檔案館與企業(yè)信息化建設相聯(lián)系,可與企業(yè)信息網(wǎng)絡建立互聯(lián)互通關(guān)系;與電子商務建設相聯(lián)系,可與金融、保險、政府采購、運輸、物流配送等電子商務信息服務系統(tǒng)建立聯(lián)通關(guān)系;與社會公共服務信息化建設相聯(lián)系,可與覆蓋全社會各領域(包括教育、科技、文化、醫(yī)療、社會保障等)的應用信息數(shù)據(jù)庫建立互聯(lián)關(guān)系。這樣就為傳統(tǒng)檔案館提供了進一步收集社會檔案信息,豐富館藏的線索和途徑。
2、在檔案信息資源的開發(fā)利用上,傳統(tǒng)檔案館由于缺乏強有力的開發(fā)利用手段,受時間和空間的局限而不能迅速、廣泛地為社會提供檔案信息服務,限制了檔案信息價值的發(fā)揮。數(shù)字檔案館則可以憑借網(wǎng)絡優(yōu)勢,在極廣闊的范圍內(nèi)發(fā)布數(shù)字檔案信息,不受時間、地域的限制,提供快捷、方便的服務,實現(xiàn)檔案信息資源共享。在必要的時候,可以通過傳統(tǒng)檔案館收藏的檔案原件和縮微品取得真實性印證,產(chǎn)生檔案信息的法律效力。
3、在檔案信息真跡的保護上,傳統(tǒng)檔案館優(yōu)于數(shù)字檔案館。數(shù)字化信息可以完美地被復制,也可以不留痕跡地被修改。計算機病毒、磁場、電磁脈沖都對數(shù)字化信息和計算機系統(tǒng)具有破壞性。由于信息技術(shù)發(fā)展迅速,同時也由于商業(yè)因素,數(shù)字檔案館常常遇到技術(shù)過時的問題,需要更新硬件設備和軟件版本,需要把數(shù)據(jù)遷移到新型的載體上去。而在遷移過程中容易出現(xiàn)數(shù)據(jù)丟失的問題。盡管上述問題可以采用較先進的技術(shù)得到控制性的解決,但難以從根本上杜絕發(fā)生。
4、在檔案信息的加工上,傳統(tǒng)檔案館館藏檔案信息經(jīng)過數(shù)字化加工、整序,成為數(shù)字檔案館數(shù)字信息資源的核心組成部分,并生成各種類型的信息目錄(二次文獻)和結(jié)構(gòu)較單純的檔案參考資料(三次文獻),如“大事年表”等。這種方式的二次加工,不僅免除了傳統(tǒng)檔案館人工編目、編研的繁瑣和辛勞,而且所編的目錄、資料能適合機檢和手檢、機讀和直讀,形式可以不斷更新,能滿足不同的需求,能在館內(nèi)和網(wǎng)上組建檔案信息資料目錄中心。而深層次加工的檔案編研成果(三次文獻),如:各種“綜述”、“專題概要”、“人物傳記”、“指南”以及利用館藏檔案資料編制的圖片、音像等多媒體參考資料,還要依靠傳統(tǒng)檔案館來進行,數(shù)字檔案館可以將經(jīng)數(shù)字化的深層次編研成果,融入數(shù)字信息資源庫在網(wǎng)上發(fā)布,提供服務。
(牛角摘自《中國檔案》2003年第3期)
2002年12月8日,國家檔案局在深圳召開了“檔案信息化建設現(xiàn)場演示會”,深圳市檔案局館向與會代表成功地演示了深圳數(shù)字檔案館應用系統(tǒng)的各項主要功能,這標志著“深圳數(shù)字檔案館系統(tǒng)工程建設”項目已經(jīng)取得了階段性成果:該項目課題組歷經(jīng)兩年的努力,對數(shù)字檔案館的基本理論、框架結(jié)構(gòu)、基礎設施、應用技術(shù)和實現(xiàn)模式的研究、開發(fā),都取得了長足的進展和可喜的成就。
一、對“數(shù)字檔案館”的認識
數(shù)字檔案館是近年來檔案界提出的新概念,暫時還沒有取得統(tǒng)一的認識和提法。綜合目前的各種提法,較為完整的表述應該是:數(shù)字檔案館是建立在現(xiàn)代信息技術(shù)普遍應用基礎上,利用數(shù)字化手段,以綜合檔案信息資源為處理核心,對數(shù)字檔案信息資源進行收集、管理,通過高速寬帶通信網(wǎng)絡設施相連接和提供利用,實現(xiàn)檔案信息資源共享的超大規(guī)模、分布式數(shù)字信息系統(tǒng)。從目前國內(nèi)外有關(guān)情況和發(fā)展趨勢看,有各種類型的數(shù)字檔案館??綜合性的、行業(yè)的、專題的、甚至個人的,本文所論述的是國家綜合性數(shù)字檔案館。
以“有序的信息空間和開放的信息環(huán)境”為特征的完整意義上的數(shù)字檔案館,不是封閉的檔案館信息網(wǎng)絡,而是包含在辦公自動化系統(tǒng)、計算機輔助設計和管理系統(tǒng)、公共信息數(shù)據(jù)管理系統(tǒng)等更為廣闊的大系統(tǒng)之中,由分布式檔案信息資源構(gòu)成的具有強大服務功能的跨機構(gòu)、跨地域的信息系統(tǒng)。數(shù)字檔案館建設,應該納入各地政府信息化建設總體規(guī)劃,成為政府信息系統(tǒng)的一個重要組成部分。
數(shù)字檔案館的含義有廣義和狹義之分。廣義數(shù)字檔案館是指存儲和利用檔案信息資源的信息空間,是一個由眾多檔案資源庫群、檔案信息資源處理中心、檔案用戶群構(gòu)成的數(shù)字檔案館群體。狹義數(shù)字檔案館是指其中的個體檔案館,其含義除了館藏檔案數(shù)字化工作外,還涉及檔案信息的采集、整理、存儲、檢索、傳遞、保管、保護、利用、鑒定、統(tǒng)計等全過程,代表的是一種信息環(huán)境和基礎設施的構(gòu)建,包括軟、硬件系統(tǒng)的設計和組織實體的建立。
二、深圳數(shù)字檔案館的五大建設任務
基于上述理論認識,深圳數(shù)字檔案館在建設中確定了五大任務:軟硬件基礎設施建設、應用系統(tǒng)開發(fā)、數(shù)字信息資源建設、標準規(guī)范體系建設、人才隊伍建設。
(一)基礎設施建設
深圳數(shù)字檔案館的基礎設施建設主要包括網(wǎng)絡環(huán)境、硬件環(huán)境和系統(tǒng)軟件建設三部分。根據(jù)三種不同的服務對象和范圍,網(wǎng)絡環(huán)境分為檔案館內(nèi)部網(wǎng)、與政府連接的政務網(wǎng)、與互聯(lián)網(wǎng)連接的公眾網(wǎng)三個層次,并實行三網(wǎng)物理隔離。根據(jù)數(shù)字檔案館的功能需要,數(shù)字檔案館的基礎硬件設施主要包括網(wǎng)絡設備、服務器、檔案數(shù)字化加工等設備以及其他支撐設備等,并要建設大容量的分布式資源數(shù)據(jù)庫、大規(guī)模并發(fā)用戶的訪問服務管理系統(tǒng)。在進行數(shù)字檔案館系統(tǒng)軟件建設,尤其是在選擇操作系統(tǒng)的過程中,遵循了通用、實用、可靠、節(jié)省、成熟、方便維護等原則,選擇了目前世界上流行的windows、UNIX、MNUX等操作系統(tǒng)。
(二)應用系統(tǒng)開發(fā)
深圳數(shù)字檔案館應用系統(tǒng)的建設目標是建成一個可擴展的網(wǎng)絡應用系統(tǒng)、其功能涵蓋檔案的數(shù)字化加工、電子檔案信息的采集、處理、存儲、歸檔、組織、發(fā)布、利用及數(shù)字資源管理全過程。所采用的許多關(guān)鍵技術(shù),屬于當前計算機技術(shù)、信息技術(shù)、人工智能領域中最先進、最有發(fā)展前途的前沿科學,例如:大量并發(fā)查詢、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、海量數(shù)據(jù)存儲、網(wǎng)絡安全、圖象分類、智能檢索、人工語言向自然語言轉(zhuǎn)換、視頻點播、虛擬現(xiàn)實技術(shù)等。這些技術(shù)在數(shù)字檔案館工程項目中的應用,將大大提高數(shù)字檔案館系統(tǒng)的技術(shù)含量,確保其技術(shù)的先進性。應用系統(tǒng)的構(gòu)成及其功能將在下一個論題具體闡述。
(三)數(shù)字信息資源建設
深圳數(shù)字檔案館數(shù)字信息資源建設的定位是分布式文件、檔案數(shù)字資源構(gòu)成的具有強大服務功能的跨機構(gòu)、跨地域的信息系統(tǒng)。這個系統(tǒng)突破了傳統(tǒng)“檔案信息”的內(nèi)涵、建立了廣義“檔案信息”概念,其采集、存儲、管理的信息數(shù)據(jù)構(gòu)成形式包括:文本文件、圖形文件、圖像文件、影像文件、聲音文件及其他文件(如命令文件,亦稱計算機程序)等。其來源和采集范圍包括:傳統(tǒng)檔案館的館藏、立檔單位的檔案文件材料、有檔案性質(zhì)的行業(yè)及專題信息資源庫和互連網(wǎng)上其它具有檔案價值的信息等。通過對各類信息的整合,形成一個社會綜合信息資源庫,以滿足社會各方面對檔案信息資源的需要。
(四)標準規(guī)范體系建設
深圳數(shù)字檔案館在建設過程中,采用、研制、建立了一套相關(guān)的行政法規(guī)、業(yè)務規(guī)范、技術(shù)標準和管理規(guī)則。深圳數(shù)字檔案館的標準規(guī)范體系包括管理業(yè)務、技術(shù)二個層面。管理性標準規(guī)范包括計算機安全法規(guī)與標準,數(shù)字檔案館工作人員、用戶及設備管理規(guī)范,利用管理規(guī)定,以及數(shù)字檔案館信息資源合法性的確認等;業(yè)務性標準規(guī)范包括術(shù)語標準以及相關(guān)的電子文件和電子檔案管理的標準、規(guī)范;技術(shù)性標準規(guī)范包括數(shù)字檔案館軟硬件基礎設施建設技術(shù)標準,軟件系統(tǒng)工作平臺技術(shù)標準,數(shù)據(jù)存儲壓縮格式規(guī)范,數(shù)據(jù)長期保存格式規(guī)范,數(shù)據(jù)加密算法規(guī)范,網(wǎng)絡數(shù)據(jù)傳輸規(guī)范和數(shù)字水印標準等。
(五)人才隊伍建設
深圳數(shù)字檔案館的人才隊伍建設貫徹以管理型人才為基礎,以復合型人才為重點的指導思想。根據(jù)數(shù)字檔案館業(yè)務工作的劃分,所需人才的類型有:檔案采集、處理與數(shù)據(jù)庫加工人才;信息技術(shù)及計算機系統(tǒng)和網(wǎng)絡設計與開發(fā)人才;檔案信息分析、研究與咨詢?nèi)瞬牛粩?shù)字檔案館理論與方法研究人才;數(shù)字檔案館系統(tǒng)運營與服務的管理人才。對人才隊伍業(yè)務素質(zhì)的要求是具有較全面的知識結(jié)構(gòu)以及敏銳的信息意識、良好的信息道德、較強的信息能力,以適應數(shù)字檔案館的建設和正常運行的需要。
三、深圳數(shù)字檔案館的階段性成果
經(jīng)過兩年的努力,深圳數(shù)字檔案館建設的上述各項任務均取得了階段性成果。主要表現(xiàn)是:
1、在《深圳數(shù)字檔案館總體規(guī)劃書》指導下,完成了《第一期工程需求報告》、《工程實施方案》、《數(shù)字檔案館應用需求分析報告》等綜合性、指導性文件,并付諸實施。
2、完成了《電子郵件公文歸檔與管理規(guī)則》(行業(yè)標準項目)、《電子文件元數(shù)據(jù)標準》、《電子文件生命周期表》、《通用電子文件保管期限表》等一批標準、規(guī)范的起草工作。
3、應用系統(tǒng)的研制開發(fā)已經(jīng)基本成型,正在進一步完善,其中數(shù)字化加工處理軟件已經(jīng)投入運行。
4、已經(jīng)建成檔案數(shù)字化加工生產(chǎn)線,日加工能力不斷提高,完成了相當數(shù)量的館藏紙質(zhì)檔案、照片檔案的數(shù)字化,同時為部分立檔單位進行檔案數(shù)字化加工,建立了一定規(guī)模的數(shù)據(jù)庫。
5、深圳市檔案館新館舍(數(shù)字檔案館所在地)正在進行網(wǎng)絡布點、布線,有關(guān)設備正分批購置,陸續(xù)到位。數(shù)字檔案館的具體運作機構(gòu),已由市編辦正式下文成立予以定編,為數(shù)字檔案館的運行打下了良好基礎。
四、深圳數(shù)字檔案館應用系統(tǒng)的四大功能模塊
根據(jù)數(shù)字檔案館的總體要求,按照檔案信息的數(shù)據(jù)流向,深圳數(shù)字檔案館的應用系統(tǒng)共包括:電子檔案信息收集、電子檔案信息管理、電子檔案信息利用、電子檔案信息安全維護四個功能模塊。
(一)電子檔案信息收集模塊。負責各類電子檔案信息的采集并將其輸入系統(tǒng)。根據(jù)數(shù)字檔案館數(shù)字信息資源的來源,在此模塊下設立了三個子系統(tǒng):1、館藏資源數(shù)字化系統(tǒng),包括紙質(zhì)檔案掃描子系統(tǒng)、縮微膠片數(shù)字化子系統(tǒng)、視頻資料數(shù)字化子系統(tǒng)、音頻資料數(shù)字化子系統(tǒng);2、信息接收系統(tǒng),通過卸載報盤和網(wǎng)絡在線的方式,接收立檔單位的電子檔案和應歸檔電子文件及其元數(shù)據(jù),以及下屬檔案館的電子檔案信息;3、信息搜尋系統(tǒng),通過網(wǎng)絡在線采集現(xiàn)有的各種信息資源庫,如國土信息資源庫、人口統(tǒng)計信息資源庫等;采集各網(wǎng)站的網(wǎng)頁、歷史照片、有關(guān)新聞報道、統(tǒng)計數(shù)據(jù)、歷史事件的聲像資料等其他社會零散信息,作為數(shù)字檔案館數(shù)字資源建設的補充。
(二)信息管理模塊。主要負責對采集到的信息進行整理、分類、管理,使大量無序的信息有序化。其功能主要包括:電子檔案標準化、元數(shù)據(jù)著錄、分類號主題詞自動標引、多媒體檔案標引、目錄管理、檔案鑒定、報表打印、信息統(tǒng)計等。其中電子檔案標準化子系統(tǒng)對收集來的符合或通過轉(zhuǎn)換使其符合一定規(guī)范(包括電子文件元數(shù)據(jù)標準、數(shù)據(jù)交換標準、文件的語言格式、數(shù)據(jù)交換的物理存儲介質(zhì)標準和數(shù)據(jù)交換的邏輯格式標準等)的數(shù)字信息及其元數(shù)據(jù),根據(jù)采集時所帶的目錄信息,采取一定的分類方案,將這些數(shù)據(jù)有序地存儲到系統(tǒng)中。元數(shù)據(jù)著錄子系統(tǒng)是對采集來的數(shù)字檔案信息進行內(nèi)容、結(jié)構(gòu)、背景信息等相應項目的元數(shù)據(jù)進行檢查和缺項補著錄,建立元數(shù)據(jù)庫。分類號主題詞自動標引子系統(tǒng)含有按邏輯關(guān)系將符合《中國檔案主題詞表》有關(guān)要求的主題詞和符合《中國檔案分類法》有關(guān)要求的信息分類號組合在一起所形成的一套分類號主題詞對照表,系統(tǒng)可以從“對照表”中自動提取相應的分類號?主題詞,完成標引任務。檔案輔助鑒定子系統(tǒng)可以對數(shù)字檔案信息進行批量的內(nèi)容鑒定和技術(shù)鑒定:內(nèi)容鑒定是根據(jù)檔案開放所必須具備的條件,檔案價值判定、保管期限劃分的標準,檔案真?zhèn)舞b別的主要依據(jù)等要素,同檔案文件的來源、類別、責任人、形成時間、存儲介質(zhì)等眾多信息相結(jié)合,制訂鑒定規(guī)則,利用計算機的智能技術(shù),建立起專家智能鑒定系統(tǒng),進行檔案信息的批量輔助鑒定;在此基礎上再由專家對輔助鑒定過的檔案信息進行直接鑒定,予以確認,不僅可以大大減少全部由人工直接鑒定的工作量,同時能保證鑒定的質(zhì)量。技術(shù)鑒定子系統(tǒng)是對電子文件各方面的技術(shù)狀況進行全面檢查,包括對文件信息真實性、完整性、可讀性分析以及對文件載體狀況的檢測(該系統(tǒng)目前正在研制當中)。統(tǒng)計報表子系統(tǒng)能對系統(tǒng)中的基本數(shù)據(jù)進行匯總,形成統(tǒng)計表,包括規(guī)范化統(tǒng)計表和自定義統(tǒng)計表,如檔案館基本情況年報、全年檔案利用統(tǒng)計表、溫濕度統(tǒng)計表等。
(三)信息利用模塊。負責對數(shù)字檔案館管理的海量電子檔案信息,運用計算機和網(wǎng)絡技術(shù)向社會提供超越時空界限的利用服務,可以使具備上網(wǎng)條件的用戶在任何地點、時間得到權(quán)限許可的檔案信息,真正實現(xiàn)數(shù)字檔案信息資源的共享。該模塊包括:檔案信息開發(fā),綜合智能查詢,網(wǎng)站信息發(fā)布,光盤發(fā)布等子系統(tǒng)。其中檔案信息開發(fā)子系統(tǒng)的主要功能是進行檔案信息的編研規(guī)范化和素材編輯。綜合智能查詢子系統(tǒng)可提供館藏電子檔案的文檔、圖形圖象、語音資源、視頻資源的查詢閱覽及虛擬演播等服務。網(wǎng)站信息發(fā)布子系統(tǒng)能夠?qū)^藏電子檔案通過互連網(wǎng)進行發(fā)布,提供對外信息服務。光盤發(fā)布子系統(tǒng)能將允許發(fā)布的多媒體信息資料,包括目錄數(shù)據(jù)及原文以一定的格式遷移到光盤上,形成發(fā)布盤,既能在網(wǎng)上運行閱讀,又能提供給用戶進行單機閱讀。
(四)電子檔案信息安全維護模塊。深圳數(shù)字檔案館的安全維護,從物理安全、信息資源安全和安全保密管理幾方面著手,采取了一系列措施:
1、數(shù)據(jù)遷移、備份、恢復。數(shù)字檔案館的應用系統(tǒng)分布在三網(wǎng)物理隔離的網(wǎng)絡環(huán)境中,無法直接通信,這就產(chǎn)生了信息隔膜,必須進行數(shù)據(jù)遷移。本系統(tǒng)采用的方法是先從一個網(wǎng)絡的數(shù)據(jù)庫中將數(shù)據(jù)導出到可寫光盤、熱拔插硬盤等介質(zhì),再將這些介質(zhì)接到另一個網(wǎng)絡,將數(shù)據(jù)導入其數(shù)據(jù)庫中。深圳數(shù)字檔案館系統(tǒng)的主要設備、軟件、數(shù)據(jù)、電源等都有備份,并有技術(shù)措施和組織措施可以在發(fā)生故障后較短時間內(nèi)恢復系統(tǒng)運行。服務器采用雙機備份,主工作機出現(xiàn)故障后,備份機自行啟動工作。數(shù)據(jù)脫機備份使用光盤,災難恢復采用磁帶機。服務器的UPS電源保證在停電后十小時內(nèi)仍可保持正常工作;軟件備份利用關(guān)系數(shù)據(jù)庫系統(tǒng)自身提供的功能,對元數(shù)據(jù)和存儲文件的對象數(shù)據(jù)庫進行備份恢復。
2、計算機病毒防治。采用國家有關(guān)主管部門批準的查毒、殺毒軟件,適時對服務器和客戶端查毒、殺毒,并制定嚴格的防毒制度。
3、身份鑒別。深圳數(shù)字檔案館系統(tǒng)鑒別主體身份的方法主要有二種:一是只有該用戶了解的秘密,如口令、密鑰等;二是用戶攜帶的能證明用戶身份的物品,如智能卡;三是只有該用戶具有的獨一無二的特征或能力,如指紋、聲音、視網(wǎng)膜等。凡政務網(wǎng)上的在線移交、信息檢索都要進行身份鑒別。
4、訪問控制。對用戶進行操作權(quán)的限制,包括功能權(quán)限制和數(shù)據(jù)權(quán)限制,主要防范用戶的越權(quán)訪問。
5、信息加密。分傳輸加密和存儲加密。信息傳輸加密用來防止通信線路上的竊聽、泄漏、篡改和破壞,其方式通常有鏈路加密、網(wǎng)絡層加密、應用層加密等,深圳數(shù)字檔案館系統(tǒng)采用應用層加密。凡是需要在網(wǎng)絡上傳輸?shù)臄?shù)據(jù),傳輸前必須加密。信息存儲時,對每份原文進行了加密。加密協(xié)議采用的是國際標準協(xié)議DES和RSA,具有一定的權(quán)威性。
6、信息完整性校驗。其作用是防止信息被非法篡改、插入和刪除。本系統(tǒng)采用數(shù)字水印技術(shù)保護信息的完整性。
7、安全審計。深圳數(shù)字檔案館系統(tǒng)利用數(shù)據(jù)庫、操作系統(tǒng)、安全保密產(chǎn)品和應用軟件的審計功能來完成安全審計。
五、數(shù)字檔案館與傳統(tǒng)檔案館的關(guān)系
數(shù)字檔案館的建成,并不意味著傳統(tǒng)檔案館的消亡。由于各自的主要功能不同,加之各自具備適應某種社會需求的特殊優(yōu)勢,決定了數(shù)字檔案館和傳統(tǒng)檔案館將長期共存,它們之間是一種互為補充、互相依存的關(guān)系。
(一)數(shù)字檔案館不可取代傳統(tǒng)檔案館
數(shù)字檔案館在向社會提供服務中,與傳統(tǒng)檔案館相比具有明顯優(yōu)勢,但這并不說明數(shù)字檔案館可以取代傳統(tǒng)檔案館,在現(xiàn)代社會傳統(tǒng)檔案館具有自身的優(yōu)勢,具有繼續(xù)存在和發(fā)展的生命力。
1、傳統(tǒng)檔案館的館藏主要是原始檔案的實體,在歷史真跡、憑證價值方面具有法律效力上的優(yōu)勢。當人們需要獲得法律援助時,除了在網(wǎng)上搜尋有利的信息外,還要索取不易被篡改的檔案實體原件作為原始憑證。這一社會功能的有效發(fā)揮,非傳統(tǒng)檔案館莫屬。
2、傳統(tǒng)檔案館館藏的重要檔案原件以紙質(zhì)為主,許多重要的原件進行了縮微拍攝。紙質(zhì)和膠片的壽命都遠遠超過數(shù)字化信息,且不易被篡改。據(jù)測試,機讀磁帶、唱片、硬盤的壽命僅十至幾十年,其中磁帶至多20年,壽命最長的是CD-ROM,但也只有30年左右。要想延長數(shù)字化信息的保存期限,只有不斷地重新復制。要長久保存歷史檔案文化財富,目前最可靠的還是傳統(tǒng)檔案館。
3、傳統(tǒng)檔案館以其豐富的歷史檔案和珍藏的孤本原件可供有關(guān)社會人士休閑觀賞,充分發(fā)揮檔案珍品的社會價值,盡管憑借汁算機從網(wǎng)絡上也可以搜尋、閱讀多媒體珍品信息,但從觀賞、品味的角度來講,人們更看重珍品的實體原件。在人民生活水平、文化素養(yǎng)不斷提高的現(xiàn)在和將來,這一社會需求將日益突現(xiàn)。
4、數(shù)字化信息必須借助于一定的硬件和軟件才能被用戶所利用,由于經(jīng)濟和技術(shù)發(fā)展的不平衡,在一些經(jīng)濟欠發(fā)達地區(qū),計算機和網(wǎng)絡的應用在相當長時間內(nèi)還不會普及到全體社會公眾,許多人還要造訪傳統(tǒng)檔案館,查閱、利用檔案。傳統(tǒng)檔案館的社會服務功能,還將繼續(xù)沿用很長時間。
(二)數(shù)字檔案館與傳統(tǒng)檔案館互相依存
數(shù)字檔案館與傳統(tǒng)檔案館都因社會的需求和各自的優(yōu)勢而得以生存和發(fā)展,然而由于各自都有某些弱點而必須互相依存,不能孤立地存在。
1、在檔案信息資源建設上,傳統(tǒng)檔案館館藏檔案原件是數(shù)字檔案館數(shù)字化檔案信息的重要來源;數(shù)字檔案館為傳統(tǒng)檔案館進一步豐富館藏提供線索和可能。傳統(tǒng)檔案館保存的本轄區(qū)或本專業(yè)系統(tǒng)立檔單位移交的檔案以及征集進館的珍貴檔案原件,通過數(shù)字化加工,進入數(shù)字檔案信息資源庫,成為數(shù)字檔案館數(shù)字化檔案信息中最基本的、重要的核心組成部分。離開了這一來源,數(shù)字檔案館將難以構(gòu)建完整的、有權(quán)威的信息資源庫。然而傳統(tǒng)檔案館的館藏檔案主要是根據(jù)國家規(guī)定,通過接收立檔單位移交的檔案積累起來的,而對于散存的重要檔案以及其他專門行業(yè)檔案信息的收集,卻因缺乏線索和有效途徑而難以實現(xiàn)。數(shù)字檔案館恰好在這方面具備優(yōu)勢。數(shù)字檔案館保存的數(shù)字信息,不僅有傳統(tǒng)檔案館館藏檔案的數(shù)字化信息,還包括電子政府形成的電子文件及時歸檔、政府綜合信息的及時采集。同時,數(shù)字檔案館與企業(yè)信息化建設相聯(lián)系,可與企業(yè)信息網(wǎng)絡建立互聯(lián)互通關(guān)系;與電子商務建設相聯(lián)系,可與金融、保險、政府采購、運輸、物流配送等電子商務信息服務系統(tǒng)建立聯(lián)通關(guān)系;與社會公共服務信息化建設相聯(lián)系,可與覆蓋全社會各領域(包括教育、科技、文化、醫(yī)療、社會保障等)的應用信息數(shù)據(jù)庫建立互聯(lián)關(guān)系。這樣就為傳統(tǒng)檔案館提供了進一步收集社會檔案信息,豐富館藏的線索和途徑。
2、在檔案信息資源的開發(fā)利用上,傳統(tǒng)檔案館由于缺乏強有力的開發(fā)利用手段,受時間和空間的局限而不能迅速、廣泛地為社會提供檔案信息服務,限制了檔案信息價值的發(fā)揮。數(shù)字檔案館則可以憑借網(wǎng)絡優(yōu)勢,在極廣闊的范圍內(nèi)發(fā)布數(shù)字檔案信息,不受時間、地域的限制,提供快捷、方便的服務,實現(xiàn)檔案信息資源共享。在必要的時候,可以通過傳統(tǒng)檔案館收藏的檔案原件和縮微品取得真實性印證,產(chǎn)生檔案信息的法律效力。
3、在檔案信息真跡的保護上,傳統(tǒng)檔案館優(yōu)于數(shù)字檔案館。數(shù)字化信息可以完美地被復制,也可以不留痕跡地被修改。計算機病毒、磁場、電磁脈沖都對數(shù)字化信息和計算機系統(tǒng)具有破壞性。由于信息技術(shù)發(fā)展迅速,同時也由于商業(yè)因素,數(shù)字檔案館常常遇到技術(shù)過時的問題,需要更新硬件設備和軟件版本,需要把數(shù)據(jù)遷移到新型的載體上去。而在遷移過程中容易出現(xiàn)數(shù)據(jù)丟失的問題。盡管上述問題可以采用較先進的技術(shù)得到控制性的解決,但難以從根本上杜絕發(fā)生。
4、在檔案信息的加工上,傳統(tǒng)檔案館館藏檔案信息經(jīng)過數(shù)字化加工、整序,成為數(shù)字檔案館數(shù)字信息資源的核心組成部分,并生成各種類型的信息目錄(二次文獻)和結(jié)構(gòu)較單純的檔案參考資料(三次文獻),如“大事年表”等。這種方式的二次加工,不僅免除了傳統(tǒng)檔案館人工編目、編研的繁瑣和辛勞,而且所編的目錄、資料能適合機檢和手檢、機讀和直讀,形式可以不斷更新,能滿足不同的需求,能在館內(nèi)和網(wǎng)上組建檔案信息資料目錄中心。而深層次加工的檔案編研成果(三次文獻),如:各種“綜述”、“專題概要”、“人物傳記”、“指南”以及利用館藏檔案資料編制的圖片、音像等多媒體參考資料,還要依靠傳統(tǒng)檔案館來進行,數(shù)字檔案館可以將經(jīng)數(shù)字化的深層次編研成果,融入數(shù)字信息資源庫在網(wǎng)上發(fā)布,提供服務。
(牛角摘自《中國檔案》2003年第3期)