華東師范大學檔案館館長朱小怡
一、數字檔案館的概念與內涵
數字檔案館是21世紀檔案事業發展中一個全新的命題,也是近年來檔案界廣泛使用的一個概念。二十世紀初,隨著電子政務、電子商務、數字化校園的快速發展和數字檔案資源的與日俱增,數字檔案館研究初見端倪。歐美等發達國家紛紛投資建設。其中比較有影響的項目有美國的電子文件檔案館、英國的聯合王國數字檔案館和日本的關西數字檔案館等。國內,一些國家綜合檔案館和企事業單位檔案館也開始付諸行動,并取得一定的成效。例如深圳市數字檔案館、青島市數字檔案館、江蘇省電力公司數字檔案館和浙江大學數字檔案館等。“十一五”期間,全國各地、各行各業還會啟動更多的數字檔案館建設項目。
雖然社會快速發展的信息化進程決定了數字檔案館建設發展的必然性。但是,時至今日,不同的數字檔案館建設項目仍然按照各自的理解在使用著數字檔案館的概念。這將會對數字檔案館理論與實踐造成一定的負面影響。因此,本文試圖結合工作實踐,對數字檔案館的概念及內涵再作一些系統的研究與探討,以期通過進一步的研討,促進對數字檔案館內涵的共識。
(一)數字檔案館定義研究概述
與數字圖書館建設初期一樣,20世紀90年代末,電子檔案館(Electronic Archives)、虛擬檔案館(Virtual Archives)、沒有圍墻的檔案館(Archives without Wall)、全球檔案館(Global Archives)、超級檔案館(Hyper Archives)、數字檔案館(Digital Archives)等新名稱不斷見諸報刊。但是,隨著數字圖書館從概念變成現實,檔案界對于數字檔案館的表述也漸趨統一。
然而,對于不同的研究者而言,數字檔案館仍然有著不同的內涵。檔案界、計算機界、國際標準組織機構以及檔案用戶等,都在試圖從不同的角度來闡述這一概念。
1、信息系統論
信息系統論是當前檔案界對數字檔案館概念描述中的一種主要提法,其核心是將數字檔案館定義為一個超大規模的“信息系統”。例如:數字檔案館是指以二進制編碼的數字方式存儲、處理檔案信息內容,應用計算機、通訊和多媒體技術,提供電子網絡檢索和服務的檔案信息系統。數字檔案館是政府信息資源的數據中心和數據交換站,它是建立在現代信息技術的普遍應用基礎上,利用數字手段,以高度有序的綜合檔案信息資源為處理核心,以高速寬帶通信網絡為技術設施的超大規模、分布式數字信息系統,屬于國家數字化信息基礎工程[2]。定義強調數字檔案館是一個信息系統,但是,沒有給出信息系統的確切內涵。即沒有具體闡明信息系統是指生成、發送、接收、儲存、處理、交換與發布數字檔案和電子文件的人與機構,檔案信息計算機管理軟件系統,還是兼而有之或其他。
2、信息倉儲論
信息倉儲論也常見諸報端。持這一觀點者通常將數字檔案館定義為“信息倉庫”、“知識信息中心”、“數據中心和數據交換站”等。例如:數字檔案館是一個電子化信息的倉儲,能夠存儲大量各種形式的信息,用戶可以通過網絡方便地訪問它,以獲取這些信息,并且其信息存儲和用戶訪問不受地域限制。它能把包括多媒體在內的各種信息的數字化、存儲管理、查詢和發布集成在一起,使這些信息得以在網絡上傳播,從而最大限度地利用這些信息[3]。所謂“數字檔案館”,就是將傳統的以紙張、磁帶、錄像帶等為存儲介質的各種原始檔案資料,通過掃描、壓縮、轉化等手段轉換成PDF格式的文件,通過文字識別等技術得到對應于每張圖片的索引字段,再運用分級存儲管理技術將PDF文件和索引字段存儲于光盤庫、磁帶庫等各種大容量的存儲介質上,并可通過各種方便的查詢手段迅速地檢索出所需要的檔案資料,同時以上形成的數字化檔案資料可以發布到局域網、廣域網,最終實現“數字檔案館”[4]。定義強調了數字檔案館的信息存儲和傳播功能,但對數字檔案館本質屬性的描述存在著一定的局限性。
3、信息環境論
信息環境論將數字檔案館看作是一種“信息組織模式”,一種以文件和檔案信息為特定對象的有序的“信息空間”和開放的“信息環境”。例如:數字檔案館是采用現代高新技術所支持的數字檔案信息系統,是檔案信息組織模式,代表的是一種信息環境和基礎設施構建,是超大規模的、便于使用的、沒有時空限制的知識信息中心[5]。定義對數字檔案館本質屬性的表述顯得比較宏觀與抽象,環境的內涵究竟是什么,難以具體認知。
4、功能拓展論
功能拓展論將數字檔案館定義為傳統檔案館利用現代技術拓展服務功能的一種方式。例如:數字檔案館是傳統檔案館功能的擴大,它以統一的標準和規范為基礎,將有價值的館藏信息資源數字化和通過各種途徑收集、捕獲的有價值的電子文件信息,在加工處理后以數字化形式進行存貯,并以智能檢索技術為手段,提供統一友好的檢索界面,利用先進的信息處理技術和互聯的計算機網絡,向用戶提供多媒體數字信息服務[6]。定義描述的是數字檔案館與傳統檔案館的內在聯系,也沒有確切地揭示數字檔案館的本質屬性。
其它還有一些類似的釋義,不再一一列舉。從以上幾種定義來看,多為描述性定義,差異較大,各具特色,反映了不同研究者從不同的視角所得到的數字檔案館概念。
那么,怎樣才能從當代信息科學與檔案學的角度來對數字檔案館這一詞語的含義進行認定和概括,使所有數字檔案館建設者都能夠清晰地勾勒出未來的目標呢?筆者認為,只有對數字檔案館這一信息時代“新生兒”的本質屬性與內涵有一個全面的了解與認識,才能得出相對比較完整和清晰的數字檔案館定義。
(二)數字檔案館的定義及其內涵
綜上所述,我們是否可以這樣來定義:數字檔案館是在分布式計算機網絡環境中,利用數據庫技術、數字技術、多媒體技術和計算機網絡技術創建、獲取、存儲、處理、交換與發布數字檔案信息的檔案信息管理與服務機構,是各級政府和各單位信息化建設的有機組成部分。這一定義包括了三個方面的涵義:
1、揭示了數字檔案館的本質屬性是數字檔案信息的管理與服務機構,即生成、發送、接收、儲存、處理、交換與發布數字檔案和電子文件的人與機構。
以往,檔案界關于數字檔案館的定義一般分為“虛”、“實”兩種類型。所謂“虛”即把數字檔案館定義為一種技術模式,一個數字化的信息系統,一種以文件和檔案信息為特定對象的有序的信息空間和開放的信息環境。所謂“實”則是將數字檔案館定義為一種實體概念、機構概念,一種新的檔案館形態概念。筆者比較贊同后一種觀點。原因在于(1)前者所說的技術模式和信息系統都離不開生成、發送、接收、儲存、處理、交換與發布數字檔案和電子文件的人與機構這一基本點。數字檔案館與人和機構的職能密不可分,在人和機構的管理下有效運行。計算機軟件系統只是由人和機構控制的數字檔案館的運作工具,而不是數字檔案館或者說信息系統的全部。(2)本定義所指的數字檔案信息管理與服務機構并不一定局限于傳統檔案館的范疇。既可以是復合檔案館(傳統檔案館+數字檔案館)的組成部分,也可以是機關、團體、企事業單位的數字檔案管理部門或其他新型的數字檔案信息管理與服務機構。例如,如商業化的檔案數據庫開發商等。數字檔案館,尤其是廣義數字檔案館的運行,將更依賴這些機構之間的協同工作。
2、明確了數字檔案館在國家信息化建設中的重要地位,即數字檔案館是各級政府和各單位信息化建設的有機組成部分。
數字檔案館建設的最終目標是要通過國家信息基礎工程把各級各類檔案館組織在一起,把檔案信息與其他門類信息綜合起來,作為國家信息資源的組成部分,面向全社會發揮作用[7]。所以,數字檔案館建設項目、尤其是國家綜合檔案館的數字檔案館建設項目應該從一開始就納入到國家信息基礎工程之中統一規劃與設計。數字檔案館不僅僅指某個檔案館的計算機業務管理系統,也不是簡單地通過計算機網絡連接在一起的檔案館群體,更不是封閉的檔案館信息網絡,而是辦公自動化系統、計算機輔助設計系統、業務信息管理系統以及公共信息管理系統等信息系統的重要組成部分。數字檔案館的核心資源主要來自相關的信息系統,同時又可與相關信息系統進行信息共享。
3、確定了數字檔案館的主要任務是在分布式計算機網絡環境中,利用數據庫技術、數字技術、多媒體技術和計算機網絡技術創建、獲取、存儲、處理、交換與發布數字檔案信息。
數字檔案館的主要任務可分為兩大部分:即數字檔案資源建設與信息服務。其中,資源建設主要包括創建、獲取、存儲、處理數字檔案信息四個環節;信息服務包括交換與發布數字檔案信息二個環節。從表面看,數字檔案館的任務與傳統檔案館有著許多異曲同工之處,但仔細分析一下,兩者的內涵存在著很大的差異。(1)管理對象不同。數字檔案館的管理對象是數字檔案,這是一種新型的檔案,其存儲方式和管理要求與傳統檔案有著很大的差別。(2)資源建設的途徑與方式不同。數字檔案資源來源之一是相關的信息系統中具有保存價值的電子文件和數據,來源之二是被數字化的檔案館藏,來源之三是通過搜索引擎獲得的具有檔案性質的網絡信息與資料,來源之四是購買商業公司開發的專題檔案數據庫,來源之五是其他可共享的數字檔案館資源。這與傳統檔案館根據國家規定,通過接收、征集相關部門檔案來組織各自特定館藏的資源建設模式有著很大的區別。(3)信息服務的方式與范圍不同。數字檔案館借助數據庫技術、數字技術、多媒體技術和計算機網絡技術開展檔案信息的網上采集與服務,不受地域、時間、檔案實體物理位置的限制,可以全方位、零距離地接收檔案和為用戶提供信息服務,大大拓展了傳統檔案館的收集與服務功能。
此外,基于職能范圍與組織形式的不同,數字檔案館還有廣義與狹義之分。廣義數字檔案館是指基于網絡環境、采用面向對象分布式網狀結構管理模式、由眾多檔案資源庫和檔案信息資源管理與服務機構組成的數字檔案館群體。而狹義數字檔案館則是指擁有特定的檔案資源庫及專業管理人員,借助現代技術履行和拓展傳統檔案館的檔案信息管理與服務功能,為廣義數字檔案館提供數字檔案信息資源和技術支持的檔案信息資源管理與服務機構個體。兩者相輔相成,密不可分。廣義數字檔案館是數字檔案館建設的最高境界,而狹義數字檔案館則是廣義數字檔案館的基石與重要組成部分。
二、數字檔案館理論體系建設
數字檔案館的理論研究涉及多個學科領域。例如,檔案學、信息學、計算機科學、管理學等。不同學科領域的研究者攜手開展數字檔案館理論研究,勢必會更加有力地推進數字檔案館理論體系的建設。但是,對于數字檔案館這一檔案工作創新變革的產物,檔案界似應更多地承擔起建設相關理論體系的重任。鑒于檔案學科是一門實踐性很強的學科,本文試圖從檔案學理論研究與檔案工作實踐相結合的角度,對數字檔案館理論體系建設的內容作一些初步的探討。
(一)數字檔案館基礎理論建設
數字檔案館基礎理論研究離不開傳統檔案學科基礎理論研究的基礎,是對傳統檔案學基礎理論研究的深化與拓展。這部分內容主要包括:(1)數字檔案的定義及邊界。例如:數字檔案館的管理對象究竟是什么?與圖書館、博物館和其他信息管理機構的管理對象有什么區別與聯系?大檔案的概念外延到底有多大?這對于當前檔案部門科學構建數字檔案館信息資源庫,合理配置有限的人財物資源具有重要的指導意義。(2)數字檔案館的管理體制與機制。例如,在數字化、網絡化的環境下,如何理解和貫徹檔案工作“統一領導、分級管理”的組織原則,建立起科學的數字檔案館體系,推進數字檔案資源的共建與共享?如何構建數字檔案館的績效評估機制等。(3)狹義數字檔案館的組織架構、工作環節以及相關的工作原則與要求。例如,數字檔案信息的創建、獲取、鑒定、存儲、處理、交換、發布、利用、保密等應采取哪些策略,建立哪些制度?在數字化的環境下,如何根據數字檔案的形成目的、形成活動、形成過程、處理程序和職能范圍來正確運用檔案管理的基本原則----來源原則等。
上述理論問題,在目前的檔案學理論研究專著及教材中所占的比重相對偏少。一般只是在涉及電子文件管理的相關章節中作一些概要的介紹。與數字檔案館建設實踐的推進速度相比較,檔案界關于數字檔案館基礎理論的研究還顯得比較欠缺和薄弱。然而,在當前社會信息化快速發展的大背景下,檔案學科領域基礎理論研究的或缺,勢必會導致實踐的盲目性和無所適從,進而加速檔案工作的邊緣化趨勢。筆者認為,檔案工作者需要學習、了解和掌握現代信息技術,更需要明白自己的歷史使命與工作內涵。數字檔案館既不能成為信息孤島,也不是一個沒有獨特內涵、漫無邊際的信息大倉庫。需求不明晰往往是導致一些數字檔案館建設項目難以達到預期效果的一個重要原因。
(二)與數字檔案館建設有關的法律規章建設。
這方面的內容有很多,這里只能列舉一些實踐中遇到的、亟需解決的法律規章問題。(1)檔案工作的法律規章。例如,關于各級各類數字檔案館獲取數字檔案資源合法性的確認程序與方法;實施雙套制歸檔的電子文件范圍的確定與監控措施等問題。(2)政府信息公開的法律規章。例如,由檔案館負責發布、用于政府信息公開的電子文件與各機關檔案室移交進館的電子文件之間的關系問題,政府信息公開電子文件歸屬與處置權問題等。(3)著作權、知識產權保護的法規政策。例如,數字檔案的處置權和公布權確認程序與方法等。(4)保護公民隱私權、知情權的法規政策。例如,在數字檔案信息的發布與利用過程中,如何正確處理保障公民隱私權與知情權的關系,積極推進信用檔案以及其他社會公共信息資源的社會利用問題。(5)信息共建共享的法規政策。例如,如何建立信息共建共享的保障機制,在數字檔案資源整合的過程中明確有關各方的責任與義務、確保有關各方的權益和利益的問題。
數字檔案館建設的主要宗旨之一就是要充分開發利用檔案信息,為國家、社會和公民提供高效、便捷的服務,推進政府信息公開、構建社會主義和諧社會。但是,對于目前檔案信息開發利用中涉及到的許多法律問題,現有的法律規章中沒有明確的規定。例如,《中華人民共和國檔案法》規定:檔案一般應自形成之日起滿30年向社會開放。那么檔案館館藏檔案中的大量屬于信息公開范圍的文件,是否可以先行納入數字化范圍,通過網絡向社會發布?發布的依據是什么?這里就涉及到《檔案法》與政府信息公開規定之間相互銜接的問題。綜上所述,檔案界應注意總結和發現數字檔案館建設實踐中遇到的法律問題,積極推進相關法律規章的修訂與完善,確保數字檔案館建設有法可依,為數字檔案館建設提供有力的法律保障。
(三)數字檔案館的標準體系建設
在信息化建設快速發展的今天,標準體系建設已經越來越受到檔案界的重視與關注。涉及數字檔案館建設的標準主要可以分為三個層面:(1)管理標準。管理標準是數字檔案館規劃、設計、建設、驗收、測評、運行與維護的依據,主要由軟硬件工程標準、系統安全管理及等級保護標準、驗收與監理標準、測試與評估標準、質量控制與認證標準等組成,可用于對數字檔案館建設項目進行風險管理與質量控制。(2)業務標準。業務標準是數字檔案館資源建設與信息服務工作的規范。主要內容有:①基礎標準體系(包括基本術語、業務過程建模、業務過程規范的描述語言和業務過程規范標準等),是數字檔案館總體設計的依據。②信息資源標準體系(包括信息收集范圍及保管期限,數據結構、信息分類編碼、數據交換、文本和辦公系統、置標語言、目錄體系和Web服務、中文漢字編碼和漢字編碼字符集標準等),是信息資源能夠互聯互通和有效應用的基礎保障。(3)技術標準。技術標準是數字檔案館建設過程中最基本的要素。主要內容有:①技術基礎標準體系(包括信息技術術語、中文平臺、多媒體與圖形圖像、存儲媒體、數據庫、地理信息、軟件和設備標準等)。②網絡通信標準體系(包括網絡體系結構、網絡管理、電纜光纜、綜合布線和配套設施標準等)。③信息安全標準體系(包括密碼技術、安全協議、標識與鑒別、訪問控制、電子簽名、完整性保護、抗抵賴、審計與監控、公鑰基礎設施、物理安全技術標準等)。
標準體系是數字檔案館資源整合與共享的重要基礎,是有效形成和促進數字檔案館與相關信息系統業務協同的必不可少的條件。鑒于一個科學、高效的數字檔案館體系需要按照社會信息化整體環境的要求來組織,上述數字檔案館標準體系的建設應盡可能注意與國際接軌,并盡可能借鑒使用相關信息管理領域已經采用的比較成熟的標準,以保障信息交換的暢通。就目前國內的研究情況來看,主要的問題還是缺乏數字檔案館的頂層設計。雖然近年來,在國家檔案局的領導與組織下,理論工作者和實際工作者正在合作開展相關標準的研究,并已形成一批與數字檔案館業務建設有關的標準規范。但是,從總體上來說,標準體系的研究還是相對比較滯后。這一現象已經成為制約數字檔案館建設發展的一個主要因素。改變這一狀況的辦法主要有:(1)學習借鑒相關的國際、國內已有的技術標準。要組織力量對已有的標準進行翻譯、梳理,形成體系,為數字檔案館建設項目提供切實可行的標準與依據。(2)繼續組織理論工作者和實際工作者攜手進行管理標準和業務標準的研究與制訂。要重點關注對數字檔案館建設實踐具有重要指導意義、目前暫無國際標準、國家標準和行業標準可借鑒的標準。例如:系統安全管理及等級保護標準,驗收與監理標準,測試與評估標準,質量控制與認證標準,業務過程規范標準,信息收集范圍及保管期限、數據結構、信息分類編碼、數據交換等方面的標準。逐步從管理、業務和技術三個層面上形成較為完整的數字檔案館標準體系,為方興未艾的數字檔案館建設實踐提供科學指導。
參考文獻
1、劉東敏、莫榮海:“關于數字檔案館的思考”,《海南檔案》,2002(2)
2、曾軍:“論怎樣建設數字檔案館”,
http://www.gygov.gov.cn/danganju/myweb/xueshu_05.htm/2003-06-30
3、傅榮校:“認識數字檔案館----兼論數字檔案館與虛擬檔案館的區別”,《中國檔案》,2001(5)
4、數字方舟數字檔案館解決方案,
http://www.soft6.com/solution/220/2003-11-23
5、數字檔案館的建設意義,
http://da.yctc.edu.cn/newshtml/ltzx/20030519150452.htm/2003-05-19
6、潘連根:“數字檔案館的定義及特征----數字檔案館研究之二”,《浙江檔案》,2004(4)
7、楊公之:《檔案信息化建設導論》,北京:中國檔案出版社,2001
8、馮惠玲、張輯哲:《檔案學概論》,北京:中國人民大學出版社,2001
9、房慶:“掌握信息化標準,推動信息化建設”,
http://www.standardcn.com/article/show.asp?id=5940/2006-03-27