一、數字檔案館在中國:理想與現實的差距
我國數字檔案館建設早期,檔案界在對數字檔案館概念界定和功能分析中,對其無障礙的跨庫資源共享的強大功能寄予了厚望,如何嘉蓀教授認為:“數字檔案館不僅僅是館藏得到數字化以及管理工作實現了信息化的檔案館和檔案館群體;它實質上是一個通過計算機互聯網絡有序處理和集成管理在結構各異的多種信息平臺上產生的多樣的電子文件、檔案以及其他信息,確保這些數字信息資源的真實性、完整性和持久有效性,并實現上述信息資源跨庫共享的超大規模、分布式和可擴展的數字信息系統”。[1]與何嘉蓀教授的觀點類似,馮惠玲教授認為,“數字檔案館是采用現代高新技術所支持的數字檔案信息系統,是檔案信息組織模式,代表的是一種信息環境和基礎設施構建,是超大規模的,便于使用的、沒有時空限制的知識信息中心”。[2]何嘉蓀和馮惠玲教授對于數字檔案館的認識在中國具有典型代表性,即認為數字檔案館是一個功能強大的超大的分布式檔案信息系統或知識信息中心,最終目的是實現檔案資源共享。此外,其他眾多檔案界人士也發表了自己的看法,認為“數字檔案館是用二進制編碼的數字方式存儲、處理檔案信息內容,應用計算機、通訊和多媒體技術,提供電子網絡檢索和服務的檔案信息系統,它是一個有序的信息空間,一個開放的信息環境”。[3]“數字檔案館是一個電子化信息的倉庫,能夠存儲大量各種形式的信息,用戶可以通過網絡方便的訪問它,以獲得這些信息,并且其信息存儲和用戶訪問不受地域限制,它能把包括多媒體在內的各種信息的數字化、存儲管理、查詢和發布集成在一起,使這些信息得以在網絡上傳播,從而最大限度地利用這些信息”。[4]“數字檔案館是一個數字化的信息系統,它將分散于不同載體、不同地理位置的信息資源以數字化方式存儲,以網絡化方式互相連接,從而提供及時利用,實現資源共享”。[5]“數字檔案館是以電子文件管理系統為主體,通過網絡對電子文件等數字化檔案信息實現管理與服務的虛擬檔案機構”。[6]此外,李國慶認為,數字檔案館的含義有廣義和狹義之分,廣義的數字檔案館是指存儲和利用檔案信息資源的信息空間,是一個由眾多檔案資源庫群、檔案信息資源處理中心、檔案用戶群構成的數字檔案館群體,是一個以有序的信息空間和開放的信息環境為特征,面向對象的分布式網狀結構模式。狹義的數字檔案館指其中的個體檔案館,其功能包括信息采集、整理、存儲、檢索、傳遞、保管、保護、利用、鑒定和統計等全過程,代表的是一種信息環境和信息基礎設施。[7]
從以上關于數字檔案館概念的定義來看,我國絕大多數檔案學者傾向于將數字檔案館界定為一種“信息系統”或“信息空間”,實質上是將所有類型的檔案信息囊括其中的基于數字化存儲和網絡化存取的信息空間。這種認識基本把握了數字檔案館的本質,同時也反映了人們對于數字檔案館能夠最廣泛、最大限度地實現檔案信息資源共享的美好愿望。
但現實不容樂觀。數字檔案館建設所需要的技術條件、經濟條件和法律制度在我國還比較欠缺,有待完善。首先,在技術條件方面,數字檔案館建設是一個系統工程,需要多項關鍵技術支撐,包括數字檔案信息生成技術、數字檔案標引技術、數據壓縮及海量數據存儲技術、數據挖掘技術、自動分類及智能檢索技術、數字檔案的安全保護技術,以及系統體系結構所涉及的中間件技術,等等。但僅就檔案標引技術而言,長期以來,我國檔案著錄和標引的效率較低,質量不高,主要以人工標引為主,自動標引技術中涉及的漢字詞自動切分技術尚未尋找到最優的解決方案,從而造成了檔案數據準備的頸瓶,影響了檔案數據庫生產的規模和速度。其次,在經濟條件方面,我國東西部經濟發展不平衡,深圳、上海、北京、天津、青島等經濟發達地區的數字檔案館建設有充足的地方財政支持,而中、西部地區的數字檔案館建設則普遍存在資金缺口。再次,我國數字檔案館建設所需要的基本法律制度和標準體系尚待完善和加強。我國已有的與電子文件和數字檔案館有關的主要法律法規有:《檔案法》(1987,1996)、《電子簽名法》(2004)、《電子公文歸檔管理暫行辦法》(2003),檔案工作國家標準有:《CAD電子文件光盤存儲、歸檔與檔案管理要求 第一部分:電子文件歸檔與檔案管理GB/T17678.1-1999;第二部分:光盤信息組織GB/T17678.2-1999》,《電子文件歸檔與管理規范》(GB/T 18894-2002),《中國檔案機讀目錄格式》(GB/T 20163-2006),檔案工作行業標準有:《紙質檔案數字化技術規范》(DA/T 31-2005)、《公務電子郵件歸檔與管理規則》(DA/T 32-2005),等等。此外,2008年國家檔案局相繼制定推出了三項檔案行業標準的征求意見稿:《電子文件元數據標準》(征求意見稿)、《電子文件管理細則》(征求意見稿)和《數字檔案信息輸出到縮微膠片上的規定》(征求意見稿)。從時間上看,上述法律、法規和標準大多出臺于2002年以后,比較新;從內容上看,基本是關于電子文件管理的國家規范和標準,而關于數字檔案館的系統設計、功能定位及信息服務等方面的標準明顯缺失。
由于經濟技術條件的限制,社會信息化發展水平的制約,以及法規、標準的缺失或滯后,我國數字檔案館建設進展緩慢?,F階段我國國家級的數字檔案館的建設模式還沒有出臺,數字檔案館建設暫時處于自下而上的實驗摸索狀態。我國的數字檔案館工程從2000年開始,經過8年的發展,在總體上仍停留在館藏數字化和建立檔案網站階段。數字檔案館建設基本屬于狹義的個體數字檔案館建設范圍內,離真正意義上的具備電子文件在線存取和長期保管功能,實現信息資源跨庫共享的超大規模、分布式和可擴展的數字信息系統的理想還相當遙遠。因此,很多機構在數字檔案館建設過程中確立了“兩步走”的發展策略,首先,確立和實現近期目標,建立分布式檔案基礎數據庫和電子文件中心,其次,再在此基礎上建設數字檔案館。
二、當前我國數字檔案館建設的特點
我國數字檔案館建設具有如下特點:相對獨立性、與電子政務關系密切、模式多樣性、數字檔案館建設具有地區不平衡性和階段性。
(一)相對獨立性
國外的檔案工作與圖書工作關系密切,很多圖書館藏有珍貴的歷史檔案,因此檔案數字化往往是與圖書館數字化同時進行。在OCLC等國外很多大型檢索系統內我們可以看到,數字化檔案、手稿與圖書、地圖、期刊以及音像制品已經集成管理并統一提供利用。著名的美國電子文件檔案館項目(ERA)以OAIS、InterPARES、DOCT等6個大的合作項目為核心,是檔案部門與科技界、政府部門、IT界和圖書館界廣泛合作的典型。
我國的數字檔案館都是在檔案系統內獨立開發的,與圖書館沒有合作的傳統,鮮有與圖書館界、科技界和IT界廣泛合作的先例。這對于檔案館來說是一個很大的挑戰,需要自行設計和建設獨立的數字檔案館,由于資金、技術和人才等方面因素的限制,不可能在短時期內建成。目前很多數字圖書館項目基本處于館藏數字化和檔案網站建設階段,檔案館網站的信息內容有待充實,許多檔案館還在進行數據準備和錄入工作,而對于電子文件的接收則由于法規標準的缺乏或電子文件管理系統本身的不完善沒有真正開展。我國數字檔案館建設的獨立性雖然有利于建設獨具特色的數字檔案館系統,但與圖書館界、科技界和IT界的隔離不利于汲取先進的技術和方法,也不利于社會公共信息資源的集成和共享。
(二)與電子政務關系密切
我國電子政務的發展開始于20世紀90年代,逐步由政府上網公開政務信息階段發展到網上辦公階段。電子政務為數字檔案館和電子文件中心的建設提供了十分難得的契機,在經費、技術和資源上成為數字檔案館和電子文件中心建設的最重要支撐。相應的,現階段數字檔案館和電子文件中心擔當了電子政務數據中心的重要角色。
隨著電子政務工程的推進,電子政務環境中產生的電子文件管理問題日益受到關注,國家檔案局高度重視電子政務活動中電子文件的歸檔和長期保存問題,于2007年開始研制電子文件管理的國家戰略,并促成了全國省、市級綜合性檔案館紛紛設立電子文件中心。電子文件中心的一項基本職能是接收和保管電子政務活動中形成的現行電子文件,為政府各項活動和決策提供信息支持。同時,電子文件中心可以在政府和檔案館之間發揮中轉站的作用,最終成為數字檔案館工程的一個有機組成部分。
(三)模式多樣性
我國檔案館主要有三種類型:綜合性檔案館、部門檔案館和企業檔案館。它們在數字檔案館的建設過程中不可能采取統一的模式,這是由它們各自不同的服務范圍和社會性質所決定的[8]。綜合性檔案館的館藏最豐富,服務范圍和對象是整個社會公眾,承擔著保護社會記憶,傳承人類文明的歷史重任,其社會性最強,因此,在數字檔案館模式選擇中需要充分發揮其社會性和公共性。而部門檔案館主要服務于專業系統或部門內部,主要是科技檔案等專門檔案材料的存取和利用,其服務面相對狹小而且具有行業和專業特色。企業檔案館的館藏來源于本單位,僅為本單位服務,服務范圍最小,專業性也很突出,必須考慮為企業的經濟效益服務。因此,不同類型的檔案館具有不同的規模、服務范圍和社會性質,它們的數字檔案館建設在總體規劃、功能設計、運行機制等方面存在明顯差異。在宏觀管理層次,國家檔案局已組織了若干相關課題推動數字檔案館的建設工作,但全國統一規劃尚未完成。[9]
(四)地區發展的不平衡性
數字檔案館產生于發達的信息社會,它需要大量資金投入以及現代高新技術的支撐。我國東部沿海地區和中西部地區在經濟、文化和技術等方面的實力相差懸殊,數字檔案館的建設必然存在地區不平衡性。從已經開始的數字檔案館項目來看,東部地區占了絕大多數,而中西部地區的很多檔案館由于各方面條件限制無法啟動數字檔案館項目。
(五)建設過程的階段性
數字檔案館建設必須以檔案館業務工作自動化為基礎,認為在數字檔案館建設過程中可以實現跨越式超常規發展的想法是不切實際的。數字檔案館建設一般需要經歷以下三個階段:
第一個階段:檔案館自動化階段。實現檔案實體管理和檔案信息組織的自動化。
第二個階段:單個數字檔案館建設階段。主要包括館藏數字化、檔案數據庫建設和檔案網站建設,并能夠實現對電子文件的遠程存取。
第三個階段:多個數字檔案館互聯階段。實現多個數字檔案館之間的互操作,以各個數字檔案館共同遵循的高層協議為基礎,整合各個檔案館的資源并提供統一的檢索入口。
我國大部分省級以上的綜合檔案館,國家專業系統和大型企業的檔案館,以及有關高校的檔案館已經具有了檔案自動化的基礎,館藏數字化工作正在持續進行,目錄型和全文型數據庫也在紛紛建立。全國90%以上的省市檔案機構已經建立了檔案網站,經國家檔案局批準,中國檔案報社主辦的中國檔案系統的龍頭網站——中國檔案網已經于2007年7月開通。
總體上,我國東部發達地區的數字檔案館建設處于第二階段即單個數字檔案館建設階段,而中西部地區的數字檔案館建設還處于由第一階段向第二階段的過渡期。
三、電子文件中心——我國數字檔案館的重要組成部分
(一)電子文件中心的產生及性質
電子政務及政府信息公開政策的推行,催生了電子文件中心。電子文件中心產生的直接原因是滿足電子政務對電子文件的集中管理、安全保護和實時利用的需求。在電子政務環境下,電子文件的集中管理、保存和利用問題日趨突出。根據國家檔案局2006年組織的一次調查結果顯示,中央和國家機關、中央企業已有將近80%的單位采用了辦公自動化或電子政務系統,共已產生各種類型電子文件近2億件,成為各項工作真實記錄的重要組成部分。在中央和國家機關層面,目前產生的電子文件種類復雜、格式多樣,已經高達數十種;操作系統、自行開發的應用系統多種多樣,也有幾十種;電子文件管理的責任部門不統一,接近50%的電子文件由檔案部門管理,其余的由信息技術部門、文件管理部門、業務部門或者幾個部門共同管理。由此帶來的電子文件運行管理中出現的安全保管、長久流傳、共享利用等問題,直接影響到了國家數字記憶的保存和電子政務效能的發揮。[10]在此背景下,電子文件中心應運而生,它是一個能夠實現在線接收、保管和存取的電子文件管理機構,是在政府電子文件數量急劇增加的推動下,順應電子文件保管和利用的需要而建立起來的電子文件保管和利用中心。
我國首家電子文件中心是2004年12月28日建成的江蘇省常州市電子文件中心?!督K省檔案信息化建設規劃綱要(2005-2010年)》明確提出了“2008-2010年,全省100%的國家綜合檔案館全面建成與電子政務相配套的電子文件中心”的目標。[11]目前,江陰市、安徽省、天津市、上海市、江蘇省、安徽省、山東省、廣東省、四川省、陜西省等全國十多個省市都已經建立了電子文件中心。電子文件中心在全國有迅速擴展之勢。
電子文件中心不是一個獨立的實體機構,它掛靠于政府的電子政務網絡平臺,往往由橫跨若干部門的成員合作開發,并由一個相對固定的團隊來主持和維護,是各級國家檔案館的內部組織部分。[12]電子文件中心負責制訂統一的電子文件交換格式和存檔格式,對所屬單位政務活動中產生的具有保存和利用價值的各類電子文件實行集中管理和保存,輔助黨政機關辦公和決策,并向社會提供政府現行文件的閱覽和查詢服務,保存“電子化的歷史”。[13]根據其功能和目的,可分為半現行電子文件中心和現行電子文件中心。半現行電子文件中心是為處于半現行階段的電子文件而專門建立的文件管理和利用中心;現行電子文件中心基于電子政務網絡平臺,是政務工作的附屬和延伸,其實質是網上的“現行文件閱覽室”。我國目前的電子文件中心多屬于后者,即現行電子文件中心。[14]
(二)電子文件中心對數字檔案館功能的重要補充
我國的數字檔案館和電子文件中心不是同時出現,而是先后出現的。數字檔案館建設開始于2000年,電子文件中心設立開始于2004年。數字檔案館建設內容包括兩個方面:持續進行的大規模的館藏數字化工作,以及檔案網站的建設和信息發布工作。但電子文件的在線接收和存取服務由于相關法規、標準和技術等方面條件的限制一直未能開展,而代之以同時移交和保存同一文件電子版和紙質版的“雙套制”,顯然,“雙套制”對移交機關和檔案部門都造成了負擔,也不利于電子文件的實時利用和發布。我國數字檔案館從開始建設至今,一直未能妥善解決電子文件在線接收和存取的問題,而電子文件中心的出現則使這一問題的解決出現了希望。
電子文件中心應擁有自身的相對獨立性,它的主要功能是在線接收和保管電子政務活動中產生的現行文件,并提供公共利用。[15]電子文件中心應該納入數字檔案館系統,它是數字檔案館的前端和入口,是連接數字檔案館與電子政務各系統連接的橋梁和紐帶。因此,電子文件中心建設和數字檔案館建設一定要在流程、標準、技術、軟件設計、硬件配置等方面相互銜接、相互匹配。[16]
綜上所述,我國數字檔案館建設在現有的經濟、技術和管理條件下具有自己的特色。通過分析我國數字檔案館建設的現狀、特點和典型模式,以及電子文件中心在數字檔案館建設中的作用,我們可以得出如下4條結論:
第一,各類型數字檔案館建設不可能遵循統一的模式,但國家綜合性數字檔案館的基本建設標準應該適時出臺。數字檔案館有著從個體到群體的建設發展階段,個體發展時期很難統一模式,而我國正處于個體數字檔案館建設階段,所以很難遵循統一的模式。但在數字檔案館的系統框架和功能需求方面,國家綜合性數字檔案館項目對于數字信息的長期保存和提供利用應該有更高的、統一的標準和要求。
第二,我國數字檔案館建設必須實行分步走的策略。數字檔案館應具備電子文件在線存取和長期保管功能,建立分布式和可擴展的數字信息系統,最終實現信息資源跨庫共享。受制于我國的經濟、技術和法制條件,這種功能和目標不可能一蹴而就,必須實行分步建設的策略。首先,實行館藏數字化、建立檔案信息數據庫和檔案信息上網,其次,解決電子文件的在線存取問題。最后,建立多個數字檔案館之間的聯盟。
第三,借鑒數字圖書館建設的經驗和成果,采用已有的先進、成熟技術。我國的數字圖書館工程比數字檔案館開始早,技術力量雄厚,數字圖書館建設中的許多技術如數字化技術、海量存貯技術、信息標引和檢索技術、信息安全技術等都可為數字檔案館建設提供借鑒。
第四,及時制定我國數字檔案館建設標準,并與國際標準接軌。應積極引進國際標準0AIS(Open Archival Information Access ,ISO:14721),設計數字檔案館的系統框架和元數據框架。OAIS不僅具有一般數字信息管理系統的功能,如接收、數據管理、存取和公共服務等功能,更重要的是,它具有十分強大的針對數字信息長期保存的功能,包括:行政管理(含各種政策)、檔案存儲和保存計劃,這就為數字信息的長期保存提供了依據。目前中國數字檔案館建設基本是各自為政,在數字信息長期保存的功能設計和元數據框架方面尚無統一的國家標準,應建立基于OAIS的中國數字檔案館國家標準。
注釋:
[1]何嘉蓀:《保存電子文件背景信息的重要手段———再論全宗、案卷形態的異化》,《檔案學通訊》,2001(5):43-47
[2]馮惠玲,張輯哲主編:《檔案學概論》.北京:中國人民大學出版社,2001
[3]張曉霞,王宇暉,王萍:《數字檔案館——21世紀檔案館的新發展》,《蘭臺世界》,2000(1):19-20
[4]傅榮校:《關于數字檔案館的思考》,《檔案學通訊》,2001(5):26-28
[5]王宇暉:《21世紀數字檔案館發展之我見》,《檔案與建設》,2000(3):4-5
[6]趙屹,陳曉暉:《對數字檔案館的簡單認識》,《檔案學通訊》,2003(5):38-41
[7]李國慶:《數字檔案館概論》,北京:中國檔案出版社,2003,p10,28
[8]傅榮校,陳榮紅:《數字檔案館模式研究——現階段不可能有統一模式》,《檔案學通訊》,2005(4):44-47
[9]邱曉威:《數字檔案館及其建設模式》,《中國檔案》,2001(10):38-41
[10]張建輝:《全國電子文件中心建設經驗交流會記實》,《電子政務》,2007(6):88-89
[11]張照余:《開展電子文件中心研究勢在必行》,《浙江檔案》,2005(8):4-5
[12]馮惠玲:《綜合檔案館電子文件管理項目的功能定位》,《檔案學通訊》,2007(6):69-73
[13]王萍:《電子政務環境下電子文件中心問題研究》,《檔案》,2007(3):6-8
[14]張照余:《電子文件中心引論》,《檔案學研究》,2005(4):7-10
[15]何嘉蓀:《現行文件閱覽中心、文件中心與數字檔案館》,《檔案學研究》,2003(1):32-35
[16]邱曉威:《電子文件中心的建設及其發展問題的分析》,《中國檔案》,2006(12):9-10
[作者簡介]肖秋惠,管理學博士,武漢大學信息管理學院檔案與政務信息學系副教授,副主任。原載于《檔案學通訊》2008年第六期