當二十世紀的尼葛洛龐帝 (NicholasNegroponte)在《數字化生存》(Being Digital)一書中,向人們描述著數字時代對我們的生活方式、工作方式甚至思維方式帶來的各種沖擊時,人類文明已經真實地邁進了二十一世紀,數字化信息時代的大潮朝著我們撲面而來。檔案管理和利用如何應對及適應數字化信息時代的需求,是我們檔案工作者要思考的。
一、傳統檔案館的數字之路
2000年12月,國家檔案局、中央檔案館印發的《全國檔案事業發展“十五”計劃》,把“加快檔案信息化建設”、“加快現有檔案的數字化進程”列入其中,同月國家檔案局在中國檔案管理現代化建設研討會上宣布:十五期間,我國將加快數字化檔案館的建設。由此,傳統檔案館數字化建設的問題引起了人們的關注,并且有一些檔案館已經開始對此投資建設。我們認為,傳統檔案館的數字之路并非一蹴而就,而是一個循序漸進的過程,對這個過程的各個環節進行深入的分析研究是十分必要的,只有在有了清楚認識的基礎上,才能規劃和解決好檔案館的數字化之路,為今后的數字化檔案館進而是數字檔案館、虛擬檔案館的建設打好基礎。
傳統檔案館的數字之路由三個相互聯系的階段組成:(一)檔案館數字化。檔案館的數字化包含著以下三層含義,其一是隨著計算機技術的引入,建立檔案館的自動化系統,實現檔案館自動化管理,完成檔案管理的數字化;其二是館藏信息數字化,數字化的館藏檔案信息能直接被計算機識別和處理,建成完備的信息數據庫;其三是構建平滑高效的檔案信息數字化傳輸平臺,實現檔案的統一管理和資源共享。(二)數字化檔案館。在檔案館數字化基礎上,形成以數字化信息為館藏內容,以計算機為管理手段,以網絡傳遞為利用方式的一種新型檔案館,是采用現代高新技術的數字信息資源系統。(三)數字檔案館。通過國家信息基礎工程聯合數字化檔案館,運用網絡互聯技術,將個體數字化檔案館聯合起來,進行擴張、伸展,組成完全意義的數字檔案館,遵循共同協議,實現數字化信息共享,是超大規模的、便于使用的、沒有時空限制的知識信息中心。用戶可以通過網絡計算機終端提出需求,由數字檔案館系統完成查找和調閱檔案信息,完全不受時間和地理條件的限制。如果說運用虛擬技術,建立虛擬檔案館的話,那么,檔案館發展到第三個階段,才真正可以稱得上是虛擬檔案館。
二、檔案館數字化——數字化的起點
檔案館的數字化建設作為傳統檔案館數字之路的起點,如何走好這首要一步,就顯得至關重要。為此我們就著重于這一點來談一下我們的觀點。
計算機技術的普及,為檔案館數字化建設奠定了良好的基礎。檔案館數字化建設包含以下幾個方面:
(一)檔案管理的數字化。檔案管理自動化是對檔案館自身管理行為現代化的確定,而這種現代化是建立在計算機數字化管理基礎上的。這個特征是基礎性的,有普遍意義的,是開展其他數字化工作的前提條件。現在許多文章在探討數字檔案館或虛擬檔案館時,較多是對檔案館美好前景的預測與憧憬,很少涉及傳統檔案館的現代化管理問題,忽視檔案管理具體業務環節的計算機數字化管理問題,如檔案自動編目和自動檢索、檔案自動全文存儲與檢索、檔案業務工作輔助管理、計算機輔助立卷、檔案自動標引、文檔一體化管理、檔案館辦公自動化、檔案庫房保護技術現代化、檔案數據庫設計與建立等。而這些不僅是檔案管理基本的業務環節,也是檔案管理自動化的具體體現,更是檔案管理數字化全面實現的基礎。這些問題不解決,檔案館數字化建設就是“空中樓閣”,無從談起。
20世紀90年代以來,我國各級各類檔案館開始進行檔案管理數字化的實踐與探索,大致可以歸納為三方面的發展方向。1、建立著錄檔案信息檢索系統。著錄檔案信息檢索系統,應該說是計算機技術與檔案工作的最早結合點。由于檔案館的館藏量巨大,檔案的信息資源又是如此豐富多樣,為了方便利用者,提高查詢效率,檔案館利用計算機技術進行檔案目錄或專題文件級目錄著錄,以達到快速檢索的目的,檢索工具的數字化帶來的優勢盡顯無遺。2、“文檔一體化”管理。1992年國家檔案局提出“文檔一體化”管理思路,許多檔案部門紛紛嘗試利用計算機技術實現文件與檔案的一體化管理,從文件形成之時到文件辦結歸檔乃至檔案管理成為一條流水線的操作過程。“文檔一體化”操作管理軟件與傳統手工操作相比,避免應歸檔的文件材料人為遺漏,提高了文件歸檔的完整性和準確性,提高了文件立卷的效率,提高了檔案的質量。但它也只是利用計算機技術來模擬傳統手工操作流程,不是真正意義上的文檔管理數字化。3、檔案館數字化管理系統的建設。我國檔案工作數字化管理起步時間較晚,目前還是以針對上述檔案信息檢索系統和文檔一體化數據庫系統的管理為主,停留在檔案工作數字化管理的初級階段,數字化管理的優勢和潛能并未充分發掘出來。檔案工作數字化管理系統實際上是一個可以涵蓋檔案館行政管理和業務管理、檔案信息開發利用工作等諸方面的大型的系統工程。檔案館數字化管理應該以此為契入點,朝著這個方向積極發展。
(二)館藏信息的數字化。根據《檔案法》的規定,綜合性檔案館作為黨和國家的科學文化事業機構,是永久集中保存檔案的基地,與國家歷史同在。綜合性檔案館通常都有數量龐大的館藏,內容及形式也是豐富多樣的。就傳統的檔案載體而言,其記錄信息都是平面的,文字、圖像、聲音等不同載體的信息難以有機地結合起來。通過運用計算機技術與多媒體技術,所有的館藏信息都能以數字化的形式存儲,做到圖、文、聲并茂,檔案信息的記錄功能與顯示功能得到了極大的強化;而且更有前景的是數字化后的檔案信息能隨心所欲地從一種媒介轉換到另一種媒介,給長期以來沉悶、形式單一的檔案信息貼上吸引人的“標簽”。館藏信息的數字化是檔案館數字化建設的核心,其數字化建設的工程量巨大,各級檔案部門應根據自身特點采取不同的建設模式:1、大型綜合性檔案館,它們的館藏基礎一般都較好,館藏信息的利用也較頻繁,在建設經費充足的情況下,可以采取技術優先的原則,劃出專項經費,成立館藏信息數字化部門,專門負責檔案信息數字化工作。這種模式見效快,但投入高,需要很強的經濟支持和技術支持。2、中小型綜合檔案館,在建設經費不夠充足的情況下,可以采取資源優先的原則,購置少量的設備,對重要的檔案資源先期進行數字化處理,循序漸進逐步擴大數字化規模。這種模式見效慢,投入較少,對技術要求也不高。館藏檔案信息經數字化后轉化為數字信息,以數據庫的形式存在。
目前大部分檔案館館藏檔案載體仍然是以紙質為主,紙質檔案數字化制作方式一般有二種:第一種是通過計算機人工錄入或通過掃描儀掃描由字符識別軟件(OCR)識別,制成文本文件;第二種是將檔案文件的每一頁看成是一張圖片,不管上面具體是什么內容,由掃描儀按頁掃入計算機制成圖形文件。第一種方式占據空間小,是一種真正意義上的全文數字化,但紙質檔案信息的記錄方式是多種多樣的,有的是手寫體、繁體字,有的字跡褪化及非文字形式等,此時采用第一種方式就會暴露出如下致命弱點:用OCR字符識別的準確率低;若采用人工錄入,不但需要大量的錄入人員,而且一時還不能馬上勝任此項工作,差錯率大且核對困難,投入大,收效慢。而第二種方式實現容易,一般檔案工作人員只要稍加培訓,即可操作機器,且工作可以定量化,差錯率相對較低,即便有一些錯掃、漏掃等,也能很快被發現。至于圖形文件占空間大的問題,在計算機技術日新月異的今天,相信適合的軟件很快就會被開發出來,如果能采用先進的高速掃描機,那么對檔案信息數字化無疑是如虎添翼。另外,還因為圖像掃描保持了檔案原件本來面目,可以使利用者在看到文字內容的同時,也能看到紙質檔案的其它一些特征,如原件的紙色、墨跡、印章、圈點、批注等各種原貌,使利用者可以獲得更多的線索,開展一些更深入的研究。
(三)檔案信息傳輸平臺數字化。檔案信息只有在傳遞過程中才能體現出它應有的價值,以往信息存在于一次文獻即檔案原件或經過處理的二次文獻范疇內,人們需要檔案信息,往往需要親臨檔案館,通過閱覽摘錄、靜電復制或拍攝等形式來獲取需要的信息。但檔案信息在完成數字化后以數字形式存在時,數字網絡系統就將成為其主要的傳輸平臺,為檔案信息的快速流動提供可能。數字化了的檔案信息在傳遞過程中可以同時進行多向傳遞,形成傳遞網絡,而且通過因特網可以方便地進行遠程傳遞,不受時間與空間的限制,利用者不必親臨檔案館,就可以在任何時間任何地點通過計算機方便地利用檔案信息。
如果把檔案館數字化建設比作一個人體的話,那么檔案管理數字化和館藏信息數字化的建設就是這個人體的骨架和血肉,數字網絡系統就是它的神經網絡。檔案館信息傳輸平臺應首先構建的是檔案館局域網也可稱為內網,一般的要求是在遵循統一的通信協議前提下,通過網絡連線將各個部門的計算機資源整合在一起。可根據不同的應用設置服務器,部門的個體計算機通過網絡共享網絡信息資源,為檔案館核心數據庫提供檔案信息,也可以得到權限范圍內的檔案信息。其次是構建外網、公眾網等,可使檔案信息通過數字網絡系統進入信息交流的大動脈----互聯網,實現檔案資源的共享。
三、檔案館數字化建設需要注意的幾個方面
(一)建立標準化的規范體系。《中華人民共和國標準化管理條例》指出:“標準化是組織現代化生產的重要手段,是科學管理的重要組成部分,在社會主義建設中推行標準化,是國家的一項重要技術經濟政策。”這充分闡明了標準化的地位和作用。現在各地的檔案館對數字化建設還都處在試驗和探索階段,采用的方式方法也不盡相同,因此在檔案館數字化建設中,標準化的規范體系的確立就顯得尤為重要,它是檔案館數字化建設高質量的堅實基礎。如浙江省檔案局指出數據庫建設要本著保證質量、規范標準的精神,并決定在2002年正式出臺統一的《浙江省綜合檔案館電子目錄數據庫結構與交換格式》相關標準,對全省各級檔案館現有的數據庫與軟件進行修改、規范,提高數據質量,完善軟件功能,特別是數據標準接口功能。在建立標準化的規范體系方面我們應遵循以下原則:
1、以標準化管理為主,制度管理為輔。標準化適合于技術工作領域的規范化管理,可操作性強,而且與管理體制的關系較為超脫,因此在不與法律相沖突的情況下,標準化管理更有利于不同部門之間的協調。制度通常以法規形式出現,特別是約束力強,但管理范圍有限,所以在標準化管理的基礎上,配合制度可以形成檔案館數字化工作所需的嚴密的規范化管理體系。
2、首先考慮采用國際標準,其次才是國家、行業及地方標準。由于檔案信息的范圍和種類處于不斷擴展和變化之中,因此即使在檔案館數字化階段也應優先采用適用范圍盡可能廣泛的標準,盡量做到一次到位。檔案館數字化建設中確定標準的原則是:面向計算機和網絡及信息平臺的處理,直接采用國際和國家標準;面向綜合性信息的處理優先采用國家標準;面向檔案信息的處理以借鑒為主進行補充,由此形成標準化的規范體系。
(二)建設高質量的檔案信息數據庫。早在1992年就有學者指出檔案工作現代化的核心是建設高質量的數據庫,這個認識到今天仍然具有指導意義。現在我們檔案館數字化建設的核心依然是建設檔案信息數據庫,并通過網絡平臺進行信息傳遞和信息交流。
檔案館計算機數據庫類型以檢索性數據庫和文件性數據庫兩種較為常見,檢索性數據庫主要用于揭示館藏內容,介紹開放檔案的范圍、目錄和提供網上檢索途徑;文件性數據庫,主要用于完整地載入檔案文件,使人們可以通過網絡獲得檔案信息。檔案信息數字化后以數據形式集合成數據庫,檔案信息組織形式就發生了本質上的變化,從原先紙張上順序的、線形的方式轉變為計算機的直接的、網狀的方式,索引文件、超文本技術可以使信息按本身的邏輯關系組織成相互聯系的網狀結構,依賴先進的智能化信息管理技術,以人工語言或自然語言進行搜索,為用戶提供方便、高效的服務。一個高質量的數據庫中的數字信息要達到以下質量標準:第一、數據的準確性;第二、數據項目和內容的完整性;第三、數據的規范性;第四、數據的穩定性。
(三)檔案信息安全問題。安全是檔案館數字化建設不可忽視的一個重要方面。檔案館與圖書館最根本的不同在于圖書信息基本上是面對普通公眾,而檔案信息則對安全保密有嚴格的要求,有相當一部分檔案信息是需要控制使用的,所以檔案館數字化建設中必須采取一系列措施保證檔案信息的保密和安全。通常采取的措施可以分為制度管理和技術保證兩類,檔案館在數字化建設中對此應該形成一套管理制度體系,此外還需要有相應的技術措施進行自動控制,才能做到更加嚴密。如中國第二歷史檔案館在進行民國檔案數字化建設的探索時就十分重視數據的安全問題。他們認為在黑客猖獗和網絡安全保護手段不健全的情況下,為了確保檔案信息的保密和安全,可以有計劃、有步驟、分階段地進行數字化民國檔案網絡化服務。他們首先對已有的檔案信息系統進行改進分化,對館內不同用戶根據權限提供全文檔案信息,使館藏信息首先在館內達到資源共享。當館內數據庫接入Internet網時,除盡最大可能保證網絡安全外,將那些有機密性的、不開放的檔案不存放在網絡服務器上。在當前的技術條件下,為了解決檔案信息的安全問題,也可以使用Intranet技術,提供授權的檔案信息服務。
(四)加快相關人才的培養和使用。人才問題是關系到檔案館數字化建設成敗的另一關鍵。檔案館數字化建設的過程是與新知識、新技術的普及密不可分的,所以各類相關人才的引進和培養必須引起高度的重視。檔案館數字化建設過程中必須考慮培養的人員有以下幾類:系統開發與維護、數字化加工與管理、標準化建設、數據庫運行管理等。
目前我國的檔案專業教育,無論是高等教育,還是各種專業知識培訓,都顯得知識陳舊,內容更新慢,缺乏計算機技術與檔案及檔案工作關系的內容,其結果也就使得檔案界嚴重缺乏既具有檔案專業知識又具有計算機等相關知識的復合性人才,阻礙了計算機等現代化技術在檔案事業上的運用。對此,檔案教育界必須引起高度重視,奮起直追,加大培訓力度。
同時檔案館也必須重視對在職人員的培訓工作,重視引進相關的專業人才,以適應檔案館數字化建設的需要。在相關的崗位培訓及人才引進時應該遵守以下原則:1、做到有提前量,使有關人員對新技術新設備提前了解。2、針對不同對象分層次培養,要求知識技能與崗位相適應。3、充分依靠社會支持,引進人才但不浪費人才,做到人員結構合理。
以上是我們對檔案館數字化建設的一些淺見。現在各地檔案部門都很重視這方面的信息,有些單位已將此擺上了議事日程,但相對于圖書館部門,檔案部門的動作已經滯后。中國數字圖書館工程現已進入了實質性操作階段,其在數字圖書館的總體結構、標準規范、技術線路等方面已經積累了相當的經驗。1999年3月成立的“國家圖書館文獻數字化中心”年生產規模已經達到5000萬至6000萬頁全文影像數據,它的網絡可以提供1000G存儲量的網上信息服務。檔案館如果還不重視檔案館的數字化建設,不能在網絡上有效地傳遞檔案信息,就無法融入信息時代的快車道,最終將被信息社會淘汰。因此,為適應社會發展的需要,檔案館數字化建設不僅僅是一項具有前瞻性的舉措,它還具有更深刻的戰略意義。
(張海、倪紅)
一、傳統檔案館的數字之路
2000年12月,國家檔案局、中央檔案館印發的《全國檔案事業發展“十五”計劃》,把“加快檔案信息化建設”、“加快現有檔案的數字化進程”列入其中,同月國家檔案局在中國檔案管理現代化建設研討會上宣布:十五期間,我國將加快數字化檔案館的建設。由此,傳統檔案館數字化建設的問題引起了人們的關注,并且有一些檔案館已經開始對此投資建設。我們認為,傳統檔案館的數字之路并非一蹴而就,而是一個循序漸進的過程,對這個過程的各個環節進行深入的分析研究是十分必要的,只有在有了清楚認識的基礎上,才能規劃和解決好檔案館的數字化之路,為今后的數字化檔案館進而是數字檔案館、虛擬檔案館的建設打好基礎。
傳統檔案館的數字之路由三個相互聯系的階段組成:(一)檔案館數字化。檔案館的數字化包含著以下三層含義,其一是隨著計算機技術的引入,建立檔案館的自動化系統,實現檔案館自動化管理,完成檔案管理的數字化;其二是館藏信息數字化,數字化的館藏檔案信息能直接被計算機識別和處理,建成完備的信息數據庫;其三是構建平滑高效的檔案信息數字化傳輸平臺,實現檔案的統一管理和資源共享。(二)數字化檔案館。在檔案館數字化基礎上,形成以數字化信息為館藏內容,以計算機為管理手段,以網絡傳遞為利用方式的一種新型檔案館,是采用現代高新技術的數字信息資源系統。(三)數字檔案館。通過國家信息基礎工程聯合數字化檔案館,運用網絡互聯技術,將個體數字化檔案館聯合起來,進行擴張、伸展,組成完全意義的數字檔案館,遵循共同協議,實現數字化信息共享,是超大規模的、便于使用的、沒有時空限制的知識信息中心。用戶可以通過網絡計算機終端提出需求,由數字檔案館系統完成查找和調閱檔案信息,完全不受時間和地理條件的限制。如果說運用虛擬技術,建立虛擬檔案館的話,那么,檔案館發展到第三個階段,才真正可以稱得上是虛擬檔案館。
二、檔案館數字化——數字化的起點
檔案館的數字化建設作為傳統檔案館數字之路的起點,如何走好這首要一步,就顯得至關重要。為此我們就著重于這一點來談一下我們的觀點。
計算機技術的普及,為檔案館數字化建設奠定了良好的基礎。檔案館數字化建設包含以下幾個方面:
(一)檔案管理的數字化。檔案管理自動化是對檔案館自身管理行為現代化的確定,而這種現代化是建立在計算機數字化管理基礎上的。這個特征是基礎性的,有普遍意義的,是開展其他數字化工作的前提條件。現在許多文章在探討數字檔案館或虛擬檔案館時,較多是對檔案館美好前景的預測與憧憬,很少涉及傳統檔案館的現代化管理問題,忽視檔案管理具體業務環節的計算機數字化管理問題,如檔案自動編目和自動檢索、檔案自動全文存儲與檢索、檔案業務工作輔助管理、計算機輔助立卷、檔案自動標引、文檔一體化管理、檔案館辦公自動化、檔案庫房保護技術現代化、檔案數據庫設計與建立等。而這些不僅是檔案管理基本的業務環節,也是檔案管理自動化的具體體現,更是檔案管理數字化全面實現的基礎。這些問題不解決,檔案館數字化建設就是“空中樓閣”,無從談起。
20世紀90年代以來,我國各級各類檔案館開始進行檔案管理數字化的實踐與探索,大致可以歸納為三方面的發展方向。1、建立著錄檔案信息檢索系統。著錄檔案信息檢索系統,應該說是計算機技術與檔案工作的最早結合點。由于檔案館的館藏量巨大,檔案的信息資源又是如此豐富多樣,為了方便利用者,提高查詢效率,檔案館利用計算機技術進行檔案目錄或專題文件級目錄著錄,以達到快速檢索的目的,檢索工具的數字化帶來的優勢盡顯無遺。2、“文檔一體化”管理。1992年國家檔案局提出“文檔一體化”管理思路,許多檔案部門紛紛嘗試利用計算機技術實現文件與檔案的一體化管理,從文件形成之時到文件辦結歸檔乃至檔案管理成為一條流水線的操作過程。“文檔一體化”操作管理軟件與傳統手工操作相比,避免應歸檔的文件材料人為遺漏,提高了文件歸檔的完整性和準確性,提高了文件立卷的效率,提高了檔案的質量。但它也只是利用計算機技術來模擬傳統手工操作流程,不是真正意義上的文檔管理數字化。3、檔案館數字化管理系統的建設。我國檔案工作數字化管理起步時間較晚,目前還是以針對上述檔案信息檢索系統和文檔一體化數據庫系統的管理為主,停留在檔案工作數字化管理的初級階段,數字化管理的優勢和潛能并未充分發掘出來。檔案工作數字化管理系統實際上是一個可以涵蓋檔案館行政管理和業務管理、檔案信息開發利用工作等諸方面的大型的系統工程。檔案館數字化管理應該以此為契入點,朝著這個方向積極發展。
(二)館藏信息的數字化。根據《檔案法》的規定,綜合性檔案館作為黨和國家的科學文化事業機構,是永久集中保存檔案的基地,與國家歷史同在。綜合性檔案館通常都有數量龐大的館藏,內容及形式也是豐富多樣的。就傳統的檔案載體而言,其記錄信息都是平面的,文字、圖像、聲音等不同載體的信息難以有機地結合起來。通過運用計算機技術與多媒體技術,所有的館藏信息都能以數字化的形式存儲,做到圖、文、聲并茂,檔案信息的記錄功能與顯示功能得到了極大的強化;而且更有前景的是數字化后的檔案信息能隨心所欲地從一種媒介轉換到另一種媒介,給長期以來沉悶、形式單一的檔案信息貼上吸引人的“標簽”。館藏信息的數字化是檔案館數字化建設的核心,其數字化建設的工程量巨大,各級檔案部門應根據自身特點采取不同的建設模式:1、大型綜合性檔案館,它們的館藏基礎一般都較好,館藏信息的利用也較頻繁,在建設經費充足的情況下,可以采取技術優先的原則,劃出專項經費,成立館藏信息數字化部門,專門負責檔案信息數字化工作。這種模式見效快,但投入高,需要很強的經濟支持和技術支持。2、中小型綜合檔案館,在建設經費不夠充足的情況下,可以采取資源優先的原則,購置少量的設備,對重要的檔案資源先期進行數字化處理,循序漸進逐步擴大數字化規模。這種模式見效慢,投入較少,對技術要求也不高。館藏檔案信息經數字化后轉化為數字信息,以數據庫的形式存在。
目前大部分檔案館館藏檔案載體仍然是以紙質為主,紙質檔案數字化制作方式一般有二種:第一種是通過計算機人工錄入或通過掃描儀掃描由字符識別軟件(OCR)識別,制成文本文件;第二種是將檔案文件的每一頁看成是一張圖片,不管上面具體是什么內容,由掃描儀按頁掃入計算機制成圖形文件。第一種方式占據空間小,是一種真正意義上的全文數字化,但紙質檔案信息的記錄方式是多種多樣的,有的是手寫體、繁體字,有的字跡褪化及非文字形式等,此時采用第一種方式就會暴露出如下致命弱點:用OCR字符識別的準確率低;若采用人工錄入,不但需要大量的錄入人員,而且一時還不能馬上勝任此項工作,差錯率大且核對困難,投入大,收效慢。而第二種方式實現容易,一般檔案工作人員只要稍加培訓,即可操作機器,且工作可以定量化,差錯率相對較低,即便有一些錯掃、漏掃等,也能很快被發現。至于圖形文件占空間大的問題,在計算機技術日新月異的今天,相信適合的軟件很快就會被開發出來,如果能采用先進的高速掃描機,那么對檔案信息數字化無疑是如虎添翼。另外,還因為圖像掃描保持了檔案原件本來面目,可以使利用者在看到文字內容的同時,也能看到紙質檔案的其它一些特征,如原件的紙色、墨跡、印章、圈點、批注等各種原貌,使利用者可以獲得更多的線索,開展一些更深入的研究。
(三)檔案信息傳輸平臺數字化。檔案信息只有在傳遞過程中才能體現出它應有的價值,以往信息存在于一次文獻即檔案原件或經過處理的二次文獻范疇內,人們需要檔案信息,往往需要親臨檔案館,通過閱覽摘錄、靜電復制或拍攝等形式來獲取需要的信息。但檔案信息在完成數字化后以數字形式存在時,數字網絡系統就將成為其主要的傳輸平臺,為檔案信息的快速流動提供可能。數字化了的檔案信息在傳遞過程中可以同時進行多向傳遞,形成傳遞網絡,而且通過因特網可以方便地進行遠程傳遞,不受時間與空間的限制,利用者不必親臨檔案館,就可以在任何時間任何地點通過計算機方便地利用檔案信息。
如果把檔案館數字化建設比作一個人體的話,那么檔案管理數字化和館藏信息數字化的建設就是這個人體的骨架和血肉,數字網絡系統就是它的神經網絡。檔案館信息傳輸平臺應首先構建的是檔案館局域網也可稱為內網,一般的要求是在遵循統一的通信協議前提下,通過網絡連線將各個部門的計算機資源整合在一起。可根據不同的應用設置服務器,部門的個體計算機通過網絡共享網絡信息資源,為檔案館核心數據庫提供檔案信息,也可以得到權限范圍內的檔案信息。其次是構建外網、公眾網等,可使檔案信息通過數字網絡系統進入信息交流的大動脈----互聯網,實現檔案資源的共享。
三、檔案館數字化建設需要注意的幾個方面
(一)建立標準化的規范體系。《中華人民共和國標準化管理條例》指出:“標準化是組織現代化生產的重要手段,是科學管理的重要組成部分,在社會主義建設中推行標準化,是國家的一項重要技術經濟政策。”這充分闡明了標準化的地位和作用。現在各地的檔案館對數字化建設還都處在試驗和探索階段,采用的方式方法也不盡相同,因此在檔案館數字化建設中,標準化的規范體系的確立就顯得尤為重要,它是檔案館數字化建設高質量的堅實基礎。如浙江省檔案局指出數據庫建設要本著保證質量、規范標準的精神,并決定在2002年正式出臺統一的《浙江省綜合檔案館電子目錄數據庫結構與交換格式》相關標準,對全省各級檔案館現有的數據庫與軟件進行修改、規范,提高數據質量,完善軟件功能,特別是數據標準接口功能。在建立標準化的規范體系方面我們應遵循以下原則:
1、以標準化管理為主,制度管理為輔。標準化適合于技術工作領域的規范化管理,可操作性強,而且與管理體制的關系較為超脫,因此在不與法律相沖突的情況下,標準化管理更有利于不同部門之間的協調。制度通常以法規形式出現,特別是約束力強,但管理范圍有限,所以在標準化管理的基礎上,配合制度可以形成檔案館數字化工作所需的嚴密的規范化管理體系。
2、首先考慮采用國際標準,其次才是國家、行業及地方標準。由于檔案信息的范圍和種類處于不斷擴展和變化之中,因此即使在檔案館數字化階段也應優先采用適用范圍盡可能廣泛的標準,盡量做到一次到位。檔案館數字化建設中確定標準的原則是:面向計算機和網絡及信息平臺的處理,直接采用國際和國家標準;面向綜合性信息的處理優先采用國家標準;面向檔案信息的處理以借鑒為主進行補充,由此形成標準化的規范體系。
(二)建設高質量的檔案信息數據庫。早在1992年就有學者指出檔案工作現代化的核心是建設高質量的數據庫,這個認識到今天仍然具有指導意義。現在我們檔案館數字化建設的核心依然是建設檔案信息數據庫,并通過網絡平臺進行信息傳遞和信息交流。
檔案館計算機數據庫類型以檢索性數據庫和文件性數據庫兩種較為常見,檢索性數據庫主要用于揭示館藏內容,介紹開放檔案的范圍、目錄和提供網上檢索途徑;文件性數據庫,主要用于完整地載入檔案文件,使人們可以通過網絡獲得檔案信息。檔案信息數字化后以數據形式集合成數據庫,檔案信息組織形式就發生了本質上的變化,從原先紙張上順序的、線形的方式轉變為計算機的直接的、網狀的方式,索引文件、超文本技術可以使信息按本身的邏輯關系組織成相互聯系的網狀結構,依賴先進的智能化信息管理技術,以人工語言或自然語言進行搜索,為用戶提供方便、高效的服務。一個高質量的數據庫中的數字信息要達到以下質量標準:第一、數據的準確性;第二、數據項目和內容的完整性;第三、數據的規范性;第四、數據的穩定性。
(三)檔案信息安全問題。安全是檔案館數字化建設不可忽視的一個重要方面。檔案館與圖書館最根本的不同在于圖書信息基本上是面對普通公眾,而檔案信息則對安全保密有嚴格的要求,有相當一部分檔案信息是需要控制使用的,所以檔案館數字化建設中必須采取一系列措施保證檔案信息的保密和安全。通常采取的措施可以分為制度管理和技術保證兩類,檔案館在數字化建設中對此應該形成一套管理制度體系,此外還需要有相應的技術措施進行自動控制,才能做到更加嚴密。如中國第二歷史檔案館在進行民國檔案數字化建設的探索時就十分重視數據的安全問題。他們認為在黑客猖獗和網絡安全保護手段不健全的情況下,為了確保檔案信息的保密和安全,可以有計劃、有步驟、分階段地進行數字化民國檔案網絡化服務。他們首先對已有的檔案信息系統進行改進分化,對館內不同用戶根據權限提供全文檔案信息,使館藏信息首先在館內達到資源共享。當館內數據庫接入Internet網時,除盡最大可能保證網絡安全外,將那些有機密性的、不開放的檔案不存放在網絡服務器上。在當前的技術條件下,為了解決檔案信息的安全問題,也可以使用Intranet技術,提供授權的檔案信息服務。
(四)加快相關人才的培養和使用。人才問題是關系到檔案館數字化建設成敗的另一關鍵。檔案館數字化建設的過程是與新知識、新技術的普及密不可分的,所以各類相關人才的引進和培養必須引起高度的重視。檔案館數字化建設過程中必須考慮培養的人員有以下幾類:系統開發與維護、數字化加工與管理、標準化建設、數據庫運行管理等。
目前我國的檔案專業教育,無論是高等教育,還是各種專業知識培訓,都顯得知識陳舊,內容更新慢,缺乏計算機技術與檔案及檔案工作關系的內容,其結果也就使得檔案界嚴重缺乏既具有檔案專業知識又具有計算機等相關知識的復合性人才,阻礙了計算機等現代化技術在檔案事業上的運用。對此,檔案教育界必須引起高度重視,奮起直追,加大培訓力度。
同時檔案館也必須重視對在職人員的培訓工作,重視引進相關的專業人才,以適應檔案館數字化建設的需要。在相關的崗位培訓及人才引進時應該遵守以下原則:1、做到有提前量,使有關人員對新技術新設備提前了解。2、針對不同對象分層次培養,要求知識技能與崗位相適應。3、充分依靠社會支持,引進人才但不浪費人才,做到人員結構合理。
以上是我們對檔案館數字化建設的一些淺見。現在各地檔案部門都很重視這方面的信息,有些單位已將此擺上了議事日程,但相對于圖書館部門,檔案部門的動作已經滯后。中國數字圖書館工程現已進入了實質性操作階段,其在數字圖書館的總體結構、標準規范、技術線路等方面已經積累了相當的經驗。1999年3月成立的“國家圖書館文獻數字化中心”年生產規模已經達到5000萬至6000萬頁全文影像數據,它的網絡可以提供1000G存儲量的網上信息服務。檔案館如果還不重視檔案館的數字化建設,不能在網絡上有效地傳遞檔案信息,就無法融入信息時代的快車道,最終將被信息社會淘汰。因此,為適應社會發展的需要,檔案館數字化建設不僅僅是一項具有前瞻性的舉措,它還具有更深刻的戰略意義。
(張海、倪紅)