電子文件、電子檔案知識講座(五)
十二 檔案館管理電子檔案的設備配置管理電子檔案不同于管理紙質檔案,管理電子檔案要依賴電子計算機的軟硬件環境。電子計算機的軟硬件產品明目繁多,我們不可能以羅列產品的方式討論管理電子檔案所需要購置的軟硬件設備。我們可以通過討論電子信息處理技術對電子計算機的軟硬件依賴情況,使使檔案館得到啟發。
1、數據庫管理系統。
數據庫是在電子計算機的外存儲器上,按一定組織方式存儲在一起的,相互有關且具有最小冗余度和可共享的、具有較高獨立性的、能確保安全和完整的數據集合。數據庫系統是用于組織和存取大宗數據的管理系統,它是有關電子計算機系統(硬件與基本軟件)、數據庫及其描述機構、數據庫管理、用戶及其應用程序、數據庫管理員等幾方面組成的總體。數據庫管理系統是一組軟件,它具有數據庫定義功能、數據庫管理功能、通信功能,通常由數據描述語言及其編譯程序、數據操縱語言及其編譯程序、數據庫管理例行程序等三部分組成。關系性數據庫管理系統是當前普遍采用的性能較好的數據庫,如SYS-TEMR、dbase、ORACLE SQL/DS和DB2等。分布式數據庫管理系統是當今信息處理領域中愈益被人們重視的一個分支,它是一組結構化的數據的集合,在邏輯上屬于同一系統,而物理上分布在電子計算機網絡的不同結點上。80年代后期,人們力圖把關系數據庫系統和面向對象的方法結合起來,探討新一代的數據庫,以適用新的應用領域的要求,這種新一代的數據庫系統稱為面向對象式數據庫管理系統。多媒體數據庫管理系統,是指對以數據庫方式在電子計算機存儲設備上合理存放的相互關聯的多媒體信息的管理,這些數據集合及管理的特點是語義豐富、信息量特別大、管理過程特別復雜,更需要有技術環境支持。一般的數據庫管理系統不適合工程數據的管理,如復雜實體的處理、動態模式的修改與擴展等,人們又開發了工程數據庫管理系統。數據庫的種類今后還會不斷地擴大和完善。
2、存儲及輸出設備。
信息數據的存儲需要相應的電子計算機外部設備和存儲介質。主要有:磁盤存儲器、磁盤、磁帶和磁帶機,光盤和光盤驅動器等。信息擻據的利用需要相應的輸出設備。主要有:終端(通常有一個鍵盤和一個顯示裝置的組成),打印機等。
3、軟件和程序。
軟件,即電子計算機系統中使用的各種程序和文檔。軟件中最重要的是操作系統,它是對電子計算機軟硬件資源進行管理和控制的程序,也是用戶和電子計算機系統的接口。各種系統程序和應用程序都是在操作系統控制下運行。根據操作系統所管的資源不同以及提供服務方式的差別,操作系統大致可分為多道批處理、分時、實時、網絡和分布式等五種類型。程序是為解決某一問題而設計的一系列指令。根據被解決問題的目的不同而又可分為系統程序和應用程序。
4、數據結構和數據。
為保存電子文件的可存取性、可理解性、可利用性,必須對電子文件數據結構及類型進行了解。數據結構,即數據的組織形式,它既描述數據對象,又描述這個集合中數據元之間的相互關系。數據又有格式數據、正文數據、時態數據、圖形數據、圖像數據、聲音數據等之分。
各檔案館可根據自己現在保存和處理的或將要保存和處理的電子檔案,參考上述四個方面的介紹,來決定自己選擇的數據庫管理系統,電子計算機軟硬件平臺、存儲及輸出設備、數據結構與數據以及元數據、背景信息等,購置所必須的電子計算機軟硬件及外部設備,確保電子檔案的管理和開發利用。
十三 電子檔案相應設備過時的對策
電子檔案管理,必將遇到記錄載體不耐久,讀寫檔案信息的軟硬件技術過時等大問題。現代信息載體的壽命相對于技術過時而言,顯得并不十分重要。世界上幾乎沒有一個廠家可以保證,他生產的硬件和軟件不會過時。技術過時使得各種信息的壽命受到威脅,幾乎都不安全。數字信息技術是載體、記錄格式、軟件、硬件等有機的集合,即使記錄載體完好,如果檢索、輸出或編輯它的軟件中任何一項技術過時,都將影響電子檔案信息的讀出。而對技術過時問題,一定要采取相應對策,以免電子檔案信息受損。到目前為止,這些具體對策還正在研究探索階段,下面列出幾種方法供有關人員參考。
1、再生性技術保護。是指將技術過時的載體上的信息適時地轉移到紙或縮微膠片上,不再使用電子計算機軟硬件讀出。這種方法為長期保存信息提供方便并避免技術過時帶來的任何麻煩。同時也存在一定的問題:一是有些信息無法轉移到硬拷貝上,如聲音信息、超文本信息、多媒體信息等;二是失去了電子檔案的原有的面貌,也失去了電子格式的傳遞和使用的靈活性。
2、建立電子計算機技術檔案館。建立電子計算機技術檔案館,收集過時的電子計算機軟硬件,提供利用,讀取那些過時技術記錄在載體上的信息內容。例如,收集過時的磁帶驅動器和過時的操作系統等。這種方法要廣泛收集、保管過時技術的全套軟硬件,還必須保管操作這些過時技術的某些技能,還有老化和維護問題,代價十分昂貴。
3、仿真。這是制造一種運行過時硬件及其軟件的軟件。在這個軟件中對某一硬件與軟件的模仿,使得認為原來的軟硬件在形式上仍然可用。利用這種方法來挽救過時技術的當時記錄,從技術上看雖然是可能的,但實際工作中還有很多問題,如兼容性不可靠,仿真器的耐用性維護等。
4、拷貝和遷移。拷貝是在原來的技術環境下定時重寫信息數據,防止由于記錄載體理化性能變化而引起的信息丟失。這應該成為檔案館管理電子檔案的一項基本方法。這種方法不能解決由于技術過時而引起的電子檔案長期保存問題,但可用轉換的方法。將數字信息從一種技術環境轉換到另一種技術環境(包括硬件和軟件)上的復制稱為遷移。遷移是隨技術變化適時改變數字信息格式的一種處理過程,這個過程使得信息在將來也可以被存取。遷移意味著基于字符的數據,可以從一個存取載體轉移到另一個存取載體上,以進行電子信息的保護。遷移要求電子計算機既可讀出舊格式,也可將它寫在新格式上。遷移到不同操作系統時,可應注意優先維護信息內容與使用功能。
上述四種方法,我們認為,再生性技術保護,雖然有些缺點,但它的優點也很突出,對于一些利用率較低的電子檔案,也不失為一種好方法。建立電子計算機檔案館,不是我們檔案部門力所能及的可采用的方法。仿真,在新型軟硬件大量涌現的今天,制造一個執行過時硬件和其軟件的軟件,不太可能是永遠有效的方法,軟件制造商最終必然要放棄某些軟件的向下兼容性。拷貝和遷移,是電子檔案長期保存的一種可行的方法。
十四 電子檔案的傳輸
電子文件的傳輸與紙質文件有所不同,由電子文件歸檔而形成的電子檔案在傳輸方面也就具有了新的形式。就目前的電子計算機技術來說,電子檔案傳輸主要有兩種形式:
一種是利用存儲介質傳輸。這里所說的存儲介質包括磁盤、光盤、磁帶等。傳輸前先把電子檔案復制到存儲介質上,利用人力送到目的地。這種方式只是利用了電子計算機的存儲和讀取技術,傳送方式跟紙質檔案并沒有本質的區別。
另一種方式是利用計算機網絡技術進行傳輸。網絡技術使得電子計算機應用的領域和作用都有了質的飛躍,電子檔案的傳輸更具有紙質檔案不可比擬的優點,使得檔案傳輸不再受地理和人力的限制,傳輸速度也是紙質檔案不可想象的。在網絡傳輸方式中,根據傳輸區域的大小,又可以分為局域傳輸和遠程傳輸。局域傳輸主要應用于單位內部,利用局域網技術,特點是傳輸速度快,對于一些有實時要求的用戶來說非常適合。國內有很多單位目前已經實現了網上辦公,各種文件的下發和簽閱,工作的安排等都在網絡上進行,所形成的電子檔案也就可在網上傳輸。目前有很多單位都開始將紙質檔案電子化,各種設計圖紙、文書檔案等都通過掃描儀進入電子計算機,存在檔案館室的服務器上,其它人員需要某份檔案時,就不用再到檔案館室翻閱,直接在自己的電子計算機上進行查閱就行了。另外一種是遠程傳輸,它是利用遠程網絡技術,現在也得到越來越廣泛的應用。特別是近兩年互聯網技術的發展使得檔案的異地傳輸變得簡單易行。通過電子郵件的方式,即使是遠在異國他鄉,傳輸一份電子檔案也可能只需幾秒到幾分鐘的時間,并且可以在自己的辦公桌上進行操作,大家不再共用一臺傳真機。
利用網絡進行電子檔案的傳輸得到了越來越廣泛的應用,也給人們的日常工作帶來了越來越大的好處。但隨著應用范圍的推廣,也暴露出一些技術上的問題:一是檔案傳輸中的安全問題。
檔案在傳輸過程中,數據很容易被他人竊取。對于一些高度機密的檔案,這無疑是一個值得認真對待的問題。目前比較可行的方法是在檔案傳輸前把數據加密,檔案達到目的地后再進行解密,這樣即使傳輸中的數據被竊取,也是一堆雜亂無章的數字碼,很難直接應用。二是電子檔案傳輸所使用設備可能會攜帶病毒,對接受單位的電子計算機造成有意或無意的破壞。這個問題一直受到人們密切關注,目前已有一些方法可以部分解決這一問題,主要是在電子計算機上安裝防病毒軟件,自動對來自網絡上的文件進行病毒檢測。三是電子檔案的合法性問題。紙質檔案上的單位蓋章和領導簽字,是有法律效力的,而在電子檔案的簽字(即所謂“電子簽字”)目前并不受檔案部門和其它法律部門的認可。現在有些單位全部使用電子計算機辦公,生成的電子文件有沒有法律效力,在法律上也還沒得到解決。
對于檔案部門來說,電子檔案的傳輸主要體現在電子文件的收集整理和電子檔案的利用上。一方面把辦公部門產生的各種電子文件和生產及設計部門產生的電子圖紙通過網絡收集到檔案管理部門來,在電子計算機上進行分類、組卷、歸檔;另一方面當其它人員需要某份電子檔案時要準確及時地提供給用戶。當然,跟紙質檔案不同的是,電子檔案在網上被查閱后不需要歸還,因為原來的的電子數據并沒有被“拿走”,而只是“復制”了一份而已。
總之,隨著電子窘境和網絡時代的的到來,檔案生成的電子化,檔案傳輸的網絡化正逐步走入人們的日常工作中,利用新的技術來提高檔案管理的效率也是檔案工作面臨的一個新的機遇和挑戰。