電子文件的特性(下)
電子文件管理研究課題組
3、電子文件載體的非直讀性。
電子文件的非直讀性體現在很多方面。一是數字編碼記錄于載體上肉眼無法分辨,何況磁載體上的“磁疇”極性是物質內部的物理性質,根本不可能看到。此外載體上的信息記錄密度極大,例如一張容量可達600MB一4000MB的光盤,刻寫激光斑點的直徑小于百萬分之一毫米,可存35萬張打印紙上的文字信息,或10萬頁圖形信息。即使在高倍顯微鏡下可以看見光盤上的記錄痕跡,也不可能讀懂那些小點表示什么。另外,載體上的數字信息往往進行了壓縮編碼、加密等處理,即使有設備,如果不解壓解密也不能讀取其內容。以上種種因素均決定了電子文件載體的非直讀性。
4、電子文件物理結構與邏輯結構的復雜性及對元數據和背景信息的依賴性。
文件的物理結構是指其信息存諸于載體上的位置及分布情況,例如文件的正文、圖形、批示、附件等部分各自在載體上的存諸位置。文件的邏輯結構是指信息自身的結構,例如文件中的文字排列、章節構成、各頁的先后順序、插圖、標號等。
紙質文件的信息物理結構與邏輯結構是一致的,而且是直觀的。例如,排錯了文件頁碼,就不僅破壞文件信息物理結構也同時破壞其邏輯結構。電子文件的信息物理結構和邏輯結構往往是不一致的。同一份電子文件中的正文、圖形、批示、附件等可以不在載體上連續存放,甚至可以存放在不同的載體上,而不影響其正常地顯示輸出。在電子文件信息的處理過程中,其物理結構經常發生變化,而其邏輯結構卻可以保持不變。電子文件的邏輯結構通常也需要專門的信息予以描述,當然這些信息可能是隱含的,無特殊需要而不顯示出來。正是由于這種原因,電子文件的物理結構和邏輯結構之間關系是很復雜的。在電子文件歸檔時,如何保持其物理結構和邏輯結構的復雜關系,是保證電子文件不被破壞而必須注意的關鍵問題之一。
元數據是關于數據的數據。例如文件上、下文的關系和結構就是元數據。對于紙質文件來說,元數據往往直接體現在其形態上,如一份印好的文件,紙上的文字、圖形排列及格式等。電子文件的這種元數據必須特意附在文件信息中,否則將無法恢復電子文件的原貌。此外,紙質文陣由于在傳遞和處理過程中離不開行政部門的實際往來和人工辦理各種手續,則其生成和運作的背景信息也就自然地記錄在文件上了。電子文件的運作往往是在網絡上進于的,操作者互不見面,體現行政背景關系的信息可能存放在其他地方。如不特意提供或補充這些元數據或背景信息,就可能給電子文件的運作和歸檔帶來問題。
5、電子文件信息與載體的相分離性。
電子文件的存放位置不是固定的,而是可以變化的,甚至可以從一個載體轉換到另一個載體,其內容信息卻不發生任何變化。同樣,還可以通過網絡傳給遠方的一個或多個接收者。在一些對保密有特殊要求的網絡中,還采取把電子文件分解后分別通過不同的途徑傳遞,存放在不同地點的不同設備上,只是在需要時才臨時把文件裝配起來。這些情況,不僅造成電子文件與載體的分離性,也使長期處于共享計算機網絡資源環境的使用者淡漠了對電子文件存儲于哪臺計算機、哪個載體以及什么位置的關心。這個特征給電子文沖的保管帶來許多新的問題,處理不好,會直接影響其真實性、完整性和可靠性。
文字、圖形、聲音、影像等多媒體信息均可以單獨或相互搭配構成電子文件的內容,這就造成了電子文件的多媒體集成性,使得電子文件的信息形態及其組成要比紙質文件等復雜得多。例如不同的載體往往適合存儲不同種類媒體的信息,就會造成同一份電子文件中的文、圖、聲、像在存儲時的載體分離現象。如果脫機保管,就可能造成混亂,甚至破壞電子文件的完整性。
——1999年4月22日《中國檔案報》