電子文件的特性(上)
電子文件管理研究課題組
電子文件某些特性與紙質文件有很大區別。要管理好電子文件,就必須了解其特性。綜合國內外對此問題的研究,電子文件的主要特性可概括為:
1、電子文件是數字化信息技術的產物。電子文件是在計算機中產生和處理,其信息形態是數字化的。人們在計算機屏幕上看到由文字、圖形等構成的電子文件形態只不過是電子文件的某種輸出形式而已。而在計算機內部,無論是傳輸還是存儲等處理,電子文件均是以數字編碼的形式存在。
計算機錄入漢字的方法有多種,如鍵盤錄入法、掃描錄入法、語音錄入法、手寫錄入法等。用鍵盤錄入漢字、首先是在輸入時對漢字進行計算機的外碼轉換??梢杂脻h語拼音、五筆字型等外碼錄入漢字。計算機接收了其個漢字外碼之后,接著就把外碼代表的漢字用計算機內碼記錄下來。計算機內碼是以16位二進制的數字表示的,也就是兩個字節長。計算機內進行文件信息的存儲、傳輸等處理就是對這些內碼的處理。只有當需要將文件輸出時,才將其漢字內碼所對應的字形點陣。也就是字模,以及眾多字模按格式組成文章在屏幕或打印機上輸出。
在計算機多媒體技術的支持下,電子文件還可以包括聲音、影像等多種形式。不過這些信息形態就計算機內部處理來說,也都是二進制的數字編碼而已,只是在輸入和輸出時,才有其各自的特殊形式。
電子文件從一個載體復制到另一個載體,或者從一臺計算機傳遞到另一臺計算機,實質上是在計算機內進行數字信號的傳輸處理。只要技術方法得當,就可以完全恢復到與原信號一樣。例如,在光盤被復制時,如采取較完善的技術措施,所出現的誤碼率能夠做到不超過10的負14次方,也就是說相當于傳遞200000份《人民日報》的文字信息量,才可能有一個漢字出錯。所以可以做到復制后得到的電子文件與原來的電子文件無任何區別。
2、電子文件對設備的依賴性。電子文件的形成和各種處理均是在計算機等設備的支持下完成的,離開計算機等設備,電子文件既看不見也摸不著。其對設備依賴性主要體現在:一是數字編碼,二是硬件,三是軟件,四是技術設備更新,五是加密。例如電子文件對其他設備環境的不兼容性,使其只能在某種設備上處理。不同軟、硬件環境形成的電子文件載體,有時難以互換。
電子文件的運作、管理是建立在一套標準化體系之上的。其嚴格程度和對系統性的要求,均遠遠超過紙質文件的標準化體系。例如,其制作生成要有代碼標準,其存儲要有機讀載體的格式標準、信息壓縮存儲的算法標準,其傳輸要有網絡通訊協議標準,其查找要有檢索語言標準等。標準化是極為重要的基礎工作,建立和熟悉電子文件的標準化體系,是保證電子文件妥善歸檔的重要前提。
在網絡環境下,人們對信息的處理標準化問題解決得好一些,但對記錄載體的交換問題仍然很多。尤其是在格式、字符集、壓縮方式等方面產生不兼容的問題。出于安全保密上的考慮還常常通過特殊的軟、硬件設備人為地進行復雜而獨特的編碼加密或信息拆分處理,使需要保密的電子文件只能在特定的環境下被讀取。計算機更新換代很快,常常只能隔代兼容,對于需要長期歸檔保存的電子文件來說,設備依賴性造成的問題會更加嚴重。一般的計算機設備8年左右就會被更新,而耐久性光盤載體可以保存更長時間。若干年之后,很可能出現保管完好的電子文件載體找不到讀取設備的問題。設備老化和頻繁更新,給電子文件長久保存帶來的問題,遠比文件載體本身的壽命長短更為嚴重。
——1999年4月22日《中國檔案報》