一、 紙質檔案數字化相關參數定義:
l 黑白二值圖像:只有黑白兩級灰度的數字圖像。它對應于黑和白兩種狀態的文字稿、線條圖等。
l 連續色調靜態圖像:以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態數字圖像。在紙質檔案數字化過程中,通常表現為灰度掃描和彩色掃描兩種模式。
l 圖像壓縮:清除圖像冗余或對圖像近似的任一種過程,其目的是對圖象以更緊湊的形式表示。紙質檔案數字化過程中,較常見的有TIFF(G4)、JPEG等壓縮格式。
l 分辨率:單位長度內圖像包含的點數或像素數,一般用每英寸點數(dpi)表示
二、 根據對象不同情況如何選擇掃描參數
l 頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案.可采用黑白二值模式進行掃描。
l 頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可以采用灰度模式掃描。
l 頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。(建議)
l 掃描分辨率參數大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
l 采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇大于或等于200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。
三、 掃描圖像的處理
l 圖像命名:以檔案實體中的檔號命名 ,如全宗號-目錄號-案卷號-文件順序號-頁號,位數符合機讀目錄實際位數。
l 糾偏:對出現偏斜的圖像進行糾偏處理,保證數字圖像的偏斜角度小于1度(圖像偏斜不超過頁面內三分之一個文字)
l 去污:檔案數字化圖像的去污遵循不影響可讀度的前提下展現原貌的原則,去除數字圖像中影響可讀度的雜質,包括局部去污,如去除黑點、黑線、黑框;整體去污,去除頁面上的污漬
l 拼接:為保證檔案數字化圖像的整體性,對幅面分離的數字圖像進行拼接
l 裁邊處理:采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。
l 合并:使用工具把掃描的多個單頁圖像文件合并成一個多頁圖像文件
四、 存儲格式
l 采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲。采用灰度模式和彩色模式掃描的文件,一般采用JPEG格式存儲。存儲時的壓縮率的選擇,應以保證掃描的圖像清晰可讀的前提下,盡量減小存儲容量為準則。
l 提供網絡查詢的掃描圖像,存儲為多頁PDF,或多頁TIFF(G4)格式,如果一份紙制文件數字化后分別存在TIFF格式和JPEG格式的圖像文件,用PDF格式進行合并,并保持其中的圖像頁原有壓縮算法不變。