紙質(zhì)檔案數(shù)字化規(guī)程
一、 了解的內(nèi)容
l 紙質(zhì)檔案數(shù)字化相關(guān)參數(shù)定義
l 掃描儀的基本調(diào)整
l 根據(jù)對(duì)象不同情況如何選擇掃描參數(shù)
l 掃描圖像的處理
l 掃描圖像的合并及存儲(chǔ)
l 最終文件的上傳掛接
二、 紙質(zhì)檔案數(shù)字化相關(guān)參數(shù)定義
黑白二值圖像:只有黑白兩級(jí)灰度的數(shù)字圖像。它對(duì)應(yīng)于黑和白兩種狀態(tài)的文字稿、線條圖等。
連續(xù)色調(diào)靜態(tài)圖像:以多于兩級(jí)灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖像。在紙質(zhì)檔案數(shù)字化過(guò)程中,通常表現(xiàn)為灰度掃描和彩色掃描兩種模式。
圖像壓縮:清除圖像冗余或?qū)D像近似的任一種過(guò)程,其目的是對(duì)圖象以更緊湊的形式表示。紙質(zhì)檔案數(shù)字化過(guò)程中,較常見(jiàn)的有CCITT(G4)、JPEG等壓縮格式。
分辨率:?jiǎn)挝婚L(zhǎng)度內(nèi)圖像包含的點(diǎn)數(shù)或像素?cái)?shù),一般用每英寸點(diǎn)數(shù)(dpi)表示
三、 紙質(zhì)檔案數(shù)字化的流程
主要包括檔案整理、檔案掃描、圖像處理、圖像存儲(chǔ)、目錄建庫(kù)、數(shù)據(jù)掛接、數(shù)據(jù)驗(yàn)收、數(shù)據(jù)備份、成果驗(yàn)收等。
1. 數(shù)字化流程圖
2. 檔案掃描方式
根據(jù)檔案幅面的大小(A4、A3、A0等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號(hào)圖紙掃描儀)進(jìn)行掃描,也可采用小幅面掃描后進(jìn)行圖像拼接。
3. 掃描儀的基本調(diào)整
l 掃描儀的安裝
l 利用高級(jí)模式實(shí)現(xiàn)更多的功能
l 掃描過(guò)程中對(duì)對(duì)比度等參數(shù)的調(diào)整
4. 根據(jù)對(duì)象不同情況如何選擇掃描參數(shù)
l 頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案.可采用黑白二值模式進(jìn)行掃描。
l 頁(yè)面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可以采用灰度模式掃描。
l 頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進(jìn)行掃描。(建議)
l 掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準(zhǔn)。
l 采用黑白二值、灰度、彩色幾種模式對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般均建議選擇大于或等于200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng)提高分辨率。
5. 掃描圖像的處理
圖像命名:以檔案實(shí)體中的檔號(hào)命名 ,如全宗號(hào)-目錄號(hào)-案卷號(hào)-文件順序號(hào)-頁(yè)號(hào)(立卷方式)全宗號(hào)-歸檔年度-機(jī)構(gòu)(問(wèn)題)-保管期限-件號(hào)-頁(yè)號(hào)(件盒),位數(shù)符合機(jī)讀目錄實(shí)際位數(shù)。
糾偏:對(duì)出現(xiàn)偏斜的圖像進(jìn)行糾偏處理,保證數(shù)字圖像的偏斜角度小于1度(圖像偏斜不超過(guò)頁(yè)面內(nèi)三分之一個(gè)文字)
去污:檔案數(shù)字化圖像的去污遵循不影響可讀度的前提下展現(xiàn)原貌的原則,去除數(shù)
字圖像中影響可讀度的雜質(zhì),包括局部去污,如去除黑點(diǎn)、黑線、黑框;整體去污,去除頁(yè)面上的污漬