關于印發《陜西省紙質文書檔案數字化操作規范(試行)》的通知
        各設區市(楊凌示范區)檔案局、省直各部門:
               為進一步加強檔案信息化工作,加快全省檔案信息數據庫建設步伐,實現檔案信息資源共享,進一步提升各級綜合檔案館為各級黨委、政府,為社會各界提供檔案信息資源服務的能力和水平。根據國家和我省有關檔案工作業務規范,結合我省實際及全省檔案信息化工作座談會的討論意見,特制定《陜西省紙質文書檔案數字化操作規范(試行)》。現印發給你們,請遵照執行。
附件:1、《陜西省紙質文書檔案數字化操作規范(試行)》
 
                                                                                                            陜西省檔案局辦公室
                                                                                                           二〇〇九年十月二十六日
                                                                                     陜西省紙質文書檔案數字化操作規范(試行)
                                                                                                                    陜西省檔案館
                                                                                                                         2009年
目    錄
1 、檔案數字化領導機構方案
2、 需數字化的檔案確認規范
3 、紙質檔案數字化技術規范
4 、紙質檔案數字化方式
5 、檔案數字化加工流程圖
6 、檔案數字化的前處理工作規范
7 、檔案數字化的后處理工作規范
8、 數據驗收
9、 數字化工作設備技術標準
10、管理制度
檔案數字化領導機構方案
    為加強對檔案館數字資源建設工作的協調領導,特成立數字檔案館資源建設協調領導小組。(以下簡稱領導小組)
    一、領導小組職能:制定檔案數字化的總體規劃和年度計劃,保證項目的外部環境、內部條件、決策目標的動態平衡,實現管理決策所制定的各項目標。
    二、目標:實施有效的組織、協調、激勵工作,保證檔案數字化計劃的順利實現。
    三、領導小組組成:
   (一)組長:
   (二)副組長:
   (三)辦公室:負責協調、聯絡各相關處室。
   (四)辦公室下設機構:
    1、規范制定組:負責起草制定檔案數字化過程中需制定的相關規范及技術標準。
    2、前處理組:負責調、歸卷以及案卷的前期整理工作,確保檔案在進行數字化加工之前案卷的質量達到規范要求。
    3、綜合保障組:負責加工場地的落實,水、電保障工作,負責加工單位工作人員的出入管理以及項目資金保障工作。
    4、數字化生產組:負責數字化加工過程中的相關技術工作、在線抽檢工作、部分特定檔案的具體數字化工作。以下簡稱數字化組。
    5、驗收組:負責調、歸卷的質量檢查及最終加工數據的驗收。
需數字化的檔案確認規范
    目的:確定需數字化處理的檔案范圍。
    一、需數字化的檔案的確認原則:
   (一)紙質檔案的數字化,必須符合國家檔案開放規定以及有關規定。
   (二)價值性原則,屬于歸檔范圍且應永久或長期保存的、社會利用價值高的檔案可列入數字化加工的范圍。
   (三)實用性原則,就是體現檔案的最終價值原則,檔案最終目的就是對利用者提供利用,所以要確定那些檔案具體需要進行數字化加工,一個重要的衡量條件就是看檔案的利用率高低。
    二、需數字化處理的檔案的范圍:
   (一)紙質檔案
    紙質檔案包括文書檔案、專門檔案等門類。
    1、文書檔案:文書檔案數字化范圍包括永久和長期保存的開放檔案。
    2、專門檔案:可以對社會提供利用的、利用率較高的專門檔案應數字化。
   (二)照片檔案的數字化范圍:
    1、工作會議、業務會議、表彰會議、代表會議等形成的照片。
    2、上級領導、社會著名人物檢查、視察、指導工作形成的照片。
    3、歷屆領導人的照片。
    4、重大活動的照片。
    5、重要外事工作形成的照片。
    6、獲得省級以上各種榮譽(如獎狀、錦旗、獎杯等)翻拍形成的照片。
   (三)錄音錄像檔案的數字化范圍:
    1、工作會議、業務會議、表彰會議、代表會議等形成的錄音、錄像帶。
    2、上級領導、社會著名人物檢查、視察、指導工作形成的錄音、錄像帶。
    3、重大活動的錄音、錄像帶。
    4、重要外事工作形成的錄音、錄像帶。
    5、重大事件、事故形成的錄音、錄像帶。
    6、新聞媒體報道本機關的信息、新聞報道。
 紙質檔案數字化技術規范
一、范圍
本規范規定了紙質檔案數字化的主要技術要求。
本規范適用于采用各種設備對紙質檔案的數字化加工處理及數字化成果的管理。
二、規范引用文件
DA/T 31-2005 紙質檔案數字化技術規范。
三、術語和定義
下列術語和定義適用于本規范。
(一)數字化digitization
用計算機技術將模擬信號轉換為數字信號的處理過程。
(二)紙質檔案數字化digitization of paper-based records
采用掃描儀或數碼相機等數碼設備對紙質檔案進行數字化加工,將其轉化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數字圖像或數字文本的處理過程。
(三)數字圖像digital image
表示實物圖像的整數陣列。一個二維或更高維的采樣并量化的函數,由相同維數的連續圖像產生。在矩陣(或其他)網絡上采樣——連續函數,并在采樣點上將值最小化后的陣列。
(四)黑白二值圖像binary image
只有黑白兩級灰度的數字圖像。它對應于黑白兩種狀態的文字稿、線條圖等。
(五)連續色調靜態圖像continuous-tone still image
以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態數字圖像。在紙質檔案數字化過程中,通常表現為灰度掃描與彩色掃描兩種模式。
(六)分辨率resolution
單位長度內圖像包含的點數或像素數,一般用每英寸點數(dpi)表示。
(七)失真度distortion measure
對檔案進行數字化轉換后,數字圖像與檔案原件在色彩、幾何鉀方面的偏離程度。
(八)可懂度intelligibility
數字圖像向人或機器提供信息的能力。
(九)圖像壓縮image compression
消除圖像冗余或對圖像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。紙質檔案數字化過程中,較常見的有TIFF(G4)、JPEG等壓縮格式。
四、紙質檔案數字化基本要求
(一)基本環節
紙質檔案數字化的基本環節主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數據質檢、數據掛接、數據驗收、數據備份、成果管理等。
(二)過程管理
1、應加強紙質檔案數字化各環節的安全保密管理機制,確保檔案原件和數字化檔案信息的安全。
2、紙質檔案數字化的各個環節均應進行詳細的登記,并及時整理、匯總,裝訂成冊,在數字化工作完成的同時建立起完整、規范的記錄。
五、檔案整理
在掃描之前,根據檔案管理情況,按下述步驟對檔案進行適當整理,并視需要做出標識,確保檔案數字化質量。
(一)分配檔案定位符
對已應用檔案定位符技術的檔案館,按照分配好的定位符范圍打印定位符,并按照粘貼規則將其粘貼在檔案上。未應用檔案定位符技術的檔案館直接進行目錄數據準備工作。
(二)目錄數據準備
按照《檔案著錄規則》(DA/T18-1999)以及《陜西省文書檔案目錄數據交換格式與著錄項目細則的暫行規定》等的要求,規范檔案中的目錄內容。包括確定檔案目錄的著錄項、字段長度和內容要求。如有錯誤或不規范的案卷題名、文件名、責任者、起止頁號和頁數等,應進行修改。
(三)拆除裝訂
在不去除裝訂物情況下,影響掃描工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。
(四)頁面修整
破損嚴重、無法直接進行掃描的檔案,應先進行技術修復,折皺不平影響掃描質量的原件應先進行相應處理(壓平或燙平等)后再進行掃描。
(五)檔案整理登記
制作并填寫紙質檔案數字化加工過程交接登記表單,詳細記錄檔案整理后每份文件的起始頁號和頁數。
(六)裝訂
掃描工作完成后,拆除過裝訂物的檔案應按檔案保管的要求重新裝訂。恢復裝訂時,應注意保持卷內文件的順序不變,做到安全、準確、無遺漏。
六、檔案掃描
(一)掃描方式
1、根據檔案幅面的大小(A4、A3、A0等)選擇相應規格的掃描儀或專業掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數碼平臺,或者縮微拍攝后的膠片數字化轉換設備等進行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。
2、紙張狀況較差,以及過薄、過軟或超厚的檔案,應采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率;不適合拆卷的檔案可采用零邊距掃描儀或者是相機拍攝的方式。
(二)掃描色彩模式
1、掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。
2、頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,采用黑白二值模式進行掃描。
3、頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,采用灰度模式掃描。
4、頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。
(三)掃描分辨率
1、掃描分辨率參數大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
2、采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率應選擇≥200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。
3、數碼相機拍攝精度應達到800萬像素。
5、掃描圖像縮放比應為100%;用數碼相機拍攝時要注意被拍攝物的影像要充滿取景框。
6、照片檔案數字化應采用掃描方式進行。彩色照片掃描類型采用“百萬種顏色”模式;黑白照片掃描類型采用“灰度”模式。
(四)掃描登記
認真填寫紙質檔案數字化轉換過程交接登記表單,登記掃描的頁數,核對每份文件的實際掃描頁數與檔案整理時填寫的文件頁數是否一致,不一致時應注明具體原因和處理方法。
七、圖像處理
(一)圖像數據質量檢驗
1、對圖像偏斜度、清晰度、失真度等進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理。
2、由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描。
3、發現文件漏掃時,應及時補掃并正確插入圖像。
4、發現掃描圖像的排列順序與檔案原件不一致時,應及時進行調整。
5、認真填寫相關表單,記錄質檢結果和處理意見。
(二)糾偏
對出現偏斜的圖像應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。
(三)去污
對圖像頁面中出現的影響圖像質量的雜質如黑點、黑線、黑框、黑邊等應進行去污處理。處理過程中應遵循在不影響可懂度的前提下展現檔案原貌的原則。
(四)圖像拼接
對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數字化圖像的整體性。
(五)裁邊處理
采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。
八、圖像存儲
(一)存儲格式
1、掃描的圖像應保存為TIF格式或JPG格式,一般黑白二值圖像保存為TIFF(G4)格式,灰度或彩色圖像保存為JPG格式;數碼相機拍攝的圖像應保存為JPG格式。
2、以單份文件為單位存儲為PDF格式。存儲時的壓縮率的選擇,應以保證掃描的圖像清晰可讀的前提下,盡量減小存儲容量為準則。
(二) PDF文件的命名和存儲
1、傳統卷內文件的命名規則為:紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。例如123-1-23-4.pdf。
2、以件為保管單位的文件的命名規則為:紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。例如123-1-4.pdf。
九、目錄建庫
(一)數據格式選擇
目錄建庫應選擇通用的數據格式。所選定的數據格式應能直接或間接通過XML文檔進行數據交換。
(二)檔案著錄
按照《檔案著錄規則》(DA/T18-1999)以及《陜西省文書檔案目錄數據交換格式與著錄項目細則的暫行規定》的要求進行著錄,建立檔案目錄數據庫。
(三)目錄數據質量檢查
采用人工校對或軟件自動校對的方式,對目錄數據庫的建庫質量進行檢查。核對著錄項目是否完整、著錄內容是否規范、準確,發現不合格的數據應要求進行修改或重錄。
十、數據掛接
(一)匯總掛接
檔案數字化轉換過程中形成的目錄數據庫與圖像數據庫,通過質檢環節確認為"合格"后,通過網絡及時加載到數據服務器端匯總。通過編制程序或借助相應軟件,可實現目錄數據對相關聯的數字圖像的自動搜索,實現批量、快速掛接。
(二)數據關聯
以紙質檔案目錄數據庫為依據,將每一份紙質檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時要認真核查每一份圖像文件的名稱正確與否,圖像文件的頁數與檔案目錄數據庫中該份文件的頁數是否一致,圖像文件的總數與目錄數據庫中文件的總數是否相同等。通過檔案定位符實現每一份圖像文件與檔案目錄數據庫中該份文件關聯關系。
(三)認真填寫紙質檔案數字化轉換過程交接登記表單,記錄數據關聯后的頁數,核對每一份文件關聯后的頁數與檔案整理、掃描時填寫的頁數是否一致,不一致時應注明具體原因和處理辦法。
十一、數據驗收
(一)數據抽檢
1、以抽檢的方式檢查已完成數字化轉換的所有數據,包括目錄數據庫、圖像文件及數據掛接的總體質量。
2、一個全宗的檔案,數據驗收時抽檢的比率不得低于10%。
(二)驗收指標
1、目錄數據庫與圖像文件掛接錯誤,或目錄數據庫、圖像文件之一出現不完整、不清晰、有錯誤等質量問題時,抽檢標記為“不合格”。
2、 一個全宗的檔案,數字化轉換質量抽檢的合格率達到98%以上(含98%)時,給予以驗收“通過”。
合格率=抽檢合格的文件數/抽檢文件總數×100%
(三)驗收審核
驗收"通過"的結論,必須經分管領導審核、簽字后方有效。
(四)驗收登記
認真填寫紙質檔案數字化驗收登記表單。
十二、數據備份
(一)備份范圍
經驗收合格的完整數據應及時進行備份。
(二)備份方式
為保證數據安全,備份載體的選擇應多樣化,應采用在線、離線相結合的方式實現多套備份,并注意異地保存。
(三)數據檢驗
備份數據也應進行檢驗。備份數據的檢驗的內容主要包括備份數據能否打開、數據信息是否完整、文件數量是否準確等。
(四)備份標簽
數據備份后應在相應的備份介質上做好標簽,以便查找和管理。
(五)備份登記
填寫紙質檔案數字化備份管理登記表單。
十三、數字化成果管理
(一)應加強對紙質檔案數字化成果的管理,確保其安全、完整和長期可用。
(二)紙質檔案數字化成果提供網上檢索利用時,應有制作單位的電子標識,并根據具體情況分別采用可下載或不可下載的數據格式。
  紙質檔案數字化方式
檔案館紙質檔案數字化一般采用的方式有兩種:
一、館內組織人員或外聘人員。一般是利用檔案館的檔案管理系統中的錄入模塊進行條目的錄入,掃描的原文圖像文件利用軟件的功能進行掛接。驗收這些數據采用檔案管理系統自帶的統計、檢索功能進行。
二、外包。一般由外包公司利用自有軟件錄入和掃描,每隔一定周期給檔案館提交一次條目數據與原文數據,提供的條目數據格式采用xml格式(詳見“數據交換格式”),原文數據采用pdf格式(詳見“紙質檔案數字化技術規范”)。驗收這些數據有兩種方式:一是轉入檔案管理軟件中進行驗收,二是用專門的驗收軟件進行驗收,發現錯誤返回外包公司修改,外包公司修改后重新提交這部分數據,經驗收無誤后分批次轉入檔案管理系統。
檔案數字化加工流程圖
檔案數字化的前處理工作規范
一、領導小組制訂出檔案數字化工作計劃。
二、前處理組依據工作計劃給出調卷單,并依照調卷單負責落實調卷工作。
三、驗收組負責對調得的檔案進行前期質量檢查工作,對于質量不合格的檔案需要交回前處理組重新整理。
 有以下情況的案卷視為質量不合格案卷:
1、案卷題名不清或無題名。
2、案卷無檔號或者檔號重復。
3、案卷無卷內目錄或者卷內目錄不正確。
4、卷內文件頁碼不正確,例如重編或者漏編頁碼。
5、未進行解密劃控鑒定的案卷。
四、數字化組負責給加工單位分配本批次檔案定位符。
五、驗收組將檢驗合格的檔案交由加工單位開始進行數字化加工。
(案卷實體流程圖如下)
 
                                                                    檔案數字化的后處理工作規范
一、加工單位將加工好并已裝訂的檔案交回驗收組。
二、驗收組對加工好并裝訂的檔案實體進行質量檢查,登記,對于整理裝訂不合格的檔案要退回加工單位重新整理。
出現以下情況的為整理不合格檔案:
1、卷內文件前后順序不正確。
2、卷內文件不完整,或者出現因對案卷加工引起的紙張殘缺。
3、裝訂方式不符合檔案裝訂規范。
三、前處理組對加工好檔案依照歸卷單歸卷。
數據驗收
一、數據驗收
(一)數據抽檢
1、以抽檢的方式檢查已完成數字化轉換的所有數據,包括目錄數據庫、圖像文件及數據掛接的總體質量。
2、 一個全宗的檔案,數據驗收時抽檢的比率不得低于10%。
(二)驗收指標
1、目錄數據庫與圖像文件掛接錯誤,或目錄數據庫、圖像文件之一出現不完整、不清晰、有錯誤等質量問題時,抽檢標記為“不合格”。
2、 一個全宗的檔案,數字化轉換質量抽檢的合格率達到98%以上(含98%)時,給予以驗收“通過”。
合格率=抽檢合格的文件數/抽檢文件總數×100%
(三)驗收審核
驗收"通過"的結論,必須經分管領導審核、簽字后方有效。
(四)驗收登記
認真填寫紙質檔案數字化驗收登記表單。
二、案卷質量驗收
(一) 調卷后案卷質量的驗收:前處理組按照調卷單調取案卷后,由驗收組按照一定標準檢驗案卷整理情況是否準確無誤。
(二) 數字化加工后案卷質量的驗收:驗收組在加工單位將裝訂好的檔案交回后對其完整性及裝訂情況進行檢查。
(三)以上兩項檢查都要求案卷質量必須全部合格,并要填寫相應的驗收單。
案卷整理依據規范:
DA/T  22-2000 歸檔文件整理規則
《陜西省歸檔文件整理實施細則》
數字化工作設備技術標準
需要用到的工作設備如下:
筆記本電腦:用于加工生產線各環節數據的隨機抽檢,普通檔次。
數據抽檢、驗收臺式電腦:普通檔次。
掃描圖像處理用臺式電腦:酷睿2雙核及同檔次以上cpu,內存2G以上、硬盤500G以上,帶1G以上顯存獨立顯卡。
1000G移動硬盤:用于數字化生產線加工數據的轉移、存儲、備份。
高速掃描儀:A4幅面彩色,分辨率600dpi以上,30頁/分鐘以上,48位色,自動送稿器,usb2.0或scsi接口。
平板掃描儀:A3、A4幅面彩色,分辨率600dpi以上,48位色, usb2.0或scsi接口。
膠片掃描儀:用于掃描縮微膠片,規格根據膠片情況定。
零邊距掃描儀:用于某些特定的無法拆卷,案卷質量較差的檔案的掃描。
激光打印機:普通A3幅面激光打印機。
手持式條碼掃描槍:用于隨機抽檢數據,普通檔次無線掃描槍。
DVD刻錄機:用于數字化加工數據的脫機備份,普通檔次。
數碼相機:用于拍攝需數字化的機密檔案,800萬像素以上、微距拍攝效果好的。
管理制度
一、工作人員要求工作認真,有高度責任心。保證各項工作計劃能順利,按時完成。
二、 遵守各項規章制度,按時上下班,嚴格遵守勞動安全衛生制度。
三、工作人員以及加工單位人員必須遵守的工作制度。
1、必須遵守中央文件規定的十條保密守則,要嚴守秘密,嚴防泄密、失密,否則要追究責任,嚴肅處理。
2、要嚴格執行檔案的調歸卷制度,建立完善的登記制度。發現問題及時處理。
3、要隨時檢查本室安全、保密設施,發現問題立即報告,及時解決,離開檔案室時,必須鎖好卷櫥,關好電源及門窗。
4、加工場所嚴禁吸煙,以防火災。
5、加強保密觀念,每逢節假日進行一次安全、保密檢查,及時消除不安定因素。
四、加工單位人員應有一定的文化素質;能熟練的使用計算機,工作效率高,出錯率低;工作認真負責;有高度的責任心,能保證檔案的安全與完整性,不將檔案的內容外傳;應按照要求,按時完成規定的工作數量,并達到規定的質量標準。
五、加工單位的安全管理制度
1、加工單位的工作人員進出單位必須出示出入證。
2、加工單位應遵守我方的規章制度;嚴格遵守勞動安全衛生、工作制度和工作規范;按時上下班,保持機房內整潔及衛生。
3、由加工單位對全體參與加工人員組織定期的安全保密教育,將安全保密守則內容作為定期考核內容,做到制度上墻、人人熟記、事事執行。
4、凡進入加工處理現場的設備原則上在加工工作未完成之前不得離開加工現場;對由于檢修等特殊原因需離開加工現場的設備,需經檔案館技術人員檢測后同意時方可辦理手續移出加工現場;所有進入加工現場的人員一律不得攜帶U盤、MP3播放器、移動硬盤等可移動存儲設備,違反者一經發現立即沒收。加工工作完成后所有可存儲設備需經檔案館技術人員完成痕跡清除工作后方可撤離。
六、加工單位有下列情形之一,檔案館可以解除本合同:
1、嚴重違反勞動紀律或對檔案館利益造成重大損害的。
2、泄露檔案內容,給檔案館造成嚴重損失。
3、不能勝任勞動合同約定的工作,經過培訓或調整仍不能勝任工作。