民國檔案整理工作信息采集與處理
在中國第二歷史檔案館(以下簡稱“二史館” ) 5 年數字化工程的整理工作中,目錄體系、組織模式、管理方法與工作信息共同構成與檔案實體相對應的宏觀的信息體系。在學術研究范圍,整理工作使民國檔案在實體上達到整齊劃一,建立完整的“全宗—案卷” 目錄體系,二者從工作對象的角度代表了民國檔案整理工作已取得的成果;成熟的業務外包組織模式與高效的管理方法從工作本身對整理工作進行了分析;工作信息是記錄整理工作本身的重要材料,對其的研究尚顯薄弱。二史館在實際的整理過程中,不斷探索并形成了一套完整的工作信息之采集與處理方法。本文通過對整理工作中各項環節之信息采集與處理的過程闡述與分析效果,試對工作本身信息的加工處理進行探究,將其提取與歸檔的價值加以闡釋。
一、信息采集與處理工作的概念及意義
民國檔案的信息采集與處理是針對案卷實體整理加工過程及生成的各種數據進行篩選、記錄,隨后對記錄的數據進行統計與分析,最終反饋于整理過程的一項綜合性工作。高效的信息采集工作如實地記錄了整理環節各處細節,通過查閱該信息可以了解整理工作的基本狀態,對各種數據進行的分析處理為民國檔案案卷級整理工作起到促進作用,為各類數據統計與工作總結提供便利。
二、工作信息與數據的采集
民國檔案整理工作每一處細節都會形成相應的信息及數據,如調卷過程中產生的點卷記錄、分卷過程的新舊檔號對照、整理過程的特殊狀況標注、編目過程的新舊標題對照、質檢過程的差錯率等,對其的采集不僅是對工作過程的詳細記錄,更為數據統計后反饋指導業務工作提供可靠參考,因此,有選擇的、細致的數據采集利于數據統計的準確與全面。
(一) 點卷記錄
二史館館藏豐富,檔號存在各種特殊情況,一卷多宗、空缺跳號、改重要號、移交特藏、斷頭號等諸多因素往往導致檔號范圍與實體案卷數量并不相同,因此而開展的點卷工作是項目組在提調案卷之前必須進行的。點卷環節由全宗負責人牽頭,外包公司工作人員逐卷清點,將有差別有疑問的情況在?點卷記錄表? (見表1) 上標注明確,之后與庫房保管員進行信息核對,雙方對實體數量及對應情況確認無誤后才可將檔案調出。點卷記錄不僅是調卷過程中必不可少的環節,生成的?點卷記錄表? 更標注了案卷的走向及檔號的歷史變動,是實體檔案保管與檔號管理必不可少的信息。
(二) 新舊檔號對照
二史館館藏檔案檔號來源眾多、變更復雜,最原始的檔號是由民國時期各立檔單位編制,第二層是由新中國各檔案接收單位編制,第三層是由二史館接收后編制,第四層是在歷次整理過程中因拆并卷、移交特藏、抽調重要號等工作不斷變化而成。檔號變動情況的記錄,不僅明確地標識著每本檔案的來源,而且通過對其的研究更可以了解民國檔案整理工作甚至民國檔案的工作歷史。數字化前整理過程中大量的厚卷、雜卷得到精細拆分,多宗重新編制檔號,空缺號碼進行銷除,整理工序完成后最終的編排流水檔號使得大多數全宗案卷總數與調出時不同。因此,在拆并卷及順號過程中對新舊檔號的記錄必不可少,其形成的記錄將與保管處留存的歷史檔號變遷記錄組成全新的民國檔案案卷走向指南。新舊檔號的對照情況反映在電子目錄中(見表2)。
(三) 珍貴檔案與特殊載體記錄
民國檔案在一定意義上具有文物性質,其本身已是重要保護對象,而其內有較多珍貴檔案,諸如字畫、手跡、鈔票、郵票、勛章、照片等物件彌足珍貴,但在歷次整理過程中并未全部發現并及時予以保護。案卷當中的非紙質載體、實物、影像資料等不同于普通文書的檔案,以豐富多彩的形式向世人展示民國檔案的內涵與魅力,對其的鑒別與標注是數字化整理工作的一大特色。對珍貴檔案的處理關鍵在鑒定,相對于民國檔案龐大的數量,僅具有極高文物特性與歷史研究價值的檔案才應被鑒定為珍貴檔案,以手跡鑒定舉例: 其一應注意檔案內隱藏的領袖人物的手跡,其二為民國時期書法大家手跡,其三為國際著名人物手跡,其四擇出各界著名人物手跡,由館員按照鑒定標準來確定挑選出的物件是否應標注為珍貴檔案。珍貴檔案的詳細記錄為保護提供便利信息,其中有利于隨卷保管的或無法拆分的珍貴檔案,仍然跟隨原卷進行保存,可拆分的或全卷為珍貴的檔案,直接提交特藏庫房進行保管。案卷內特殊載體的鑒別與標注相對簡單,只要是檔案內出現的非紙質載體,一一予以內容與載體形式的記錄。珍貴檔案與特殊載體記錄落實在電子目錄的備注欄內(見表3)。
(四) 質檢環節錯誤情況記錄
二史館民國檔案數字化整理工作的質檢在內容上分為整理質檢、編目質檢、編頁質檢與數據質檢,在形式上分為公司自檢(一檢)、項目組抽檢(二檢)、館方終檢(三檢)。把對各環節內錯誤的記錄反饋給工作人員,這是一種有效提高整理質量的手段,基本上每段質檢在每個環節內都會找到錯誤,對出錯點的記錄與歸納為后期錯情分析提供基礎材料。錯情記錄點包括案卷標題、卷內文件排序、頁碼編制、重份檔案處理、檔案保護性處理、案卷備考表填寫、案卷包裝、檔號變化、珍貴與特殊檔案記錄以及目錄數據等方面出現的錯誤(見表4)。一檢中記錄的錯誤點會即時反饋給整理人員,二檢與三檢的錯誤記錄會反饋給整理人員及上一級質檢人員,使各人在其記憶期內將錯點糾正,加深印象,有效地防止同類問題再次出現。
(五) 整理各環節時間點記錄
整理各環節時間點記錄是對整理過程大工序的起或止時間節點進行記錄,通過其了解整體進度并據此安排后續工作。記錄的時間點為每個全宗的調卷、整理、二檢、三檢開始時間,檔案實體移交結束時間,時間精確到日,所有項目填齊后即視為該全宗整理工作的結束。對每個全宗的加工時間點的記錄,主要作為參考數據來制訂各層次的工作計劃、統計數據、查詢環節之用,亦可以間接地反映整理各環節耗時、難易度與相互間的銜接情況(見表5)。
三、工作信息與數據的分析
民國檔案整理工作的信息分析是對在整理環節中記錄的各種數據與材料進行統計與歸納,尋找出工作中的普遍規律及易出現的問題,反饋指導整理工作的一個項目。信息分析是信息采集工作的目的,其完成的各項信息反饋對整理工作具有一定的促進作用。
(一) 庫房存儲分析
二史館館藏檔案主體保存在保管處庫房內,擬加工檔案存區在工作現場有臨時檔案柜與暫存庫房,在保管庫區配有周轉庫房。臨時檔案柜與暫存庫房主要存儲正在整理的檔案與已調出的待整檔案,周轉庫房主要存儲已整理待掃描的檔案。整理現場與周轉庫房庫存有限,必須結合調卷、移交與具體整理進度對庫存進行科學規劃,使其達到“充而不實” “流而不塞” 的狀態。在進口端,庫管員通過對工作現場空柜的統計,結合掃描環節預調卷計劃,計算出可調卷量,由此確定調卷計劃;在出口端,結合空柜數量與實際整理進度,在柜容預滿前首先聯系掃描環節調卷,如其暫時無法調卷,則將一定數量案卷轉移到周轉庫房,由此來保證整理工作的正常進行。
(二) 進度分析
進度分析主要是對整理環節每周的編頁量、整卷量、一檢量進行統計,通過計算各分類的已完成總量,進行相應的換算,以此來對整理工作各進度進行調控,保證整體進度正常開展。進度分析成果主要包含總體進度、整檢差與日均編頁量:
1 總體進度
是用每周更新的編頁總量除以各項總量得出的百分比來代表。在二史館的數字化整理工作中,有兩項工作量標準,第一個是合同總量,按照與外包公司簽訂的合同規定,期限一般為1 年,基本是從本年中至次年中,其進度計算公式為:
合同進度=編頁總量÷合同總編頁量
第二個是年度績效考核總量,因二史館數字化工程是全額財政撥款,每個自然年要對工程的績效進行考核,因此產生的年度總量以自然年為準,其進度計算公式為:
考核年度進度=編頁總量÷考核年度總編頁量
兩套標準需要兩套數據進行跟蹤,在進度分析中,設有年度完成率與合同完成率兩項,通過每周的產量統計,分別計算出年度與合同的完成率。然而,年度與合同在具體月份上是存在沖突的,因二者總量固定但合同期先行半年,導致下半年為完成年度總量工作偏緊,上半年因合同量所剩不多致使工作偏松,此時對工作人員、強度、協調等管理手段都要進行相應的調整,以適應不同階段的工作(見表6)。
2 整檢差
整檢差是整卷總量與一檢案卷總量的差,共計算分公式為:
整檢差=整理總卷量-一檢總卷量
其主要是對第一道質檢的進度進行跟蹤,由于一檢率為100%,總量,大原始錯誤率高,所以特別對一檢進行進度跟蹤,通過對數值的分析來調整工作人員。在整理人員一定的條件下,整檢差數值正增長時減少整卷人員、增加質檢人員,負增長時反向調整,以保證質檢與整理銜接有度,不使其出現較大空擋(見表7)。
3 日均編頁量
即未來日均編頁最低數量,其為兩項總量的完成提供參考。考核年度日均量自合同期開始至自然年年底,公式為:
日均編頁量=考核年度剩余編頁量÷有效工作日
合同日均量自年初至合同截止日期,公式為:
日均編頁量=合同剩余編頁量÷有效工作日
兩項日均編頁量的計算并不沖突,是相互銜接的,其過渡階段的計算尤為重要,需將兩項標準之間的量清算明確。日均編頁量的計算是整體工作進度分析最細致的材料,通過其與實際工作量的比對,可以以日為單位隨時對編頁量進行調整,而編頁量的保證是整個整理工作總進度的保證(見表8)。
(三) 錯情分析
錯情分析是對整理環節中出現的各種錯誤的分析,其包含分卷錯誤、檔號錯誤、編頁錯誤、卷內文件次序錯誤、時間項錯誤與標題錯誤,前幾者均是就事論事,及時解決,其中最重要的是標題的出錯情況(見表9)。案卷標題是整理成果的重要結晶,其質量好壞在一定程度上代表著全部整理工作的質量。在實際工作中,標題出現的錯誤可以歸結為“硬傷” 與“軟傷”,“硬傷” 包括歷史點、行文關系、政治性用語等基本概念性的錯誤以及錄入錯誤,“軟傷” 一般是表述、點題、概括等不夠明確到位。每一道質檢,工作人員都會對檢出的錯誤進行及時的記錄,通過對其分析,找出錯誤原因并歸納出易錯范圍,直接反饋給整理人及前道質檢人,在其記憶有效期內對錯誤進行更正,從而加深印象,在較大程度上避免了同類問題的再次出現。對標題的錯情分析,在“物” 上可以歸納出整全宗的特點與難點,在“人” 上可以了解整理人員當時的業務水平與工作狀態,通過對二者的分析,可以在“法” 上看到現有整理規則存在的盲區及死角,通過“整理規則審定制度” 對相應規則進行補充及修改,使之更好地適應現有及未來的整理工作。
(四) 各種數據統計
在二史館民國檔案數字化過程中,許多環節需要整理環節的數據進行參考,館方各種統計亦需整理方面的基礎數據。
三檢環節質檢驗收需要提供抽檢的卷數與頁數,檔案館對制成的三檢目錄進行統計,得出結果后交予質檢驗收組,每次提交三檢的數字最終匯成年度績效考核時的年度驗收總量。
掃描環節提調已整案卷前,需要了解案卷的卷數、頁數、排架長度以及破損程度,檔案館在電子目錄上對卷量、頁數、破損率進行計算,并在周轉庫房對待移交案卷排架長度進行估測,將數據報給掃描環節后,其空出相應的架位以供接收案卷。
二史館新館籌建時需要一項新舊案卷對比數據,檔案館將開展數字化以來近百個全宗的新卷數求和,舊卷數求和,計算出差及百分比提交籌建小組,其通過對此數據的分析,估算出未來整理后的案卷漲庫量。
此類型的統計工作有許多,基本是為某個總結或計劃進行特定數據的統計,其最基礎的數據來源是全宗明細表(見表10),其內記錄了每一全宗的代號、名稱、總卷數、總頁數、責任者等,在每個全宗結束之后由數據管理員對全宗數據進行采集與記錄,隨著工作的進展,數據不斷豐富與全面,為各類統計工作提供有力的數據支持。
四、結語
二史館整理環節運用工作信息的采集與處理方法,對館藏百余個全宗的案卷級加工進行了輔助,其中經過摸索有過錯誤,在不斷地否定與再否定之中前進,形成了整套適用于民國檔案案卷級整理的信息處理方法,其經驗與模式,或可應用于未來民國檔案文件級整理工作當中,并在其中經受實踐的考驗,錘煉為適應更大量、更復雜的工作的科學方法。