館藏廣州地方民國檔案文件級著錄工作的體會和設想
近年來我館開展了館藏民國檔案文件級著錄工作,筆者有幸參與了文件級著錄操作規范制定、著錄實際工作的監督、指導和培訓,就民國檔案文件級著錄談一些體會和設想。
作為初涉民國檔案編目的新兵,總體感覺就是一個字——難。
一是由于缺乏民國時期廣州市政治、經濟、教育、軍事、地方社會文化等方面的歷史背景知識,在加上民國時期廣州市地方政權不夠穩定,政府機構設置及其變化紛繁復雜,造成對館藏民國檔案各全宗立檔單位的機構名稱、設置、職能及其演變、對廣州地方發生的重大事件、重要人物都不夠熟悉;二是因為民國檔案字體上均為繁體字,且異體字、行書、草書較多,且多為豎排文字,識讀較為困難;三是民國時期時間跨度大,廣州地方政府文書制度、辦文程序不斷變革,對整理編目中出現的新情況如何保證處理標準統一規范沒有把握;四是館藏民國檔案中語言文白交迭、除了近代白話、文言,還有不少英文、德文、日語、俄文等語言文字,需要有多語言識讀能力;五是公文體式種類繁多、非正式文種文件大量存在,與現代公文文種差別較大,很多用詞用語還具有鮮明的廣州地方特點,對題名、文種、主題的準確理解和著錄提出了挑戰。
一、民國檔案文件級著錄工作中的難點
(一) “件” 的劃分問題
進行民國檔案文件級著錄中如何科學、合理準確的劃分民國檔案文件,成為著錄碰到的第一個重大難點。在缺乏通用的民國檔案分件具體標準的情況下,我們產生了兩種對“件” 的劃分的思路,第一種: 具有或根據文件頁面的內容能判斷出文件責任者、事由或主題、文件編號、發(收) 文者、正文、收文者、發文的時間、印章等全部或大部分文件結構特征的頁面或頁面的集合構成1 件文件,我們稱之為“自然件”;第二種: 1 個或數個內容緊密關聯的文書(包括其附屬物) 在完成公文流轉在立檔時被立檔人作為1 個基礎保管單位而存檔的檔案,即為1 “件” 檔案,我們暫稱之為“邏輯件”。我們借鑒兄弟省市檔案館民國檔案整理分件的部分操作原則,參考?歸檔文件整理規則? 中對“件” 的定義,確定了以“邏輯件” 作為廣州市檔案館文件級著錄分件的標準: 即以事由結合責任者為劃分檔案文件的主要標準。
在分件的具體操作中,由公務文書的正式文種轉化形成的館藏民國檔案文件因為具有相對固定和完整的構成要素,分件相對容易;但對于大量成套出現的專用表冊,如戶籍卡、擔保書、合同、學籍冊、各類統計表、登記表、履歷表等,在邏輯上定為一件的劃分方法實際是文件的組合,存在“件” 的劃分上往往會因為分件過粗而產生著錄深度不夠、檢索查全率和查準率降低的問題。如“廣州市黃沙區民國二十五年人口遷入/ 遷出申請表”,其中該文件就有60 頁,但按照邏輯件的分件標準只算為一件,但實際上每頁為獨立的一張申請表,上面記載了申請遷入或遷出的人員姓名、擔保人姓名、家庭住址、申請內容等信息,每一頁的文件信息實際上構成一個自然件,但邏輯件的分件使得著錄無法揭示這些檔案內容信息。
(二) 著錄項的確定問題
依據?檔案著錄規則? (DA/ T 18—1999),檔案文件級著錄項為層級式著錄,一般通用的文件級目錄著錄項共分7 大項,21 個小項,?民國檔案目錄中心數據采集標準民國檔案著錄細則? (DA/ T 20 1—1999) 則規定,民國檔案文件級著錄項必錄項共分5 大項,9 小項,加上全宗號、目錄號、案卷號、件號、起至頁號、檔號等通用必錄項,合計應錄5 大項,15 小項,完全著錄則為7 大項,19 小項。
廣州市檔案館開展民國檔案文件級著錄是依據?檔案著錄規則? (DA/ T18—1999) 和?民國檔案目錄中心數據采集標準民國檔案著錄細則? (DA/ T20 1—1999) 的基礎上,使用平行著錄項,以“最小必要性” 為原則,選擇了全宗號、目錄號、案卷號、件號、起至頁號、檔號、題名、附件題名、責任者、文件形成時間、保管期限、密級、控制標識、政權標識、關鍵詞、附注16 個著錄項,作為我館民國檔案的必錄項。舍棄了文件編號、稿本、文種、語種、載體類型、載體形態、提要、分類號、縮微號、檔案館代碼等著錄項。這16 個著錄項能夠基本反映對應檔案文件的內容和形式特征,基本滿足當前方式下的檔案查閱利用需要。對分類號、提要、主題詞等內容特征檢索項的舍棄,減少了分類和主題標引工作,大大降低了著錄工作難度和工作量,有助于提高文件級目錄著錄工作進度,但削弱了目錄的內容檢索深度,在未來實際工作中,這樣的選擇,利用效果有待檢驗。
著錄項的舍棄、增加、完善是一項極其關鍵和復雜的工作,是目錄建庫的首要問題,要綜合考慮檔案類型、檔案內容和形式特征、元數據、整理基礎、著錄軟件功能配置、著錄項規范性、可操作性、數據互聯和共享要求等,需要在不斷的實踐中完善和擴展,以提高對檔案描述的全面性、準確性。
(三) 著錄項的規范性問題
在確定著錄項的基礎上,在編目外包項目實施過程中,外包公司員工面對具體和紛繁復雜的具體民國檔案文件,在理解和執行分件、編目著錄規則的過程中,各著錄項存在諸多不夠規范的問題,有些問題反復出現,困難較多,對一些復雜情況的不規范著錄處理仍留有不少遺憾。特別是題名、文件形成時間、關鍵詞、責任者、政權標識等項是著錄的核心內容,在著錄過程中發現存在不少問題,歸納概括起來為:
1 題名項
題名照錄事由;題名有語病;題名冗長;題名不能確切反映檔案內容;文種、責任者錯漏;抽象代指詞語未替換和明確;未使用標準規范簡化字;對干支代月,韻目代日沒有進行換算的照錄。
2 文件形成時間項
文件形成時間判斷錯誤;錄入錯誤;農歷、偽滿、日本等年號未轉換;考證時間未加“ [ ] ”;等等。
3 責任者項
機構責任者全稱或簡稱混用著錄,不統一;個人責任者未著錄職務,著名人物責任者使用別名、筆名、字、號署名時為標注其真實姓名或常用名;考證責任者未加“ [ ] ”;等等。
4 關鍵詞項
關鍵詞無檢索意義;關鍵詞過長;關鍵詞錯漏;關鍵詞的非敘詞問題。
5 政權標識項
文件的日偽屬性判斷依據不足;文件的日偽屬性判斷錯誤;文件的日偽屬性判斷遺漏。
針對上述問題,廣州市檔案館制定了著錄項操作規范,對每一項的著錄進行了具體的規定,結合著錄實例,編寫了操作手冊和案例集,對外包公司員工進行了持續的培訓和指導,并通過例行質檢,發現和及時解決了一些著錄項規范性的問題,盡最大可能提高各著錄項的著錄質量。
二、對民國檔案著錄工作的設想
(一) 制定民國檔案整理規則的行業標準
通過參與館藏民國檔案著錄工作,筆者深刻感受到,文件級檔案著錄,“件” 的劃分是著錄工作難易和工作量高低的關鍵決定因素。而“件” 的劃分和排列實質是檔案整理問題,即保持文件的完整性和文件之間的歷史聯系,歷史研究界對民國檔案內容有深入系統的研究,但從檔案學角度對民國檔案整理技術和方法的研究卻比較少見,有關民國檔案整理的論文大多也只是論述民國檔案整理的某一方面問題,系統、全面規定民國檔案整理方法、步驟、操作規則的標準遲遲未能出臺。對民國檔案整理規則的制定和研究,各檔案館基本上處于封閉和各自為戰的狀態,水平參差不齊。因為缺少統一和通用的民國檔案整理標準,各檔案館制定的整理規則差別非常大,對同一情況的處理方法各不相同,編目成果兼容性較差,交換和共享數據困難;規則起草和制定代價大,試錯成本高,在開展民國檔案整理工作時往往事倍功半,整理質量也無法得到切實保障。如果能夠制定用于指導和規范全國各級檔案館民國檔案整理的行業標準,則能大大推動民國檔案整理工作標準化。
(二) 修訂民國檔案著錄相關配套規則
筆者通過學習?檔號編制規則? ?檔案著錄規則? 和?民國檔案目錄中心數據采集標準民國檔案著錄細則? (以下簡稱“ ?兩個著錄規則? ” ) 等,對比實際著錄工作,發現這些標準均存在嚴重滯后于工作實際需要的問題,主要是:
1 著錄成果都是段落式條目和表格式條目,輸出的條目卡片連續排列形成卡片式目錄,在著錄用標識符、著錄項組合的表現形式等諸多規定大多無法直接使用于當今的計算機軟硬件環境下開展的民國檔案著錄工作;而現在計算機著錄工作方式和環境與過去相比發生了巨大變化,著錄結果是條式條目,輸出的條式條目按序排列組成簿式目錄,電子形態則為數據庫,新的著錄成果形態沒有統一規定。
2 只有對條目著錄的規定,沒有對目錄組織方法的規定;而現在檔案編目軟件一般自帶目錄組織功能,而且功能并不一致,迫切需要統一規定。
3 對全宗號、目錄號、案卷號、宗號、件號、檔號等著錄項的著錄只能依據?檔號編制規則? 的一般性規定,缺乏適用于民國檔案文件級著錄的詳細規定。
4 都是本館條件下利用,未考慮目錄數據的共建共享和互聯互通;而現在對數據格式兼容性、數據項標準化、數據跨時空共建共享和互聯互通等方面有了強烈要求。
5 在部分款目的具體規定上,?兩個著錄規則? 對文件形成時間項的著錄要求有明顯的不一致,如?檔案著錄規則? “9 4 5 文件時間不完整或部分時間字跡不清時,仍著錄原時間,原時間中缺少或字跡不清部分以‘□’ 補之,……” “9 4 7 文件形成時間考證不出時著錄為‘□□□□□□□’……”;而?民國檔案目錄中心數據采集標準民國檔案著錄細則? “9 3 2 時間項用8 位阿拉伯數字表示……,原文無法確定的時間補‘0’ ”。給統一著錄造成困惑。
?檔號編制規則? ?民國檔案著錄細則? ?民國檔案分類標引細則? ?民國檔案主題標引細則? 等配套組成民國檔案著錄工作的必備標準,如果能夠在修訂時統籌考慮,系統修訂完善,方能適應當下和未來網絡化環境下的民國檔案編目著錄工作,服務新時期各檔案館館藏民國檔案深度編研開發和查閱利用的需要。
(三) 推進民國檔案分類標引和主題標引自動化工作
分類標引和主題標引是著錄的關鍵工作,直接決定了內容揭示類核心著錄項的著錄質量,在過去傳統人工著錄方式下是最耗費時間和考驗著錄工作人員水平的工作,往往因為要求較高而效率較低,質量也無法有效控制,不少檔案館甚至被迫舍棄分類標引和主題標引工作。在現代計算機軟硬件環境下,如果對分類號、主題詞的標引依據?民國檔案主題標引細則? 和?民國檔案分類標引細則? 的內容進行修訂完善和軟件化改造,使兩個細則的內容分類和主題標引工作能夠在著錄軟件中根據題名、事由、責任者、全文內容自動提取主題詞和分類號,輔以人工選擇和審核。圖書編目著錄中以人機結合開展自動化的圖書分類號和主題詞標引工作,經驗成熟,值得借鑒。
(四) 成立民國檔案目錄編制機構,建設全國檔案館民國檔案聯機編目檢索系統,建立檔案編目員培訓和評價機制
參考國家統計局對企業一套表全國聯網直報信息采集和圖書聯機編目的思路,筆者設想,建立全國性民國檔案聯機編目中心和各省級區域分中心,建設全國性檔案館館藏民國檔案目錄數據庫和檢索系統。目錄數據庫按照統一規劃、統一標準,配發統一的網絡化編目軟件或建設網上編目統一平臺;各類型檔案館加入成為聯機編目中心的成員館,共享技術、平臺、標準和目錄資源,成員館聯機原始編目可以得到聯機編目機構的標準、規則等方面的技術、業務支持;成員館的編目數據實時上傳到數據庫平臺,質量接受聯機編目機構的評估,編目質量評價結果作為檔案館業務評價的核心指標之一,影響檔案館民國檔案整理編目經費劃撥、人員配置等。檔案編目是一項極為專業的工作,必須接受專業的培訓教育。民國檔案聯機編目各中心可依托編目機構的專業人員力量強大、標準規則研發能力突出等優勢,持續開展檔案編目員培訓和成員館編目水平評價工作,促進編目員自身業務水平不斷提高和成員館檔案編目工作質量穩步改進,最終建成全國民國開放檔案目錄信息網及其檢索系統,為社會提供便捷、統一的檔案目錄查閱服務。