檔案信息前處理工作概述
檔案信息前處理, 是對檔案信息進行加工處理, 揭示檔案的內容特征和形式特征, 將檔案由原始的一次文獻轉化為二次文獻的過程。它是建立手工或自動化檔案信息檢索系統之前必要的數據準備過程, 包括檔案的著錄和標引兩方面內容。
一、檔案信息前處理工作的地位
檔案信息前處理是檔案信息檢索工作的初始部分。檔案信息檢索工作包括檔案信息的存儲與檢索兩大部分: (1 ) 檔案信息的存儲是通過各種方式將零散的檔案信息組織起來, 存儲到各種檢索工具或檢索系統中去, 包括檔案信息前處理、檢索工具的組織、檢索系統的建立等內容; (2 ) 檔案信息的檢索是通過各種檢索途徑和檢索手段將利用者所需要的檔案信息及時準確地查找出來提供利用。
由此可見, 檔案信息前處理是存儲檔案信息的首要步驟, 是整個檔案信息檢索工作的基礎。
檔案信息前處理是對檔案材料的另一種整理方式, 它與檔案實體整理不同, 是對檔案信息內容進行加工整理, 將有價值的檔案信息加以揭示, 提供檢索途徑以便利用。
二、檔案信息前處理工作的意義
(1 ) 是揭示與獲取檔案文獻中所含檔案信息的重要手段。著錄項目中所包含的檔案主題內容、成分、作者、保存價值、存放地點等信息, 能夠有效地揭示館藏。宣傳報道檔案信息資源, 使利用者不查原文即可對檔案材料有一個大概的了解, 以便有針對性地快速查到所需的檔案材料。
(2 ) 是建立檔案信息檢索系統的基礎和前提條件。無論是手工檢索系統還是計算機檢索系統, 在運行之前都要納入充足的經過加工的數據。檔案信息前處理的主要目的就是為檢索系統提供必要的數據, 如手工檢索系統中的各種檔案目錄就是由著錄項目組織而成的, 計算機檢索系統中數據庫的建立也必須依賴著錄項目的輸入, 所以著錄標引工作是實現檔案信息檢索必不可少的前提條件。
(3 ) 是決定檢索工具和檢索系統質量的重要因素。檔案信息前處理工作是檔案信息檢索工作的首要環節, 任何檢索工具和檢索系統要有效發揮存儲和檢索功能, 都須依賴于著錄事項的完備以及揭示檔案內容的深度和確切程度。前處理工作中的任何疏忽、錯誤和過分簡化、不恰當都會影響檢索工具和檢索系統的質量, 降低檢索效率。
(4 ) 為查找檔案材料提供途徑和依據。利用者通過查閱檢索工具, 辨別檢索標識可以準確找到自己所需要的檔案材料, 大大提高檢索速度, 節省翻閱原件的時間。
三、我國檔案信息前處理工作的現狀及問題
我國檔案部門的著錄標引工作開展得較晚, 缺乏足夠的經驗和必要的規定。各檔案館( 室) 各行其是, 各搞一套, 處于比較混亂狀態。然而, 近年來情況有了較大改觀, 隨著國家標準《檔案著錄規則》、《檔案分類標引規則》等的頒布實行, 全國通用的《中國檔案分類法》、《中國檔案主題詞表》的推廣使用, 檔案著錄與標引工作有了統一的標準, 檔案信息前處理工作有了相當的進展, 幾個較有條件的檔案館已建立了具有上萬條數據的數據庫, 如中央檔案館1992 年建成了具有40 萬條數據的檔案目錄數據庫, 是我國目前最大的中文檔案目錄數據庫, 檔案檢索工具的類型也開始多樣化。前處理工作的發展對檔案信息檢索工作起到了很大的推動作用, 但由于長期積累下來的檔案文獻數量十分浩繁, 而新的檔案不斷產生, 致使前處理工作量十分巨大, 其效率和質量都難以保證, 進度十分緩慢, 具體表現在以下方面:
(1 ) 檔案前處理工作的滯后現象十分嚴重。前處理工作本應超前或至少同步, 但由于館藏基數大, 檔案逐年增加, 出現“ 老賬未還, 新賬又欠” 的局面。據調查, 已開展著錄標引工作的檔案館和檔案室, 除個別館以外, 平均完成的著錄標引量僅占館藏檔案的極小部分, 使前處理工作呈現積重難返的現象, 著錄量難以趕上館藏檔案增長量。
(2 ) 我國檔案前處理工作效率很低, 許多檔案館( 室) 未派專人負責前處理工作, 而是由檔案整理人員臨時兼任。由于檔案工作人員不熟悉此項工作, 加之檔案內容繁雜, 著錄標引級別不易掌握, 增加了難度, 因此檔案著錄標引工作的效率普遍較低。
若按較高標準, 即每人每年著錄1 萬份文件( 約100 卷) 來計算, 僅館藏5 萬卷的檔案, 不考慮新接收的檔案, 就需50 人年才能完成著錄標引工作, 若考慮到檔案的增長量則需要更多的時間。對于館藏大得多的檔案館來說, 按目前的效率, 若不采取其他有效措施, 前處理工作永遠趕不上檔案增長速度。
(3 ) 質量沒有保證。由于缺乏一支穩定的、業務水平較高的著錄標引隊伍, 檔案信息前處理工作的質量難以保證。盡管已頒布了一系列有關標準, 但這些標準未得到具體的貫徹實行, 因此, 著錄內容和格式不統一, 標引一致度低, 誤標、漏標等現象較普遍。尤其是主題標引情況極為混亂, 有不少檔案機構以自編的詞表為依據進行標引, 未采用國家標準, 有的采用關鍵詞標引。這種不統一、不規范的狀況嚴重影響了檔案信息前處理工作的質量。
由于目前我國檔案信息前處理工作由檔案館、檔案室各自承擔, 而長期積壓下來的未經加工處理的檔案數量龐大, 光憑檔案機構本身的力量是難以根本解決上述問題的。因此, 有人提出化整為零的前處理工作方案, 即由文件作者、機關立卷人員、檔案室、檔案館幾方分頭承擔著錄標引工作。具體來說, 就是檔案館和檔案室分別負責處理本館( 室) 積存的檔案, 新產生的檔案由文件作者或立卷人員負責處理。文件作者一般能夠很好地把握文件主題, 可在撰稿結束時在文件上標上分類號或主題詞, 由立卷人員審定, 并將歸檔案卷進行著錄, 檔案室根據需要將著錄卡片組成檢索工具供本單位使用, 移交檔案時連同著錄卡片一并移交給檔案館。這樣, 檔案館( 室) 就能集中力量解決積壓檔案的前處理問題, 加快檔案信息前處理工作的進展, 為計算機檔案信息檢索提供充足的數據準備, 同時也可提高檔案著錄標引的質量,保證著錄標引的深度及其一致性, 提高檢索效率。
除此之外, 還有人提出利用計算機技術進行自動標引, 從而幾十倍地提高標引速度, 從根本上解決標引問題。目前, 我國檔案自動標引技術的研究已取得一定進展, 但仍處于試驗階段。