紙質檔案在數字化過程中存在的問題及對策
隨著網絡和計算機技術的發(fā)展,紙質檔案數字化已經成為檔案信息化建設的重要內容。目前,我館保存著建校以來大量重要的專門檔案,對這部分檔案數字化處理顯得十分必要和迫切。由于館藏檔案的現狀及其受現有資金、技術、設備等因素的影響,我們對紙質檔案數字化處理采用了外包的形式,從而達到高效、快捷、共享檔案信息的目的。
1 館藏檔案數字化的必要性
1.1 是由紙質檔案保管的現狀所決定的
陳舊檔案老化現象嚴重,現狀堪憂,由于年代久遠或保管條件不善等主客觀因素的影響,有些檔案正受到破壞,處于瀕危狀態(tài),紙張發(fā)黃、老化、變脆,字跡淡化散失、模糊消失等現象嚴重。因此,要加快對檔案實時保護和搶救,盡快實現絕大部分檔案的數字化處理。
1.2 是檔案管理現代化的必然趨勢,具有十分重要的現實意義
實現紙質檔案數字化,拓展了檔案的利用方式,提高了利用效率,使查檔變得更加方便快捷。
有利于檔案信息資源共享,快速滿足社會各方面對檔案利用的需求。節(jié)省了檔案庫房存儲空間,能更好的對檔案實行保護和利用。
2 館藏檔案數字化外包原因
2.1 是由館藏檔案的數量和檔案館人力所決定的
我館保存著建校初(1957年)到現在的不同時期數量龐大的各類檔案。現今,教學類、科研類、黨群類、行政類、照片類、基建類、外事類案卷就有20000多卷,8000多件。對數量如此龐大的紙質檔案數字化,僅僅依靠檔案館(我館僅有5人編制,其中三人是在職培訓教育的)的幾個人是難以實現的。
2.2 是由檔案館現有的技術設備、資金等條件所決定的
檔案數字化缺乏堅實的物質基礎和先進的掃描技術設備,基礎設施薄弱,僅靠現有的資金、技術、設備遠遠不能夠滿足數字化建設的要求。
2.3 專業(yè)公司擁有實踐經驗和及先進的軟硬件設備
檔案數字化對現代信息數字化處理技術人員需求既迫切又巨大。僅靠檔案館自身難以完成這個需求,專業(yè)公司擁有實力雄厚的專業(yè)化人才和先進的軟硬件設備,專業(yè)人員憑借豐富的數字化經驗和技術,能夠大大提高數字化的質量,加快檔案數字化的進程。
3 我館檔案數字化工作業(yè)務外包情況
隨著時間的推移,紙質檔案受到損壞的程度日益加深,對我館紙質檔案進行數字化處理已迫在眉睫。由于檔案業(yè)務多、數字化任務重,專業(yè)人員缺乏,檔案數字化工作要依靠自己的力量來完成,效率會十分低下。因此,最好的辦法是實行外包,同社會上有實力的數字化公司合作,共同完成紙質檔案數字化的處理工作。2004年我館響應高校檔案數字化的要求,為了加快檔案資源信息化建設的步伐,購買了世紀科怡檔案管理軟件,開發(fā)并建立了自己的電子檔案管理數據庫,由我館工作人員對歷年館藏紙質檔案(教學類、文書類等十一個種類)進行了案卷級和文件級的著錄,截止到檔案數字化工作進行之前,已經完成了近10萬條案卷和卷內目錄的著錄工作,為檔案數字化工作初步奠定了基礎。2013年我館與數字化公司簽訂了外包合同,對重要的、利用率高的館藏檔案(文書類、照片類、外事類、科研類、教學類)進行了數字化掃描、掛庫工作,共完成檔案數字化近100萬頁。業(yè)務外包總體情況良好,但同時也產生了若干問題。
4 檔案數字化建設中出現的問題
4.1 案卷拆裝不規(guī)范,損害了檔案原件
掃描人員在裝訂案卷的過程中,造成了案卷的混亂。如裝訂內容前后順序顛倒,卷內目錄丟失,原件紙張受到不同程度的破損原件字跡受到破損。由于穿針引線眼過粗,裝訂線訂掉了半個字,有的直接就把字訂沒了,對原本需要搶救的檔案原件造成了二次傷害。
4.2 掃描內容標準不一,變動較大,檔案館內部意見不一
在紙質檔案數字化過程中,制定標準的數字化制度顯得尤為重要,因為它是數字化的質量基礎。目前,按照國家紙質檔案數字化標準?紙質檔案數字化技術規(guī)范?進行的數字化加工。由于缺乏各類檔案具體詳細的數字化標準,各館在數字化過程中經常出現具體掃什么,到底掃不掃的無章可循的情況,針對內容標準問題,館內各抒己見,難以統(tǒng)一。于是在掃描實踐中摸索經驗,就會出現掃描內容經常變動、前后不一的現象。如有人認為科研檔案的論文不用掃描,理由是這個在中國知網的查新站都能搜索到,個人手中也有備份,館藏保留有紙質版的,即使不掃利用時也不會出現無處可尋的情況。話雖如此,但也有人認為應該掃描,根據數字化標準的價值性原則:“屬于歸檔范圍且應永久或長期保持的、社會利用價值高的檔案可列入數字化加工的范圍。”如果屬于同一案卷內容,只掃描其它的,而不掃論文,數字化后的案卷就失去了完整性,也就失去了數字檔案的保管價值。
4.3 掃描的檔案圖像不完整、不清晰。
4.3.1漏掃、重復掃問題 主要表現在:漏掃檔案原件信息,有的只掃了半個檔案頁面;有的遮字壓字,內容沒有全面掃描出來,只好重新掃描。
4.3.2掃描的檔案頁面圖像不清晰,如有的頁面四周黑邊、黑點,有的頁面偏斜
4.4 目錄數據庫與全文掃描數據庫掛接速度慢,掛接內容不完整,不規(guī)范
4.4.1全文數據漏掛、錯掛的問題 主要表現在:掛接不完整,漏掛了檔案文件信息。由于數據庫案卷和卷內目錄較多,掛起來比較繁瑣,同一案卷里只掛了前邊的卷內目錄,而漏掉了后邊和和中間的,掛上了常用的,漏掉了重要的。
4.4.2有張冠李戴、掛接不對稱的錯掛問題 掃描人員為了追求掛庫速度而忽視了目錄內容,如將不屬于該目錄的原文掛了上去,而將屬于它的原文掛在了別的目錄上。
4.4.3全文掛接速度慢 表現在:掃描的圖像文件與目錄數據庫中該文件的檔號必須一致,建立起一一對應的關系才能實現全文掛接,但由于我館的檔案管理軟件版本滯后,不能快速地批量掛接,特別是文件級的檔號,為了保證質量,掛接只能一條條地進行,所以全文掛接工作進行的緩慢。
4.5 檔案信息著錄不準確、不完整、重復錄入現象嚴重
在檔案管理軟件系統(tǒng)中,經常有著錄信息不準確、不完整的情況,表現在
4.5.1文字錄入錯誤,別字較多 如將“王宏”錄成“王紅”;只錄大標題,不錄小標題,如會議性檔案材料只錄了“會議記錄”四個字,而忽略了副標題關于主要內容的錄入;著錄內容和原始檔案信息不對稱或不銜接。
4.5.2同一檔案信息錄入兩次 如有的檔案信息內容是相同的,錄入者在后邊加個字符就再次將同樣的檔案信息錄進去了,在檢索時就會出現檔號不同,內容相同的檔案信息。
4.5.3檔號錄入錯誤、不完全、不一致 由于錄入者粗心大意或片面追求著錄速度,著錄中漏掉了檔案的實體分類號、歸檔年代、保管期限和錄入時間。
4.6 數字化檔案的安全性問題
數字化信息的安全保密問題是檔案工作的重要內容,紙質檔案數字化的各個環(huán)節(jié)(掃描、著錄、圖像處理、數據掛接等)及數字檔案的管理與利用過程中,都存在檔案安全及檔案泄密的問題。如數字化工程中的漏掃、錯掃,漏掛、錯掛,圖像處理不當造成的檔案失真;數字化加工參與人員訪問權限設定的不嚴造成的泄密;對接互聯網由于病毒侵染、黑客攻擊造成的數據被破壞、被篡改、被轉移;備份不及時造成的數據丟失等。
4.7 數字化檔案利用不暢通問題
由于我們購買的科怡檔案管理軟件版本較低,數據兼容能力和長期存取能力較差,已經遠遠不能滿足數字化建設的需求,隨著著錄條目和全文數據的不斷增加,數據庫利用時經常出現緩慢運作的情況。
我館所用的服務器設備陳舊,運轉能力下降,利用中經常突然斷網、網絡不通暢,這使得數字檔案利用效率明顯降低。
4.8 數字化檔案利用中的法律效用問題
目前,雖然數字化檔案具有節(jié)省空間,存儲量大、利用快捷、方便的優(yōu)越性,但由于它不具有檔案的直接來源特征和法律憑證效應,不能完全行使紙質檔案的功用與價值,因而國家對其法律地位尚未確定之前,數字化檔案在一定程度上也不能稱為真正意義上的檔案,不是檔案,就沒有法律效用,所以在作為法律憑證作用時必須是紙質檔案原件。
5 解決數字化過程中存在問題的策略
5.1 制定適合本單位檔案數字化的標準
5.1.1內容標準 數字化掃描標準先行,檔案數字化標準是數字化建設的規(guī)范和有效保障,是穩(wěn)步推進數字化掃描的依據。而我國紙質檔案數字化標準遠遠不能滿足當前檔案數字化建設的實際需求。所以在遵循國家紙質檔案數字化標準的前提下,結合本館實際制定了適合本單位數字化的內容標準,以確保館藏檔案數字的質量和效率,主要體現在標準原則上:1. 價值性原則,對具有永久或長期保存價值的、利用率高的教學類、文書類(黨群類、行政類)、科研類進行了數字化掃描工作;2. 重點掃描的原則,對學校建設和發(fā)展有重大參考和備用價值的珍貴檔案進行了重點掃描,如“九五” “十五”期間內蒙古大學“211工程”前三期的國家重點學科建設項目材料、審計報告、評估報告、驗收報告等的數字化工作。3. 搶救性原則,受保管條件、保存時間等多重因素的影響,我校建校初到80年代末的陳舊檔案出現了紙質變脆、發(fā)黃;字跡散失等不同程度的破損情況,給檔案保管和利用帶來了諸多不便,因而我們盡快對這部分瀕危檔案進行了數字化處理工作,確保了檔案的完整性和長期有效的利用。
5.1.2掃描的質量標準 規(guī)范化管理,嚴格檢查,針對掃描中出現的圖像模糊、失真、偏斜、不完整、多掃、漏掃等不符合質量要求的情況,檔案管理人員要責成數字化工作人員重新進行圖像掃描、糾露、糾偏、糾錯、拼接、去污處理,以保證掃描的圖像文件真實行、完整性、及原件的一致性。
5.1.3掛接全文標準 全文掛接時要堅持準確、齊全完整、可利用性的原則。掛接全文工作是數字化工作的關鍵環(huán)節(jié),是實現數據利用的前提和基礎。因而在掛接時必須保證圖形文件的質量,確保掛接的圖像原文與目標數據庫檔號目錄的一致性,建立一一對應的關系。檔案員要監(jiān)管到位,一對一認真、全面、系統(tǒng)的驗收掛接全文的質量,及時排查漏掛、多掛、錯掛、不完整掛的隱患,并協調掛接人員進行重掛、補掛工作,以保證掛接檔案數據的準確、完整。
5.1.4案卷裝訂標準 案卷裝訂要遵循不破壞檔案原貌為原則。裝訂是檔案數字化的重要環(huán)節(jié),案卷裝訂的質量直接影響到紙質檔案的有效保管、檢索和利用。所以掃描工作完成后,拆除裝訂物的檔案恢復裝訂時,要做到安全、準確、無遺漏、無破損,不能反復拆裝、多次拆裝,能不拆的最好不要拆,否則檔案原貌必定受到損傷。
5.1.5加強檔案著錄工作的規(guī)范化管理 著錄工作是數字化掃描工作全文掛接的前提和基礎,只有建立科學的著錄標準,規(guī)范化管理,才能有效推動檔案的數字化建設。因而我館根據實際情況,對著錄人員制定了檔案數據著錄工作標準。在歸檔年代、檔案號、題名、保管期限、錄入時間等方面都做了嚴格、細致的著錄規(guī)定,使著錄工作有章可循。同時,加強了著錄者的業(yè)務培訓,使他們熟悉軟件并熟練掌握相關的操作技能,提高了錄入工作的業(yè)務能力,保證了數據錄入的準確性、完整性。
5.2 要加強和重視數字化檔案的安全性
由于受互聯網和業(yè)務外包工作的影響,檔案數字化面臨著安全保密、原貌失真的風險,因而我們應該樹立風險意識,采取相關措施做好安全防控工作。1.建立風險管理機制,將風險思想貫穿檔案數字化建設的各個環(huán)節(jié),確保檔案原件和數字化信息的安全。2.加強數字化人員的安全保密教育工作,與數字化公司簽訂保密協議,明確安全責任。3.所有安裝檔案管理軟件的計算機要斷開互聯網,內部組建局域網,切斷病毒、黑客的侵襲來源。4.做好掃描數據的備份工作,選用技術成熟和質量可靠的存儲介質和設備,做好數據遷移和備份工作。目前的備份方式有離線備份方式,如可以采用移動硬盤異地存儲、雙套制保管模式(在線電子存儲方式、紙質庫存方式)。總之要強化數字化各個環(huán)節(jié)的安全意識,保證各種檔案數據的安全性。
5.3 實現檔案管理軟件和服務器的更新換代
我館的檔案管理軟件和服務器版本比較陳舊,在性能和實用方面存在很多問題,因而經常出現檔案數據檢索、利用不暢的問題,這嚴重影響了數字化檔案的利用效果。目前,要解決此問題,必須實現檔案管理軟件和服務器的更新換代,以提高檔案查找的工作效率。
檔案數字化建設工作是一個系統(tǒng)工程,也是一個長期復雜的任務,在數字化的實際操作中會出現諸多問題,我們應該不斷從實踐中吸取經驗教訓,加強全方位的管理,促進檔案信息化建設的安全化、規(guī)范化。現今,我館紙質檔案數字化工作取得了階段性的成果,這使我校檔案數字化管理和快速利用檢索變成了現實。