電子文件元數(shù)據(jù)分類與方案設(shè)計對策研究
中國檔案 田雷
北京市檔案局于2014年承擔了國家檔案局科技項目“電子文件元數(shù)據(jù)分類與方案設(shè)計對策研究”課題,形成了電子文件和電子檔案元數(shù)據(jù)兩分法(即對象元數(shù)據(jù)和事件元數(shù)據(jù))的管理理論和《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》等重要研究成果。該課題于2015年12月通過了國家檔案局鑒定委員會的評審。鑒定委員會認為,該課題的科研成果具有較高理論價值,對北京市電子文件和電子檔案元數(shù)據(jù)管理以及數(shù)字檔案館建設(shè)實踐具有指導(dǎo)作用,對其他地方相關(guān)工作的開展也有參考借鑒意義,其科研成果具有較強的可操作性,對推進電子文件和電子檔案元數(shù)據(jù)相關(guān)標準規(guī)范的制定和實施具有重要參考價值。該課題榮獲2016年度國家檔案局優(yōu)秀科技成果二等獎。
研究內(nèi)容
根據(jù)調(diào)研已有的標準和學(xué)術(shù)研究項目來看,對于電子文件和電子檔案元數(shù)據(jù)的分類研究表現(xiàn)出以下3個特點:一是概念涉及內(nèi)容范圍廣;二是電子文件和電子檔案元數(shù)據(jù)的種類和層級繁多;三是電子文件和電子檔案元數(shù)據(jù)隨著保管和利用而不斷增加。可以說,現(xiàn)有成果對于電子檔案真實性、憑證性保障及長期保存有效利用并不都是最佳選擇。設(shè)計電子文件和電子檔案元數(shù)據(jù)的最佳分類方案是關(guān)于電子文件和電子檔案元數(shù)據(jù)研究的重點和關(guān)鍵。北京市檔案局根據(jù)北京市電子文件和電子檔案管理的基本現(xiàn)狀,專題攻關(guān)電子文件和電子檔案的元數(shù)據(jù)分類方法,以及各類型電子文件和電子檔案的元數(shù)據(jù)項最優(yōu)集合,破解當前元數(shù)據(jù)分類不夠清晰、項目繁雜難以落地執(zhí)行的難題。
該課題設(shè)計并構(gòu)建了“對象元數(shù)據(jù)”和“事件元數(shù)據(jù)”兩分法,探索設(shè)計了當前常見的文本類、圖像類、影像類、聲音類電子文件和電子檔案的對象元數(shù)據(jù)項和事件元數(shù)據(jù)項,形成了重要的科研成果《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》。方案統(tǒng)一了國內(nèi)電子文件和電子檔案元數(shù)據(jù)在分類方法和管理模式上的爭議,填補了圖像類、影像類和聲音類3類電子文件和電子檔案元數(shù)據(jù)方案的空白,優(yōu)化了《文書類電子文件元數(shù)據(jù)方案》(DA/T 46)在實踐中存在執(zhí)行不便的元數(shù)據(jù)項選擇。
1.元數(shù)據(jù)兩分法基礎(chǔ)理論研究
元數(shù)據(jù)是電子文件和電子檔案管理工作重心之一,這是毋庸置疑的。目前,國內(nèi)檔案界對元數(shù)據(jù)的概念邊界、分類思路、管理方法等方面的認知和理論并不統(tǒng)一,各地區(qū)的具體實踐也各有特點。如何科學(xué)設(shè)計和解釋電子文件和電子檔案元數(shù)據(jù)的基礎(chǔ)理論,逐步形成統(tǒng)一的理論體系和一致的認知,進而快速推動電子文件和電子檔案管理工作又好又快發(fā)展,是我國檔案界當前一項重要的工作。
在課題組組長陶水龍發(fā)表的《電子檔案元數(shù)據(jù)分開管理研究》論文的指導(dǎo)下,課題明確了對象元數(shù)據(jù)和事件元數(shù)據(jù)的兩分法,界定了它們的概念與主要作用。
(1)對象元數(shù)據(jù)
對象元數(shù)據(jù)是指電子文件形成過程中產(chǎn)生的,由信息系統(tǒng)自動生成且不可人工干預(yù)的,直接關(guān)系電子文件和電子檔案憑證性的元數(shù)據(jù)項,對象元數(shù)據(jù)應(yīng)封裝在電子檔案身份證中。
可以看出,①對象元數(shù)據(jù)的基本特征:是電子文件形成過程中產(chǎn)生的,由信息系統(tǒng)自動生成且不可人工干預(yù)的元數(shù)據(jù)項;②對象元數(shù)據(jù)的核心功用:直接關(guān)系電子文件和電子檔案的憑證價值和真實性,在這里談到的憑證價值和真實性主要聚焦在文件的依法合規(guī)問題;③對象元數(shù)據(jù)的管理原則:封裝在電子檔案身份證中,與電子檔案身份證一體化管理。
(2)事件元數(shù)據(jù)
事件元數(shù)據(jù)是指電子文件歸檔和電子檔案管理過程中產(chǎn)生的,對電子檔案溯源起重要作用的,由信息系統(tǒng)自動生成或人工錄入的元數(shù)據(jù)項,事件元數(shù)據(jù)以結(jié)構(gòu)化的數(shù)據(jù)形式存儲在數(shù)據(jù)庫中,并通過電子檔案目錄與電子檔案的內(nèi)容信息和電子檔案身份證進行有效關(guān)聯(lián)。
可以看出,①事件元數(shù)據(jù)的基本特征:是電子文件歸檔和電子檔案管理過程中產(chǎn)生的,由信息系統(tǒng)自動生成或人工錄入的元數(shù)據(jù)項,事件元數(shù)據(jù)的產(chǎn)生階段和允許由人工干預(yù)是其與對象元數(shù)據(jù)最主要的特征區(qū)別;②事件元數(shù)據(jù)的核心功用:對電子檔案溯源起重要作用,這就意味著事件元數(shù)據(jù)的選擇不應(yīng)聚焦那些對電子文件和電子檔案起到憑證性保護作用的項目;③事件元數(shù)據(jù)的管理原則:以結(jié)構(gòu)化的數(shù)據(jù)形式存儲在數(shù)據(jù)庫中,并通過電子檔案目錄與電子檔案的內(nèi)容信息和電子檔案身份證進行有效關(guān)聯(lián),為了避免電子檔案身份證在元數(shù)據(jù)不斷增加的管理過程中重復(fù)封裝,事件元數(shù)據(jù)采取在數(shù)據(jù)庫中單獨管理并與電子文件和電子檔案內(nèi)容信息掛接的管理方式,不再做封裝一體化管理。
2.元數(shù)據(jù)分類方案設(shè)計
(1)分類方案支持更多的數(shù)據(jù)類型
《文書類電子文件元數(shù)據(jù)方案》(DA/T 46)僅僅局限于文書類電子文件的元數(shù)據(jù)。鑒于目前我國黨政機關(guān)公文處理的特點,能夠通過信息系統(tǒng)正式簽發(fā)文書類電子文件的單位并不多,因而當前產(chǎn)生的真正意義的電子文件和電子檔案可能更多地集中在圖像、影像和聲音等部分,DA/T 46并未覆蓋這三部分的電子文件和電子檔案,所以各地區(qū)在實踐中往往使用內(nèi)部暫定的元數(shù)據(jù)方案執(zhí)行。
課題明確了電子文件和電子檔案元數(shù)據(jù)分類方案的邊界,形成了重要的科研成果《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》。元數(shù)據(jù)分類方案分別按照文本類、圖像類、影像類和聲音類4大常見類型的電子文件和電子檔案進行了元數(shù)據(jù)的方案設(shè)計。
(2)分類方案的設(shè)計更加易于落地
《文書類電子文件元數(shù)據(jù)方案》(DA/T 46)中羅列了88項文書類電子文件所需要留存的元數(shù)據(jù)項,涵蓋了電子文件形成階段、電子文件歸檔階段、電子檔案在檔案室的管理階段、電子檔案移交接收階段和電子檔案在檔案館的管理階段等電子文件和電子檔案全生命周期的5個主要階段。但在國內(nèi)各地區(qū)的實踐過程中,普遍反饋DA/T 46的執(zhí)行存在一些不便之處,有些是因為各黨政機關(guān)和國有企事業(yè)單位信息系統(tǒng)先于該標準建設(shè)完成,如嚴格按標準執(zhí)行會出現(xiàn)地區(qū)性的信息系統(tǒng)二次開發(fā)行為,總體成本投入巨大,檔案行政管理部門難以硬性推動;還有一些是因為在深入研究DA/T 46之后,結(jié)合本地區(qū)、本單位、本系統(tǒng)、本行業(yè)實際,認為其中的某些必選和可選項目并不會實際產(chǎn)生,或并沒有保存的必要。
基于元數(shù)據(jù)的兩分法理論,《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》在設(shè)計過程中充分考慮可操作性、便于執(zhí)行性和科學(xué)合理性,力爭使其具備更好的易用性。其中,文本類對象元數(shù)據(jù)共計22項、圖像類對象元數(shù)據(jù)共計23項、影像類對象元數(shù)據(jù)共計19項、聲音類對象元數(shù)據(jù)共計7項;文本類、圖像類、影像類、聲音類事件元數(shù)據(jù)共計14項;必選的元數(shù)據(jù)項總計約40項、可選的元數(shù)據(jù)項總計約39項,新定義了一般為可選、在特定條件下為必選的元數(shù)據(jù)項總計約7項。
在課題研究過程中,注重聯(lián)系實際,將《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》納入北京數(shù)字檔案館(北京電子文件中心)項目建設(shè)體系進行驗證,并作為項目建設(shè)所需遵循的核心制度使用,為項目建設(shè)提供設(shè)計藍圖。
主要創(chuàng)新
1.理論創(chuàng)新
該課題首創(chuàng)性地提出了電子文件和電子檔案元數(shù)據(jù)按兩分法(即對象元數(shù)據(jù)、事件元數(shù)據(jù))進行分開管理的基礎(chǔ)理論,結(jié)合電子文件和電子檔案管理的特點、聯(lián)系北京數(shù)字檔案館(北京電子文件中心)項目建設(shè)實際,提出了對象元數(shù)據(jù)和事件元數(shù)據(jù)的核心功用和管理原則。
2.全面性創(chuàng)新
該課題的研究成果《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》充分考慮電子文件和電子檔案的形成和管理現(xiàn)狀,對文本類、圖像類、影像類和聲音類4類最常見的電子文件和電子檔案進行了深入分析,結(jié)合各類型電子文件和電子檔案的形成環(huán)境、技術(shù)特點,分別梳理了特點鮮明、專業(yè)對口的對象元數(shù)據(jù)和事件元數(shù)據(jù)項,使《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》覆蓋了目前黨政機關(guān)和國有企事業(yè)單位普遍形成的主要電子文件和電子檔案的類型,方案的指導(dǎo)性更強、參考意義更大。
3.實踐創(chuàng)新
該課題根據(jù)對北京市和各區(qū)檔案移交單位、市和區(qū)檔案館現(xiàn)行信息系統(tǒng)的調(diào)研結(jié)果,充分考慮《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》的可操作性、便于執(zhí)行性和科學(xué)合理性,在保障元數(shù)據(jù)項可充分表達對象元數(shù)據(jù)、事件元數(shù)據(jù)含義時,對元數(shù)據(jù)項進行了合理優(yōu)化,最終選定的項目既滿足現(xiàn)行信息系統(tǒng)的基本現(xiàn)狀,又兼顧未來一段時期的發(fā)展需要,降低了各單位信息系統(tǒng)的改造量,使《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》在實際工作中更易于落地,也更易于被文件和檔案管理人員及技術(shù)人員所接受。
應(yīng)用前景
該課題通過調(diào)研國內(nèi)外電子文件和電子檔案元數(shù)據(jù)的研究和使用情況,分析并提出科學(xué)的電子文件和電子檔案元數(shù)據(jù)分類方法及元數(shù)據(jù)項選取標準,并將研究成果《北京市電子文件和電子檔案元數(shù)據(jù)分類方案》運用到北京市電子文件和電子檔案管理工作以及北京數(shù)字檔案館(北京電子文件中心)建設(shè)項目中,為全市各級電子文件形成單位和國家綜合檔案館提供電子文件和電子檔案元數(shù)據(jù)管理的規(guī)范化支撐。
課題研究成果有望引領(lǐng)北京市電子文件和電子檔案元數(shù)據(jù)管理工作邁入科學(xué)化、規(guī)范化的管理階段,并引導(dǎo)北京市電子文件管理聯(lián)席會議、各級檔案移交單位和各級國家綜合檔案館在政策制定、發(fā)展規(guī)劃、信息系統(tǒng)建設(shè)等方面逐步進入一個良性的可持續(xù)發(fā)展時期。課題研究成果對北京市的實際工作具有極強的指導(dǎo)意義,同時對其他地區(qū)開展電子文件和電子檔案元數(shù)據(jù)管理工作具有參考價值,在國內(nèi)具有較大的普遍適應(yīng)性和借鑒意義。
作者單位:北京2022年冬奧會和冬殘奧會組織委員會、北京市檔案局