網絡檔案信息檢索與傳統檔案信息檢索
檔案信息檢索是對檔案及其蘊含的信息加以存儲,并根據某種檔案特征信息,在特定的檔案信息集合中查找、識別、選擇、獲取相關的數據、事實或檔案文獻。網絡檔案信息檢索同樣是對檔案及其蘊含的信息加以存儲,編制檢索工具,建立檢索系統,并按一定的方法通過網絡查找和利用相關的檔案信息。從理論角度看,網絡檔案信息檢索是采用一定的手段,依據特定標準,對檔案文獻進行著錄標引,得到各種標識;同時,又依據同樣的標準對利用者提問進行標引,獲得提問標識,然后將文獻標識和提問標識相比較,尋找相匹配的檔案信息;而后將這些處于中心服務器中的、匹配的檔案信息,通過網絡系統發送到查詢利用者的計算機系統中。從檢索實質上講,網絡檔案信息檢索的發展是基于比較成熟的檔案信息檢索理論之上的,這是其迅速發展的基礎。但是,由于網絡環境不同于傳統檔案利用環境的特殊性,網絡檔案信息檢索相對于傳統檔案信息檢索有了一些不同。
傳統檔案工作中的檔案信息檢索的范圍,是特定的某一個或某幾個檔案機構所存的檔案及檔案信息,這種檢索是在特定的、有序的檔案信息集合中進行的。而網絡環境下,檔案信息檢索的范圍可能是針對某一個或某幾個有限的檔案機構所存儲的檔案信息,也有可能是針對網絡內全部檔案機構存儲的檔案信息,檢索范圍隨著網絡的普及而擴大。這樣,網絡檔案信息檢索可以是范圍確定的檢索,也有可能是對不特定的范圍進行檢索。這種檢索有可能是在有序的檔案信息集合內進行的,也有可能是針對網絡中全部或部分無序的信息集合進行的,還有可能先從無序的信息集合再到有序的檔案信息集合。
傳統的檔案信息檢索,是指直接利用檔案機構提供的檢索工具。在網絡環境下,檔案信息檢索首先要在網絡中確定所需信息所在的檔案機構的網站,然后才能利用網站上提供的檢索工具。這樣,網絡檔案信息檢索較之傳統檔案信息檢索增加了一步,在網絡中查尋檔案信息基本上分兩步:第一步首先要在部分或全部無序、混亂的網絡信息中查找到利用者關心的檔案信息所在的網址,這一步也稱為對檔案信息資源進行定位。這種檢索通過各種搜索引擎(Search Engines)等網絡信息檢索工具(Networked Information Retrieval Tools)實現;第二步是針對特定檔案信息集合查找相關檔案信息,其實質是使用檔案機構提供的專業化檢索工具進行檔案信息檢索。檔案機構針對不同的發布方式提供不同的檢索工具。對以數據庫形式發布的檔案信息,相應提供網絡計算機檢索系統;對于以靜態頁面形式發布的檔案信息,檔案機構可以制作專門的站內搜索引擎,或同第一步一樣利用公共搜索引擎進行檢索。
由于這種變化,對“網絡檔案信息檢索”一詞的研究使用出現了混亂情況。一種情況是, “網絡檔案信息檢索”一詞用來指對網絡中檔案信息資源的搜索、定位,或稱其為對網絡中檔案信息資源的發現。其針對的對象是不特定的、處于無序狀態的網絡信息,檢索后返回的值是統一資源定位器,即相關網址。這些網址上或能提供網絡檔案計算機檢索系統,或者包括了以靜態頁面形式發布的各種檔案信息。另一種情況是, “網絡檔案信息檢索”一詞專指使用網絡檔案計算機檢索系統進行檢索,或稱之為使用在線檔案計算機檢索系統、檔案計算機檢索系統的網絡版進行檢索。其針對對象是存儲在數據庫中的檔案機構的館藏信息、事實數據等經過加工處理的專業化的有序信息,檢索后返回的值是檔案目錄信息、檔案材料的全文信息或相關的事實、數據等。這樣,網絡檔案信息檢索的內涵較之傳統檔案信息檢索有了擴展。在實際應用中,要實現有效的網絡檔案信息檢索,針對檢索步驟和發布方式不同,必須依賴二種檢索工具:搜索引擎和網絡檔案計算機檢索系統。