搜索引擎與網絡檔案計算機檢索系統在網絡檔案信息檢索中的關系與作用
搜索引擎與網絡檔案計算機檢索系統在網絡檔案信息檢索中的關系與作用可以歸納為如下一個表格。通過這一表格,可以進一步明確筆者關于網絡檔案信息檢索與傳統檔案信息檢索有所不同的論點。
關于這兩種網絡檔案信息檢索工具,可以做個比喻:網絡檔案信息利用者是一個尋寶人,檔案信息(包括目錄信息和全文信息)則是寶藏,寶藏藏在網絡這個信息海洋之中的一座座小島上,小島即某個網站或網頁。找這個寶藏要分兩步走,首先按照航海圖找到某個小島,其次是按照藏寶圖在島上找到真正的寶藏。搜索引擎是航海圖,網絡檔案計算機檢索系統是藏寶圖。其間有可能還需要一張小島的地圖,即站內搜索引擎。
通過上述表格和比喻,闡釋了搜索引擎與網絡檔案計算機檢索系統在網絡檔案信息檢索中的關系與作用,從而明確了網絡檔案信息檢索的內涵。這樣,在網絡檔案信息檢索工具的研究和開發方向方面,應注意以下問題:
首先,要重點研究和解決的是藏寶圖的編制,即編制檔案計算機檢索系統。在網絡檔案信息發布過程中,應當確立網絡檔案計算機檢索系統的核心地位。當前階段,確立網絡檔案計算機檢索系統核心地位的表現,在于檔案網站要具備一個真正能揭示本檔案機構館藏信息的、完善實用的、專業化的網絡檔案計算機檢索系統。這樣的系統宛如網絡中的一個檔案專家, “他”極其了解本館館藏,并可與利用者對話,有問有答,一步一步地滿足利用者的需求。如愛爾蘭國家檔案館的在線數據庫,提供了包括總理辦公室檔案數據庫、農業部檔案數據庫、外交部檔案數據庫、財政部檔案數據庫等15個政府檔案數據庫,還有婦女歷史數據庫、1791-1868年愛爾蘭一澳大利亞間移民數據庫等3個特色檔案數據庫,有專門的檢索系統對這些數據庫進行檢索。再如加拿大國家檔案館網站提供了在線檔案信息檢索系統online Research Tools:ARCHIVIANET。我國許多檔案網站已經提供了此類網絡檔案信息檢索系統,如上海檔案信息網提供的“檔案查詢”等,但目前檢索系統的數量與質量還不盡如人意,如四川檔案館館藏目錄,只提供了部分清朝檔案的目錄列表。
其次,在檔案網站上,要有意識地提供兩種檢索工具:網絡檔案計算機檢索系統與站內搜索引擎。目前國內有一些檔案網站提供了網絡檔案計算機檢索系統,但提供站內搜索引擎的還比較少。這一方面是由于網站信息還不十分豐富,另一方面是缺乏這方面的意識。站內搜索引擎主要用于檢索本網站內以靜態頁面形式發布的檔案信息。當一個檔案網站內的信息十分豐富,就必須提供一個完善的站內搜索引擎。國外比較完善的檔案網站都提供了這兩種檢索工具。以美國國家檔案與文件署網站為例,首先它提供了網絡檔案信息檢索系統ARC,另外網站內的在線展廳、數字教室等欄目內以主題形式發布了大量的一次檔案信息,這些信息就只有依靠站內搜索引擎來進行檢索了。例如,有利用者關心該網站內發布的有關泰坦尼克號的檔案信息,利用站內搜索引擎輸入“Titanic”立即會得到該站內所有相關的信息,包括許多一次信息,共26條。這些信息按相似度進行了排序,利用者可以迅速找到已發布的泰坦尼克號中央大廳的照片、撞冰山事故當日海軍日志等檔案材料,還可以在此基礎上進一步縮小范圍,直至找到所關心的內容。在美國馬里蘭州檔案館的網站,也提供了針對不同內容范圍的多種檢索,由于其信息包括館藏檔案信息全部采用靜態頁面形式發布,這些檢索全部以搜索引擎方式實現,而無需提供網絡計算機檢索系統。美國國家檔案與文件署網站的檢索系統從NAIL向ARC轉變,就有從數據庫向在線目錄過渡的趨勢。這種方式值得國內檔案界給予關注,尤其是想要了解和使用EAD標準的檔案機構,就必須摒棄傳統的數據庫方法,而采用靜態頁面發布形式,然后利用公共搜索引擎或站內搜索引擎對信息進行檢索。
再次,要正確對待搜索引擎的研究和使用。目前檔案界研究檢索的文章中,許多討論的不是真正意義上的專業化的網絡檔案信息的檢索,而是如何利用搜索引擎發現檔案信息,即討論航海圖的編制。事實上,對于搜索引擎的建立與使用是一項專門的技術。網絡環境的出現,使得信息檢索研究的對象和范圍不斷擴大,研究隊伍也有所擴展,尤為引人注意的是眾多的信息公司加入到研究開發信息檢索系統的行列。1994年因特網引入我國后,信息檢索研究掀起新的高潮。網絡信息資源的收集、檢索、利用方法的研究、基于網絡的信息挖掘技術、網絡信息搜索引擎的建構及其檢索效率的比較研究,越來越受到關注。特別是圖書館界,在網絡環境出現以后,其職能有所拓展,從傳統的單一的文獻信息服務向以信息和知識收集、檢索、傳播為主的多功能綜合性的信息服務轉變。他們試圖對網絡信息資源加以組織,為各行各業提供更加有效的檢索工具和更加有序的信息。也就是說圖書館界試圖為網絡用戶編制更精確的航海圖。一名圖書館工作者的兩篇文章:《快速地查找和獲取因特網上的國外重要檔案信息資源的途徑和方法》和《如何檢索因特網上的國外檔案信息資源》就提供了使用搜索引擎發現的網絡檔案信息。它相當于一份航海圖,可以讓利用者在信息海洋中找到無數與檔案相關的島嶼。所以對于搜索引擎,檔案界應該退出研究其實現技術,而是將各種信息公司和圖書館界的研究成果拿來為我所用,了解和應用這項技術。
最后,檔案網站要有意識地加入到網絡服務商提供的各類搜索引擎中去,例如著名的雅虎(Yahoo)等,以此擴大服務范圍。對于網絡檔案信息來說,檔案機構是信息的生成者,雅虎等僅是信息利用的助手。但是雅虎等雖不直接為網絡用戶提供信息內容,卻是一個十分有效的中轉站。網絡用戶需要信息,都到這里來找。只要鍵入自己感興趣的關鍵詞,就會得到有關網址,很方便地轉到自己感興趣的網站上。檔案信息要為更多的利用者服務,實現良好的效益,就必須積極加入到這些搜索引擎中。目前在中文雅虎上就可以查到北京大學檔案館、南京大學檔案館、中國人民大學檔案學院、山東檔案信息網、四川省檔案館等網站,在一定程度上擴大了這些網站的影響。