信息網絡環境下的檔案信息檢索
一、信息網絡環境下檔案信息檢索的特點
信息網絡環境下的檔案信息檢索與傳統的手工檢索和常規計算機檢索相比, 在檢索對象、檢索方式、檢索軟件、檢索服務類型、檢索效率等方面都有顯著差異。
(一) 檢索對象
傳統的檔案信息檢索對象只限于本部門、本系統所擁有的特定的信息資源, 而網絡信息檢索對象的范圍則廣泛得多, 所面對的是龐大的網上共享資源, 可檢索分布在網上各類數據庫的信息。從信息內容來看, 除科技類、社科類知識型信息外, 還包括廣告、文體、影視、游藝等商業類和娛樂型信息。從信息形式來看, 除文本信息外, 還包括各種多媒體信息。
(二) 檢索方式
常規計算機檔案信息檢索主要采用人- 機交互的文本檢索方式, 用戶界面單一, 實際檢索前需制訂周密的檢索策略, 編制檢索式, 輸入檢索命令, 然后才能在計算機文檔中進行查詢, 檢索結果一般僅為文獻題錄、文摘、數值等文本信息, 檢索速度較慢。網絡信息檢索采用超文本、超媒體檢索方式, 具有統一、友好的用戶界面, 不需編制檢索式, 采用自然語言檢索, 實行標題和內容的自動搜索, 檢索結果除文本信息外, 還包括音頻信息、視頻信息等非文本信息, 檢索速度快。
(三) 檢索軟件
普通的檔案信息檢索軟件一般為封閉式的獨家使用軟件, 各文檔檢索軟件不能通用, 用戶使用不便。而網絡信息檢索軟件是開放式的公用軟件, 只要是網上用戶, 均可使用各種檢索軟件,共享網上全部信息資源。
(四) 檢索服務
常規的計算機信息檢索服務方式包括追溯檢索、脫機和聯機定題服務、復錄、聯機打印、訂購原文等, 且收費較高, 服務范圍狹窄。而網上各類服務器除了提供一般的聯機檢索服務外, 還可提供瀏覽檢索、超文本檢索、自動內容搜索等多項服務, 這些服務器徹底向用戶開放, 任憑用戶瀏覽、選用, 其中一部分服務項目是免費的, 服務范圍十分廣泛。
(五) 檢索效率
在傳統的計算機檢索中, 用戶租用專門的信息通道, 信息傳輸較為順暢, 但由于一般的計算機檢索系統擁有的數據庫數量有限, 信息來源狹窄, 信息資源共享程度低, 使得檢全率較低。而在信息網絡中, 用戶使用的是公用的信息通道, 由于網上用戶眾多, 傳輸的信息量巨大, 信息通道易于堵塞, 對檢索速度有所影響, 但網上信息來源十分廣泛, 用戶可在全球范圍內進行信息交流, 檢索相關信息, 共享信息資源, 檢全率自然就高。此外, 網絡信息檢索大多采用自然語言, 不需像傳統的計算機檢索那樣編制檢索式, 對用戶知識水平要求較低, 用戶不必知道所需信息具體存儲在哪個文檔上, 也不必選擇檢索標識, 就可用自己所熟悉的語言直接在計算機終端上查詢所需信息, 避免了將自然語言轉換成檢索標識以及構造檢索式時可能出現的種種誤差, 提高了檢準率, 檢索的方便性也大大增加。
由此可見, 隨著信息傳輸速度與網絡功能的進一步提高、網絡用戶的增多, 網絡信息檢索將逐步取代傳統的手工檢索和常規計算機檢索, 占據信息檢索的主導地位。
二、網絡信息檢索工具
在信息網絡環境下, 信息組織與檢索方式有了很大改變, 檢索工具的運行環境與前迥異, 原有的信息檢索工具已不能適應新的需要, 各種專門用于網絡環境的檢索工具應運而生。網絡信息檢索工具目前主要有下面幾種:
1 . 交互式檢索工具
提供類似商用聯機檢索的信息檢索服務, 可分為Gopher 和WWW 兩大類。
(1 ) Gopher
是一種菜單式的檢索工具, 用戶只要在成樹型結構排列的菜單上選擇特定的項目( 可以是目錄名, 也可以是文件名) , 就可直接檢索所需信息, 而不必考慮這些信息的存儲方式和存儲地點, 它是目前最常用的網絡信息檢索工具之一。
(2 ) WWW
是一種基于超文本的交互式瀏覽型檢索工具, 是目前因特網上最先進的信息檢索工具。它覆蓋了約2 000 萬個大小不等的信息源, 可幫助用戶查找各服務器在網上的地址, 通過該地址訪問該服務器提供的信息。對用戶來說, 文件的格式及其存儲方式均是透明的, 這些文件既可來自WWW 服務器, 又可來自F TP、Gopher 或WAIS 服務器。
2 . 名錄式檢索工具
類似字典、電話簿、人名錄的功能, 用于查詢網上用戶信息和網上各種服務及其提供者的信息。例如, 目前在因特網上運行的常用名錄式網絡信息檢索工具就有WH OIS、NETFIND、X. 500 等。
(1 ) WH OIS
提供因特網的用戶信息服務, 一般用來查找因特網上某個用戶的E-mail 地址、郵政地址、電話號碼等, 結構簡單, 使用方便。目前, 一種名為WHOIS + + 的新的目錄服務通信協議正在制訂中, 將可能建成一個能覆蓋整個因特網的分布式名錄服務系統。
(2 ) NETFIND
可根據已知的人名及其工作地點的信息查找該人的E-mail地址和電話號碼以及用戶愿意公布的其他信息。
(3 ) X. 500
它是由國際電報電信咨詢委員會( CCIT T ) 制定的名錄服務通信協議, 目的是向用戶提供分布式的標準化名錄服務, 不僅可以提供有關個人和機構的信息, 還提供有關網絡資源、應用系統、硬件等方面的信息。
3 . 索引式檢索工具
為網上信息資源建立索引, 向用戶提供文件檢索服務, 檢索結果可以是文件的存儲地址, 也可進一步通過檢索工具獲得原文信息。屬于前者的有Archie, 屬于后者的有Veronica、Jughead和WAIS 等。
(1 ) Archie
建立Archie 服務器的機構定期從各個FTP 主機上收集存儲在其中的所有公開文件的目錄, 將這些信息存儲在Ar chie 索引數據庫內供用戶檢索。因特網上已建立了幾十個Archie 服務器,這些服務器共存儲了分布在全世界約1 200 個主機上的大約210萬個文件的目錄。
(2 ) Veronica
功能與Archie 相仿, 它是與Gopher 配套的檢索工具。Veronica服務器定時與各個Gopher 服務器聯系, 將所有的菜單復制下來, 存儲在一個數據庫里, 用戶隨時可通過Ve ronica 檢索服務程序到這個數據庫中去自動搜索相關的Gophe r 服務器的菜單, 大大提高了Gophe r 的檢索速度。
(3 ) Jughead
是與Ve ronica 類似的檢索工具, 不同之處是J ughead 的檢索范圍是事先限定的, 如只檢索某所大學或某一類Gopher 服務器。
(4 ) WAIS
以因特網上的各種文本數據庫為檢索對象, 采用自然語言全文檢索方法, 可使用戶在很大范圍內快速檢索信息, 并可將文件全文信息顯示在屏幕上供用戶聯機瀏覽。