聯(lián)機檔案信息檢索系統(tǒng)
聯(lián)機檢索技術(shù)從20 世紀70 年代開始得到迅速發(fā)展, 目前世界上已有不少具有國際規(guī)模的聯(lián)機檢索系統(tǒng)。聯(lián)機檢索相對于脫機檢索而言, 有不少優(yōu)點, 檢索效率大大提高。
一、聯(lián)機檔案檢索系統(tǒng)的特點
(一) 交互式檢索
在此之前的脫機檢索是委托性質(zhì)的檢索, 由用戶委托專家進行檢索。檢索者須事先將一切可能的檢索途徑考慮周全并編制出周密的檢索策略輸入計算機, 檢出相關(guān)文獻。用戶不能立即獲得檢索結(jié)果, 須等待成批的或定期的檢索處理。而聯(lián)機檢索采用檢索者與系統(tǒng)的會話方式進行。用戶可以通過終端借助于通信線路與系統(tǒng)直接對話, 可隨時修改檢索策略直到獲得滿意的結(jié)果為止, 是一種交互式的檢索方式。
(二) 實時檢索
聯(lián)機檢索系統(tǒng)中, 計算機將處理時間分配給許多終端, 即所謂“ 分時”。由于計算機運算速度極快, 使用戶產(chǎn)生錯覺, 以為他是唯一用戶, 檢索是以實時方式進行的, 從呼叫系統(tǒng), 到取得檢索結(jié)果, 片刻即可。一個設(shè)計優(yōu)良的系統(tǒng)對一詢問或指令的響應(yīng)速度快到1~2 秒, 幾乎是即時的。消除了手工檢索和脫機檢索中時間上的延遲現(xiàn)象。
(三) 啟發(fā)式檢索
聯(lián)機檢索具有啟發(fā)和幫助檢索者的功能。系統(tǒng)可幫助檢索者選擇合適的數(shù)據(jù)庫, 通報數(shù)據(jù)庫的更新情況, 顯示系統(tǒng)詞表, 幫助檢索者將課題的主題概念轉(zhuǎn)換為檢索標識, 解釋檢索者不熟悉的作業(yè)指令及其使用方法, 回答各種業(yè)務(wù)詢問, 并讓檢索者瀏覽檢索的初步結(jié)果。由于系統(tǒng)的幫助, 檢索者可以邊檢索, 邊詢問, 在得到啟發(fā)和幫助的條件下逐步明確自己的檢索策略, 使檢索得以順利進行。
(四) 高檢準率
聯(lián)機檢索是“ 對話” 式的, 允許檢索者隨時根據(jù)檢索的實際情況修改檢索策略, 擴大、縮小或改變檢索范圍, 避免檢索失誤, 查到自己真正需要的檔案, 檢準率較高。
(五) 對用戶限制較嚴
在脫機檢索系統(tǒng)中, 用戶不能直接操作計算機, 由檢索人員代查檔案, 對用戶沒什么限制。而在聯(lián)機檢索系統(tǒng)中, 用戶直接與計算機打交道, 由于系統(tǒng)數(shù)據(jù)庫中檔案信息并不是無區(qū)別地向所有人開放, 其中機密材料的檢索并不是人人都有資格進行的,這樣就有必要采取一定的保密措施。此外, 聯(lián)機檢索是要收費的, 為了防止盜用, 系統(tǒng)給其終端用戶一個秘密代號, 即所謂口令字, 每次開始檢索時, 系統(tǒng)要求檢索者輸入這個口令字。以檢驗該檢索者是否為合法用戶, 口令字對上后, 系統(tǒng)才開始檢索服務(wù)。口令字除了識別合法用戶外, 也用來控制機密材料的檢索者的范圍與級別。合法用戶中, 有的可檢索整個數(shù)據(jù)庫, 有的只能檢索其中的一部分。由于檔案材料的特點, 保密問題尤其重要,對用戶的限制十分嚴格。
二、聯(lián)機檔案檢索系統(tǒng)的工作過程及其功能
(一) 聯(lián)機檢索系統(tǒng)的工作過程
檢索者通過計算機終端, 向系統(tǒng)發(fā)出呼叫; 系統(tǒng)響應(yīng)后對檢索者作保密審查, 識別是否是合法用戶; 審查合格即由用戶向系統(tǒng)輸入檢索提問式; 系統(tǒng)根據(jù)檢索要求進行檢索; 最后輸出檢索結(jié)果。檢索者獲得結(jié)果后檢查結(jié)果是否符合要求, 若不符合就修改檢索策略, 重新輸入系統(tǒng), 直到獲得滿意的結(jié)果為止。
(二) 聯(lián)機檢索系統(tǒng)的功能
聯(lián)機檢索系統(tǒng)除提供一般的布爾檢索、加權(quán)檢索、截詞檢索功能外, 還具有一些脫機檢索系統(tǒng)所沒有的功能:
1 . 幫助用戶選擇合適的數(shù)據(jù)庫
由于系統(tǒng)擁有的數(shù)據(jù)庫越來越多, 檢索者有時不了解自己該查哪一種數(shù)據(jù)庫, 這時系統(tǒng)可根據(jù)檢索課題將含有該課題檔案的數(shù)據(jù)庫名單, 按照所含檔案數(shù)量的多少次序, 向檢索者顯示, 供其選擇。
2 . 詞表顯示
選定數(shù)據(jù)庫后, 如果檢索者不熟悉檢索語言, 可要求系統(tǒng)顯示自己需要的那一部分詞表或分類表, 從中選擇合適的檢索詞。
3 . 幫助檢索者回顧檢索過程
如果檢索過程較長, 檢索者可能會忘記檢索已經(jīng)進行過一些什么階段, 這時系統(tǒng)可應(yīng)檢索者要求, 把以往關(guān)鍵性的一些檢索語句重新顯示一遍, 幫助回顧檢索過程, 有利于檢索者繼續(xù)向下檢索。
4 . 保留檢索語句或檢索策略
當某些檢索語句或檢索策略以后還需重復(fù)使用時, 系統(tǒng)可為檢索者短期保留這些檢索語句或檢索策略, 需要時根據(jù)標識號即可召回, 免去重新輸入的麻煩。
5 . 提供聯(lián)機定題服務(wù)
當訂購這種服務(wù)的用戶把自己的檢索式輸入系統(tǒng)后, 系統(tǒng)將其納入專門的用戶提問檔, 予以長期保留。每當新材料進入系統(tǒng)的數(shù)據(jù)庫時, 就為檢索者進行查找, 將切合用戶課題要求的新材料提供給用戶。
6 . 支持個人文檔服務(wù)
聯(lián)機檢索系統(tǒng)允許用戶把自己的機讀文檔輸入并保存在該系統(tǒng)里, 以備自己檢索之用。系統(tǒng)為這種個人文檔保密, 旁人無權(quán)存取。
三、聯(lián)機檔案檢索系統(tǒng)的選擇
近些年來, 聯(lián)機檢索系統(tǒng)的數(shù)量日益增加, 這些系統(tǒng)所提供的數(shù)據(jù)庫各不相同, 收費標準各有區(qū)別, 可提供的檢索功能和服務(wù)項目也不盡相同, 系統(tǒng)的資源水平、響應(yīng)速度、可靠性、方便性等更有不小差異。因此, 如何合理地選擇聯(lián)機檢索系統(tǒng)就成為一大問題。
一般說來, 選擇聯(lián)機檢索系統(tǒng)可考慮以下因素:
(一) 數(shù)據(jù)庫因素
1 . 數(shù)據(jù)庫的追溯范圍
并非范圍越大越好, 這要與檢索目標結(jié)合起來考慮。如果檢索課題是普查性的, 則須選擇追溯年代較長的數(shù)據(jù)庫; 如果檢索課題只要求了解最新發(fā)展動態(tài), 則不應(yīng)追求數(shù)據(jù)庫的完整性, 因為追溯年代越長, 檢索時掃描的范圍越大, 命中的檔案越多, 檢索所需時間就越長, 檢索費用也就越多。
2 . 數(shù)據(jù)庫的文檔劃分
若在系統(tǒng)中裝成一個單獨的大庫, 對普查式檢索課題有利;若按年代斷開劃分為幾個文檔, 則對只想檢索最新材料的用戶有利。有的數(shù)據(jù)庫既作為一單獨的完整數(shù)據(jù)庫存在, 又有按累積期劃分的若干個小文檔, 這種大小文檔并列的方式既便于普查式檢索, 又便于最新信息的檢索, 是最為方便的。
3 . 數(shù)據(jù)庫的現(xiàn)實性
即數(shù)據(jù)庫收入的最新資料與其發(fā)表的時差有多大, 這與數(shù)據(jù)庫更新周期的長短有關(guān)。更新周期越短, 就越能獲得及時信息。
4 . 數(shù)據(jù)庫記錄內(nèi)容的完整性
對同一種數(shù)據(jù)庫, 各個檢索系統(tǒng)對裝入字段的選擇會有所不同, 裝入字段越多, 其內(nèi)容就越完整。
5 . 系統(tǒng)對數(shù)據(jù)庫的獨占性
有的數(shù)據(jù)庫是由某一檢索系統(tǒng)獨家提供的, 這無疑會增加該系統(tǒng)的吸引力。
6 . 數(shù)據(jù)庫群的存在情況
對某一學(xué)科主題范圍而言, 往往有一批相關(guān)數(shù)據(jù)庫, 稱之為數(shù)據(jù)庫群, 這種數(shù)據(jù)庫群是否存在及其完整程度, 是衡量檢索系統(tǒng)數(shù)據(jù)庫資源整體水平的依據(jù)之一。對檢索者來說, 某一領(lǐng)域數(shù)據(jù)庫群的存在, 擴大了選擇數(shù)據(jù)庫的余地, 也便于進行跨文檔檢索。
(二) 系統(tǒng)軟件功能因素
1 . 系統(tǒng)的用戶界面
用戶界面包括檢索模式、后處理的選擇、說明提示等。有的聯(lián)機檢索系統(tǒng)針對無經(jīng)驗的檢索新手和有經(jīng)驗的檢索專家, 分別提供菜單驅(qū)動和命令驅(qū)動兩種方式, 能夠適應(yīng)不同水平級別的用戶, 比只有一種方式要好。
2 . 系統(tǒng)的軟件功能
除了一般布爾邏輯檢索外, 是否還具備加權(quán)檢索、截詞檢索、限定檢索等功能。系統(tǒng)軟件功能與檢索處理的深度和靈活性有密切關(guān)系。
(三) 系統(tǒng)所能提供的服務(wù)
是否能提供原文復(fù)印件? 能否提供咨詢服務(wù)、電子郵政服務(wù)? 是否提供系統(tǒng)說明材料, 這些材料是否齊全, 更新是否及時? 是否提供培訓(xùn)服務(wù)? 等等。
(四) 費用因素
收費標準如何? 是否收初始費或預(yù)訂費, 有無優(yōu)惠? 等等。
(五) 檢索者對系統(tǒng)的熟悉程度及其經(jīng)驗水平
檢索者越是熟悉系統(tǒng), 就越能取得良好的檢索結(jié)果, 這本身就是一種經(jīng)費的節(jié)省。檢索者的素質(zhì)和經(jīng)驗是保證檢索質(zhì)量的重要條件, 應(yīng)根據(jù)自身情況選擇對檢索語言、數(shù)據(jù)庫、軟件功能、服務(wù)項目有較多了解的系統(tǒng)。