網上搜索如何加速
(郝宇紅 infoweb)
網上的信息搜索技術越來越多,怎樣才能高效迅速地找到問題的答案?有幾種
技術可以使得更加快捷地找到所需網頁。沒有一種技術是萬能的,但將幾種技術巧
妙的結合使用會大大加快網頁搜索進程。幾乎所有流行的搜索引擎都提供按詞組搜
索的功能,按詞組搜索是一種在浩瀚的網頁搜索相關網頁的最佳技術。
詞組搜索
如果只給出一個單詞進行搜索,那麼將發現數以千計甚至以百萬計的匹配網頁。
然而如果再加上一個單詞,那麼搜索結果會更加切題。在搜索時,給出兩個關鍵詞,
並將兩個詞用AND(與邏輯) 結合起來,或者在每個詞前面加上加號,這種與邏輯技
術大大地縮小了命中範圍,從而加快了搜索。幸運的是,所有主要的搜索引擎都使
用同樣有語法。一個帶引號的詞組意味著只有完全匹配該詞組(包括空格)的網頁
才是要搜索的網頁。例如在搜索說明中,有「this exact phrase (這個確切詞組)
「這個詞組,那麼搜索引擎只搜索包含「this exact phrase(這個確切詞組) 「的
網頁。
下面舉一個例子,一個人要查找惠普的MPE/ix操作系統的命令清單,他可能在
Altavista站點只輸入「MPE/ix「這個詞,那麼他可能會發現有2400個匹配網頁;如
果在填寫搜索條件時寫了「MPE/ix「和「Commands「兩個詞並用AND(與邏輯) 結合
起來, 那麼滿足條件的可能是450個網頁; 如果在搜索條件上輸入 「MPE/ix
Commands「,那麼只有15條記錄匹配,其中包括愛荷達州立大學計算與通信管理用
戶指南,其中對MPE/ix系統命令有詳細的描述。
詞組選擇
一般說來在網頁搜索引擎中,用詞組搜索來縮小範圍從而找到搜索結果是最好
的辦法。但是,運用詞組搜索涉及到如何使用一個詞組來表達某一具體問題。有時
簡單地輸入一個問題作為詞組就能湊效, 尤其是在Altavista這個站點上,因為它
採用了「Ask Jeeves「引擎技術,該技術就常見問題給出預置的答案。
在Altavista上輸入「 Why is the sky blue(為什麼天是藍的) 「,就會在
「Ask Jeeves「部分找到答案,並給出若干網頁回答這個問題。然而簡單明瞭的提
問方法只對一部分搜索奏效。其他詞組也可以作為搜索條件,尤其這些詞組中有一
個詞十分獨特或者該詞組是幾個詞獨特的組合。試一試用人名、產品名、甚至是嵌
入程序中的字符串去搜索。
收到錯誤信息
將全部或部分錯誤信息作為詞組進行搜索。 當夏時制時間變化時, Netscape
Navigator(瀏覽器) 會產生一條錯誤信息, 該信息包含詞組「book marks have
changed on disk(磁盤書籤已變動) 「。在Northern light 或HotBot 站點上輸
入該詞組,就會找到對該問題的解釋以及如何處理。
DejaNews和新聞組文檔經常發現一些問題很難甚至不能通過搜索引擎找到答案。
由於新聞組更關注討論而網頁相對來說變更較少,DejaNews新聞組文檔或許是一個
較快的信息源。 不幸的是,DejaNews 不能總是充分地處理詞組引擎。儘管它遵守
常規的語法,但是它的搜索引擎是處理器密集式的,而且經常只給出與搜索詞組匹
配的部分結果。有鑒於此,在DejaNews上搜索時最好直接鍵入詞組不要加引號,並
希望包含該詞組的記錄出現在前面。有些搜索引擎在處理詞組時出人意料——忽略
句號,搜索該詞的其它形式,漏掉空格等等,但是在DejaNews中的處理過程中不存
在。
直接到信息源
有時詞組搜索太精確或者一個詞組無法準確表達所需信息。那麼可以直接到信
息源,這種技術簡單得似乎不值一提,但卻很有效。根本不用搜索引擎,直接到提
供某種信息組織的站點去。很多時候我們可以用公式「www.公司名.com「去猜測某
一組織的站點。如果猜不中,那麼到Yahoo去,或用搜索引擎。
例如,要找Dell公司現有附件的說明書,直接去該站點www.dell.com,想知道
Oracle公司有什麼新聞,試一試www.oracle.com,然後再去新聞欄看一看。人們在
搜索引擎中得到很多無用信息,卻忘了試一試該方法。這種技術還可用於其他搜索
目的,並不一定與公司有關。政府機構、職業協會、教育機構也可以提供很好的信
息資源。 有關人口統計請去www.census.gov,還能去www.acm.org看看最近的會議
清單。
新搜索引擎特點
近幾個月來搜索引擎不斷完善, 並且已經取得重要的進展。 比如前面提到的
Altavista將Ask Jeeve技術融合在其搜索引擎中,如果你的問題在Ask Jeeves庫中
具有普遍性就會很容易在此找到答案。該技術在回答「What time is it in Paris?
(巴黎現在幾點了? )「這類問題時十分有效,而遇到諸如「What is the best way
to make an Oracle database accessible on the web? (如何使Oracle數據庫被
瀏覽器訪問?)「這類問題時就顯得不盡如人意。
HotBot使用直接命中法,即給出10個經常被搜索訪問的站點。這兩種方法在猜
不到某一組織的URL時非常有效。
Excite近來採取了更加複雜的方法,給出到公司站點的連接、它的地址、當前
股票價格、新文章等等。對於大公司名字這類標題,Excite可以正確識別,這是一
種獲得基本信息和當前新聞的很好的辦法。但這種辦法在對待細節問題時大打折扣。
回目錄