搜索引擎從入門到精通 陸元婕 2001.12 搜索引擎從入門到精通之一 基礎(chǔ)篇
搜索引擎?美美覺得挺奇怪的:“這搜索引擎有這么大威力?嗯,我也要學(xué)習(xí)用搜索引擎。”“可以啊,不過,最近我挺忙的,要不,先讓小張(妮妮的男朋友)教你一些基本知識(shí)吧。” “美美,學(xué)習(xí)使用搜索引擎先要了解一些基本知識(shí),可是有點(diǎn)枯燥哦,要有心理準(zhǔn)備喲。”小張?jiān)谂赃吅俸俚男χ?。美美嘴里哼了哼?#8220;誰怕呀,來吧。”小張清了清嗓子,開始了講解: “十幾年前,WWW(World Wide Web,萬維網(wǎng))還沒有出生的時(shí)候,互聯(lián)網(wǎng)上只有冰冷的文字,沒有圖像和聲音,而且網(wǎng)站數(shù)量也不多,感興趣的網(wǎng)站就那么幾個(gè),可以在很短的時(shí)間內(nèi)就掌握其中的全部信息,搜索引擎完全沒有出現(xiàn)的必要。1993年,互聯(lián)網(wǎng)上出現(xiàn)了最早的Web瀏覽器Mosaic,次年Netscape推出了Navigator。瀏覽器的發(fā)展促使Web得到迅速推廣,站點(diǎn)數(shù)目以驚人的速度增加,我們再也不能用傳統(tǒng)記憶方式來應(yīng)付與日俱增的站點(diǎn)。于是,搜索引擎就誕生了。第一個(gè)搜索引擎的出生地在美國,它的名字叫Archie,是由McGill大學(xué)的一個(gè)小組開發(fā)的。” “早期的搜索引擎是把互聯(lián)網(wǎng)中資源服務(wù)器的地址收集起來,由其提供資源的類型不同而分成不同的目錄,再一層層地進(jìn)行分類。人們要找自己想要的信息可按它們的分類一層層進(jìn)入,就能最后到達(dá)目的地,找到自己想要的信息。這種方式,只適用于互聯(lián)網(wǎng)信息并不多的時(shí)候。” “隨著互聯(lián)網(wǎng)的信息按幾何式增長,搜索引擎開始快速發(fā)展。1994年春天,世界上出現(xiàn)了真正意義上的搜索引擎——Lycos。隨著Yahoo!的出現(xiàn),搜索引擎的發(fā)展也進(jìn)入了黃金時(shí)代。搜索引擎家族不斷發(fā)展壯大,逐漸分布到信息世界的各個(gè)角落,它們的種類、技術(shù)也在不斷的發(fā)生變化。” 美美聽了半天,嘴越張?jiān)酱螅?#8220;哇,沒想到搜索引擎也有這樣的歷史呀。” “那當(dāng)然了,別打岔,下面要講搜索引擎的分類及原理了,仔細(xì)聽著。” “盡管目前存在數(shù)量眾多的搜索引擎,但按照它們信息搜集方法和服務(wù)提供方式的不同,可以大致劃分為三大類型。” “我們先來講講基于蜘蛛程序的的機(jī)器人搜索引擎,這種搜索引擎由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序自動(dòng)訪問Web站點(diǎn),提取站點(diǎn)上的網(wǎng)頁,并根據(jù)網(wǎng)頁中的鏈接進(jìn)一步提取其它網(wǎng)頁,或轉(zhuǎn)移到其它站點(diǎn)上。由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。” 美美又忍不住了:“太難了,我聽不懂。” “聽起來感覺很復(fù)雜吧?簡單講,就是由程序自動(dòng)抓去網(wǎng)上的信息,‘搜索引擎’這個(gè)詞的原義就是指這種狹義的搜索引擎。” “該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista、Excite、Inktomi、FAST、Lycos、Google;國內(nèi)代表為:百度、OpenFind等。” “哦,我這下我明白了,而且我還知道Google呢,好有名的。呵呵!你接著講吧。”美美終于弄懂了。 “接著給你講引擎目錄式搜索引擎,它是以人工方式或半自動(dòng)方式搜集信息,由編輯人員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類搜索引擎的國外代表是:Yahoo、LookSmart、Open Directory等;國內(nèi)代表有新浪網(wǎng)、搜狐等的網(wǎng)站目錄。” “美美,美美,哎,你在干嘛喲,睡著了?” “哦,我正要講呢。目錄的數(shù)據(jù)庫是依靠專職編輯或志愿人員建立起來的,這些編輯人員在訪問了某個(gè)Web站點(diǎn)后撰寫一段對(duì)該站點(diǎn)的描述,并根據(jù)站點(diǎn)的內(nèi)容和性質(zhì)將其歸為一個(gè)預(yù)先分好的類別,把站點(diǎn)的URL和描述放在這個(gè)類別中,當(dāng)用戶查詢某個(gè)關(guān)鍵詞時(shí),搜索軟件只在這些描述中進(jìn)行搜索。” “目錄的用戶界面基本上都是分級(jí)結(jié)構(gòu),首頁提供了最基本的幾個(gè)大類的入口,用戶可以一級(jí)一級(jí)地向下訪問,直至找到自己感興趣的類別,另外,用戶也可以利用目錄提供的搜索功能直接查找一個(gè)關(guān)鍵詞,不過,由于目錄只在保存的對(duì)站點(diǎn)的描述中進(jìn)行搜索,因此站點(diǎn)本身的動(dòng)態(tài)變化不會(huì)反映到搜索結(jié)果中來,這也是目錄與基于Robot的搜索引擎之間的一大區(qū)別。” “最后要講的是Meta元搜索引擎,它的特點(diǎn)是本身并沒有存放網(wǎng)頁信息的數(shù)據(jù)庫,當(dāng)用戶查詢一個(gè)關(guān)鍵詞時(shí),它把用戶的查詢請求轉(zhuǎn)換成其它搜索引擎能夠接受的命令格式,并訪問數(shù)個(gè)搜索引擎來查詢這個(gè)關(guān)鍵詞,并把這些搜索引擎返回的結(jié)果經(jīng)過處理后再返回給用戶。對(duì)于返回的結(jié)果系統(tǒng)會(huì)進(jìn)行重復(fù)排除、重新排序等處理。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等,國內(nèi)的一網(wǎng)打盡、颶風(fēng)搜索通等提供類似的功能。” “我真不知道搜索引擎還有這么多名堂呀,真是長了見識(shí)。”美美感嘆道。 “呵,這還只是開始呢,今天我們就到這兒了,你也該休息了,下次我們再繼續(xù)吧。”
搜索引擎從入門到精通之二 基本方法篇
“目錄式搜索引擎最簡單的搜索方法就是掌握它的目錄分類原則,確定你要找的網(wǎng)站應(yīng)該在哪個(gè)分類,然后逐級(jí)點(diǎn)擊尋找。這種方法在你需要尋找某一類網(wǎng)站時(shí)效果較好,不過,這里必須提醒同學(xué)們的是:各搜索引擎的目錄分類原則不盡相同,而且還經(jīng)常變化,并且隨著網(wǎng)站數(shù)量呈幾何級(jí)數(shù)增長,你需要點(diǎn)擊翻找的頁數(shù)也會(huì)越來越多。 如果我們需要根據(jù)一些特定的條件來搜索,就最好使用關(guān)鍵詞搜索的方法,現(xiàn)在就跟我一起來學(xué)習(xí)一些基本的搜索的數(shù)學(xué)規(guī)則,以便使搜索結(jié)果更迅速準(zhǔn)確。下面Google為例來介紹。” 一、查詢條件具體化 “你的查詢條件越具體,你就越容易找到你需要的資料。所以別怕在搜索引擎中輸入有點(diǎn)復(fù)雜的搜索條件。” “舉例來講,如果你想找一些有關(guān)‘Excel的數(shù)學(xué)函數(shù)的使用方法’的資料,你可搜索 ‘Excel數(shù)學(xué)函數(shù) ’(Excel和數(shù)學(xué)函數(shù)之間用空格隔開),不要僅查詢‘Excel’。試比較這兩種查詢所返回的結(jié)果。第一種搜索條件返回了64項(xiàng)搜索結(jié)果,而第二種搜索條件返回了3,100,000項(xiàng)搜索結(jié)果。顯然輸入較具體的條件可以過濾掉大量的無用信息,從而減少我們的工作量。” 二、使用加號(hào) “有時(shí)我們需要搜索結(jié)果中包含有查詢的兩個(gè)或是兩個(gè)以上的內(nèi)容,這時(shí)我們可以把幾個(gè)條件之間用“ ”號(hào)相連。比如說想查詢王菲的歌曲《香奈兒》,你可以輸入 “怎么了,哪兒不對(duì)嗎?”小張問。妮妮也奇怪的看著美美。 “哎,為什么你在兩個(gè)詞語之間輸入的是空格而不是‘ ’號(hào),空格和加號(hào)不一樣啊。” 小張和妮妮相視一笑。“我來解釋一下吧,”妮妮站起來說,“美美觀察得很仔細(xì),學(xué)得很認(rèn)真。其實(shí)大多搜索引擎用空格的查詢結(jié)果和用加號(hào)是相同的,這方面可以參看具體的搜索引擎的幫助說明。再說明一下吧,省的美美越聽越糊涂。小張介紹的是搜索的基本數(shù)學(xué)規(guī)則,這些規(guī)則表現(xiàn)在不同的搜索引擎中是有少量的差別的。所以,美美要想真正的會(huì)使用各種搜索引擎,還是要好好看看各搜索引擎的搜索幫助,要記住哦。” “嗯,知道了。小張,繼續(xù)講吧。” 三、使用減號(hào)- “有時(shí)你可能在查詢某個(gè)題材時(shí)并不希望在這個(gè)題材中包含另一個(gè)題材,這時(shí)你就可以使用減號(hào)了。” “什么嘛?這么復(fù)雜,講簡單一點(diǎn)啊。” “別急,舉個(gè)例子就明白了。比如你想查找‘劉德華的歌曲《享用你的姓》’,但又不希望得到的結(jié)果是RM格式(Realplayer)的。你就可以輸入“劉德華 歌曲 享用你的姓 -RM”,記住一定要在減號(hào)前留一個(gè)空格位。” “哦,原來是這樣,我來試試看。嗯,真的不錯(cuò)耶,搜索結(jié)果比不用減號(hào)時(shí)少多了。” “是的,減號(hào)的作用就在于可以使搜索結(jié)果集中反映你的需求,讓你無須為大量無關(guān)的搜索結(jié)果而頭疼。” 四、使用引號(hào)“” “你已經(jīng)學(xué)會(huì)加法與減法,現(xiàn)在可以學(xué)乘法了,在搜索引擎中,乘法的公式是:‘短語’。使用這一公式可以保證你的搜索結(jié)果非常準(zhǔn)確。因?yàn)椋词故怯蟹衷~功能的搜索引擎也不會(huì)對(duì)引號(hào)內(nèi)的內(nèi)容進(jìn)行拆分。在很多搜索引擎中,給這種查詢方式起名叫短語查詢,或者專用詞語查詢。這一方法在查找名言警句或?qū)S忻~時(shí)顯得格外有用。 美美這時(shí)插了一句:“什么叫分詞功能啊,介紹一下嘛!” “看你急的,簡單來講分詞就是把詞語進(jìn)一步劃分。比如,將一個(gè)長的詞組甚至句子分成多個(gè)詞語。分詞的方法有很多,比如最小分詞法、最大分詞法之類的。分詞技術(shù)主要是用在像中文、日文這樣的亞洲語言。因?yàn)檫@些語言字與字之間,詞與詞之間是沒有空格的,它在搜索引擎中的應(yīng)用也是最近幾年的事情了。像Google可以對(duì)中文句子作智能化處理,會(huì)自動(dòng)把句子分割成詞語作為關(guān)鍵詞。” “明白了,你繼續(xù)說吧。“ “好,我們還是言歸正傳。其實(shí),關(guān)于基本的數(shù)學(xué)規(guī)則已經(jīng)講得差不多了。在有些搜索引擎中還會(huì)支持什么通配符之類的,因?yàn)椴⒉黄毡?,就不多說了。美美,多多練習(xí)一下。試著用這些原則在搜索引擎中找找你將來想考的大學(xué)的網(wǎng)站吧。” “好的,謝謝小張。我去試試了。”美美去練習(xí)了。過了一會(huì),她又垂頭喪氣的來找妮妮:“妮妮,很奇怪啊,怎么這些方法不好用呢?我還是找不到要找的資料。” 妮妮笑著說:“別急別急,搜索是有很多技巧的。不過,美美,最好你能把要搜索的問題列出來,我好有針對(duì)性地介紹。” “嗯,謝謝妮妮。那么我去把問題寫出來吧……” 搜索引擎從入門到精通之三 使用技巧篇
司坦福大學(xué)——用Google、新浪都沒找到與之相符的網(wǎng)頁 看到美美的這張問題列表,小張和妮妮私下研究了一會(huì)。 “這些其實(shí)不難找。先讓小張給你介紹一些基本的搜索技巧吧。然后我們再實(shí)戰(zhàn)演練幾番。” “好啊,真的能很快就學(xué)會(huì)搜索嗎?我會(huì)努力的?,F(xiàn)在開始吧……” 一、選擇合適的搜索工具 “每種搜索引擎都有不同的特點(diǎn),只有選擇合適的搜索工具才能得到最佳的結(jié)果。之前已經(jīng)介紹過了搜索工具基本上可以分為網(wǎng)頁檢索(也就是上次說的基于蜘蛛程序的機(jī)器人檢索系統(tǒng))和分類目錄(即目錄式搜索引擎)兩種(我們先不談元搜索引擎)。” “這取決于你想查詢的問題。一般來說,如果你需要查找非常具體或者特殊的問題,用網(wǎng)頁檢索比較合適;如果你希望瀏覽某方面的信息、專題或者查找某個(gè)具體的網(wǎng)站,分類目錄會(huì)更合適。” “要是你需要查找的是某些確定的信息,比如Mp3、地圖等,就最好使用專門的Mp3、地圖等搜索引擎。” “有這樣的專業(yè)搜索引擎嗎?” “當(dāng)然,實(shí)際上幾乎每一類信息都有非常專業(yè)的搜索工具,它們有個(gè)名稱叫垂直搜索引擎。比如賽迪網(wǎng)的IT羅盤就是以精選式IT垂直搜索為特征的搜索引擎。” 二、使用正確的搜索詞 “使用搜索引擎要注意不能寫錯(cuò)別字,此外要盡量使用大家比較常用的詞語。” “容錯(cuò)查詢,就是指即使用戶輸入了錯(cuò)別字,搜索引擎也能根據(jù)某種規(guī)則推斷出該詞的正確寫法,給出正確的搜索結(jié)果。” “由于互聯(lián)網(wǎng)的信息是人來提交的,如果你使用了不常用的詞語來搜索,就不大容易找到答案了。比如,你想查有關(guān)鼠標(biāo)的信息,但輸入的是‘滑鼠’(港臺(tái)地區(qū)用語),就不容易找到資料了。” 三、正確使用布爾檢索 “正確的使用布爾檢索方式可以減少搜索結(jié)果的返回?cái)?shù)。” “布爾檢索,就是應(yīng)用布爾表達(dá)式的檢索方式,比如‘和’(And)、‘或‘(OR)、‘非’(NOT)。其實(shí)前面介紹的搜索的數(shù)學(xué)規(guī)則就是這種布爾檢索。加號(hào)就相當(dāng)于和,減號(hào)就相當(dāng)于非。而或關(guān)系沒有介紹,它并不是很常用的檢索規(guī)則。在搜索時(shí)一方面要注意不同搜索引擎工具的布爾檢索的表達(dá)方法。另一方面,也要注意自己要搜索的內(nèi)容邏輯關(guān)系是否合理。” 四、在點(diǎn)擊之前要思考 “成功的搜索=正確的提問 點(diǎn)擊有用的結(jié)果。” 五、在實(shí)踐中取得搜索經(jīng)驗(yàn) “搜索技巧和其他的技術(shù)一樣是在不斷練習(xí)中總結(jié)與成熟起來的。因此你必須不斷練習(xí)、不斷總結(jié)。” “同時(shí),通過練習(xí)總結(jié),你可以形成自己的一套有效的搜索習(xí)慣。這將有助于更快的完成搜索。好像美美現(xiàn)在這樣,遇到一點(diǎn)困難就打了退堂鼓,可是不行的。” “好了,基本的搜索技巧先講到這,關(guān)鍵還是多加練習(xí)。我們就以美美在搜索時(shí)遇到的那幾個(gè)問題試一下這些搜索技巧吧。” “先讓我來試試。我好像已經(jīng)找到一些原因了。” “歌星王菲 精選專輯 –rm,是不是搜索條件太多?試一下,輸個(gè)簡單點(diǎn)的‘王菲 專輯 –rm’,找到了。” “不僅是這個(gè)原因。你要搜索的關(guān)鍵字要符合習(xí)慣。這方面,新浪的幫助信息的有介紹。” “世界杯預(yù)選賽 最新新聞。這個(gè)問題怎么解決呢?” “用Google找到的結(jié)果確實(shí)是比較舊,因?yàn)槟壳癎oogle的搜索數(shù)據(jù)庫的更新是每月一次(平均為28天),所以顯然用它來搜索新聞是不合適的。” “而你在新浪遇到的是死鏈問題。死鏈對(duì)于搜索引擎而言是很正常的,這不是我?guī)退阉饕骈_脫。實(shí)在是因?yàn)榛ヂ?lián)網(wǎng)的信息更新的太快,它不容易抓取。除了死鏈問題,以后你還會(huì)遇到很多屬于搜索引擎的不足之處,比如它對(duì)于動(dòng)態(tài)網(wǎng)頁處理能力不強(qiáng)之類的。” “那有辦法找到這些死鏈的內(nèi)容嗎?” “辦法有一些。比如google就采用了網(wǎng)頁快照的技術(shù)。這個(gè)我們會(huì)在實(shí)戰(zhàn)演練中詳細(xì)介紹。” “另一個(gè)辦法是:運(yùn)用一些偵察技巧,加上你的好運(yùn)氣,有可能會(huì)找到。” “據(jù)此,我們可以使用一種叫做‘URL退選’的方法。也就是將地址欄的網(wǎng)址的文件名一點(diǎn)點(diǎn)刪除,在碰到第一個(gè)斜杠后停止,然后敲回車鍵。重復(fù)此動(dòng)作,不斷嘗試。運(yùn)氣夠好的話,就能找到了。” “聽起來很復(fù)雜啊。” “要是你了解一些網(wǎng)站發(fā)布的知識(shí)會(huì)比較容易懂。雖然這種辦法并不總有效,但是還是值得嘗試的。” “大連 天津街 地圖,這個(gè)是不是該用地圖搜索引擎?” “這個(gè)涉及一些搜索技術(shù)方面的知識(shí)了。就拿英文而言,有大約300個(gè)最常用單詞本身缺乏實(shí)際意義或者使用過于廣泛,一旦用來搜索的話,會(huì)返回大量的無用的搜索結(jié)果甚至導(dǎo)致搜索引擎錯(cuò)誤。因此很多搜索引擎都會(huì)屏蔽這些關(guān)鍵詞。” “那在新浪怎么就能找到呢?” “可以啊,下一次我們會(huì)介紹幾個(gè)比較常用的搜索引擎。” 搜索引擎從入門到精通之四 Google實(shí)戰(zhàn)篇
“好。Google的確是非常好用的搜索引擎。我記得Google由兩個(gè)斯坦福大學(xué)博士生Larry Page和Sergey Brin設(shè)計(jì),于1998年9月發(fā)布測試版,一年后正式開始商業(yè)運(yùn)營。Google發(fā)布至今才不過短短幾年,就由于對(duì)搜索引擎技術(shù)的創(chuàng)新而獲獎(jiǎng)無數(shù)。它最擅長的是易用性和高相關(guān)性。” “不僅如此,”,小張接過話題說,“Google提供一系列革命性的新技術(shù),包括完善的文本對(duì)應(yīng)技術(shù)和先進(jìn)的Page Rank排序技術(shù),還有非常獨(dú)特的網(wǎng)頁快照、手氣不錯(cuò)等功能。此外還有很多英文站點(diǎn)的獨(dú)有功能,比如電話搜索、地圖搜索等等。” “嗯,我在它的網(wǎng)站幫助中看到過一些介紹,可是有些地方還是搞不大明白究竟該怎么用。要不,妮妮就結(jié)合實(shí)際例子給我講講吧。” Google入門知識(shí) “Google支持大多數(shù)的搜索基本語法規(guī)則,比如‘ ’、‘-’、‘OR’。Google無需用明文的‘ ’來表示邏輯‘與’操作,只要空格就可以了。Google用減號(hào)‘-’表示邏輯‘非’操作。Google用大寫的‘OR’表示邏輯‘或’操作。” “需注意的是,Google不支持通配符,如‘*’、‘?’等,只能做精確查詢。Google對(duì)英文字符大小寫不敏感,‘GOD’和‘god’搜索的結(jié)果是一樣的。Google的關(guān)鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關(guān)鍵字,必須加英文引號(hào)。” “這些知識(shí)在Google的幫助中都可以看到詳細(xì)的例子,想來美美一定看得懂,我就不在這舉例了。” Google特色服務(wù) “Google提供很多非常有特色的功能,比如前面介紹的‘網(wǎng)頁快照’,‘手氣不錯(cuò)’等。這些輔助功能會(huì)幫助使用者更快速、方便的找到需要的資料。”
“咦,美美你在想什么?” “還記得上一次你遇到過的死鏈問題嗎?你想,要是有這個(gè)網(wǎng)頁快照的功能,即使是死鏈不也可以看到具體的網(wǎng)頁內(nèi)容了嗎。” “有道理啊。那Google要有多少地方放這些網(wǎng)頁啊。” Google高級(jí)搜索 “Google支持很多高級(jí)搜索的語法格式,比如site、link等。這方面挺復(fù)雜的,你還是看看這個(gè)表格自己試試看吧。” “對(duì)了,表格中所列出的也是一些比較常用的語法規(guī)則,更多特殊的用法還需要在實(shí)踐中慢慢積累。”
Google特殊功能 “上面介紹的是一些Google的綜合搜索使用方法方面的內(nèi)容。隨著Google的不斷發(fā)展,它也逐漸開始提供更多的垂直搜索的功能。比如目錄服務(wù)、新聞組檢索、PDF文檔搜索、地圖搜索、電話搜索、圖像搜索,還有工具條、搜索結(jié)果翻譯、搜索結(jié)果過濾等更多的功能。” “哇, Google有這么多功能?天,要講多久才能講完啊。”
搜索引擎從入門到精通之五 國內(nèi)篇
“看來美美很……啊。要說國內(nèi)的搜索引擎不能不提百度。年輕的百度公司自2000年6月起迅速地拿下了硅谷動(dòng)力、Chinaren、搜狐、新浪、21CN、廣州視窗、263、TOM等門戶網(wǎng)站的全文搜索引擎服務(wù),成為中文檢索市場中的佼佼者。百度的成功不但使中國網(wǎng)民有更好的搜索體驗(yàn),也激勵(lì)了同行的進(jìn)取心,使得國內(nèi)中文搜索引擎的發(fā)展進(jìn)入你爭我趕的良性發(fā)展時(shí)代。” “啊,那么多著名的網(wǎng)站的搜索引擎原來使用的是同一家搜索引擎服務(wù)公司的服務(wù)啊。那豈不是用哪個(gè)都一樣了。” “不完全如此。大部分網(wǎng)站使用的是百度公司的網(wǎng)頁搜索服務(wù),并且這一服務(wù)也是按照各個(gè)網(wǎng)站的個(gè)性化要求重新設(shè)定的,因此仍然是各具特色。” “咦,你好象沒有提到網(wǎng)易和Yahoo?” “美美果然是變成搜索通了,網(wǎng)易、Yahoo使用的是Google的網(wǎng)頁搜索服務(wù)。”小張說。 “原來如此。” “既然美美已經(jīng)掌握了大部分的搜索方法與技巧,我看在各家搜索引擎的使用方面由美美自己練習(xí)就可以了。我們主要介紹一下各家搜索引擎的特點(diǎn)吧。 新浪 “新浪搜索是目前互聯(lián)網(wǎng)上規(guī)模最大的中文搜索引擎之一,網(wǎng)站收錄資源豐富,以中文網(wǎng)站GB碼為主。分類目錄規(guī)范細(xì)致,層次合理,遵循中國用戶習(xí)慣。” “去年,也就是2000年11月,新浪搜索推出了新一代綜合搜索引擎,這可是中國第一家可多個(gè)數(shù)據(jù)庫查詢的綜合搜索引擎啊。” “綜合搜索是怎么回事?” “所謂綜合搜索就是一次輸入搜索關(guān)鍵詞,符合查詢條件的搜索結(jié)果,不管它是新聞、網(wǎng)站還是網(wǎng)頁都會(huì)顯示在用戶眼前。” “噢,這多方便啊。連新聞都可以搜出來?” “是。全新的新浪綜合搜索方便實(shí)用,省卻了用戶分門別類搜索的麻煩.這些全方位的資訊依照與搜索條件符合的程度排列,在保持快速、準(zhǔn)確的基礎(chǔ)上,給用戶提供了更多的選擇。” “這挺抽象的。讓我來試一下,在新浪搜索中輸入‘劉德華’,天啊,不僅可以查到關(guān)于劉德華的網(wǎng)站,還可以搜索到關(guān)于劉德華的最新動(dòng)態(tài)、照片等等許多信息。太好了。” “同樣的,搜索‘mp3’,就可以輕而易舉地搜出各種關(guān)于mp3的目錄和網(wǎng)站;mp3播放機(jī)的圖片;在新浪內(nèi)容板塊中找到諸如:最新的mp3播放軟件、mp3播放機(jī)、MP3的數(shù)碼相機(jī)等及時(shí)、詳盡的相關(guān)信息;在商品信息中了解最新mp3產(chǎn)品的品牌、價(jià)格、技術(shù)參數(shù)等資料。” “新浪搜索還有一些特點(diǎn)。比如,在搜索結(jié)果相關(guān)方面提供與所搜索的關(guān)鍵詞最為相關(guān)的部分內(nèi)容供選擇。當(dāng)搜索‘oicq’時(shí),在給出包含符合搜索要求的目錄、網(wǎng)站、新浪內(nèi)容、商品信息等綜合結(jié)果外,還會(huì)根據(jù)以往用戶的搜索習(xí)慣提供諸如:icq、騰訊、oicq工具、騰訊oicq、oicq下載等相關(guān)的關(guān)鍵詞供選擇,如果用戶正好接下來想搜oicq工具的相關(guān)內(nèi)容,只要在網(wǎng)頁上給出的oicq工具這個(gè)詞上輕輕一點(diǎn)就可以了。” “對(duì)了,其實(shí)關(guān)于相關(guān)關(guān)鍵詞這一技術(shù)可并非是新浪獨(dú)有的,其實(shí)這是百度公司的技術(shù),所以,百度的客戶,比如搜狐、263等都有這一功能。” “此外,新浪搜索特別設(shè)有搜索論壇,如果用戶在搜索中有什么不明白的地方,或是有一時(shí)搜不到的東西,到搜索論壇中提問,就立即會(huì)有熱心網(wǎng)友解答,形成了一種搜索教幫的文化。” “是啊,搜索論壇可是很有人氣的啊。其實(shí),我和小張的很多搜索知識(shí)都是從論壇里學(xué)來的。搜索論壇里的VIP網(wǎng)友以及壇主可都是知識(shí)豐富的搜索高手呢,比如搜索引擎9238、shuxun、wyle等等。” 網(wǎng)易 “網(wǎng)易搜索引擎采用模糊搜索方式(就是我們之前提過的智能分詞技術(shù))對(duì)用戶輸入的關(guān)鍵詞,先作語言分析,分解成多個(gè)詞或詞組,再去數(shù)據(jù)中心匹配結(jié)果,因此允許用戶輸入整句。” “真的呀。那可太方便了,有時(shí)候我就是搞不懂該用什么樣的多個(gè)關(guān)鍵詞搜索。” “網(wǎng)易搜索引擎提供多語言檢索,英語,日語,俄語等幾十種語言關(guān)鍵詞都可以直接輸入搜索框檢索網(wǎng)頁資料。其實(shí)這應(yīng)該算是Google的功勞。” “此外,網(wǎng)易擁有全國最大的開放式管理目錄ODP,有約5000名各行業(yè)目錄管理員負(fù)責(zé)管理網(wǎng)站注冊信息。美美,是不是想知道ODP是怎么回事???” “嗯,什么是ODP?” “ODP是Open Directory Project(開放式目錄管理)的縮寫。 從誕生至今,只有短短三年的歷程。1998年6月,當(dāng)時(shí)一位程序員Rich Skrenta對(duì)Yahoo!的搜索結(jié)果中經(jīng)常出現(xiàn)老的和死的鏈接感到非常厭煩,于是他在Internet上發(fā)出了倡議,請求位于全球各地的Internet用戶都志愿來幫助編輯這個(gè)目錄。倡議很快得到了很多熱心志愿者的支持,于是劃時(shí)代的管理方式ODP就此誕生。國外比較著名的ODP網(wǎng)站當(dāng)屬Dmoz,它由4萬多名志愿編輯免費(fèi),提供給任何個(gè)人和組織免費(fèi)使用。Google的網(wǎng)站搜索其實(shí)就是Dmoz的杰作。” 搜狐 “搜狐公司于1998年推出中國首家大型分類查詢搜索引擎,經(jīng)過幾年的發(fā)展,其內(nèi)容更新迅速,網(wǎng)站收錄資源豐富,以中文網(wǎng)站為主,如今累計(jì)收錄中文網(wǎng)站已達(dá)150多萬,?每日瀏覽量超過800萬。搜狐有很多技術(shù)、功能與新浪類似,在此就不多說了。” 263首都在線 “263首都在線的搜索引擎可謂百度公司技術(shù)的完美體現(xiàn),因?yàn)樗鼜木W(wǎng)頁搜索到網(wǎng)站搜索都使用了百度的技術(shù),為廣大中文網(wǎng)絡(luò)用戶提供豐富有效的目錄指南服務(wù)和全文檢索服務(wù)。它比較有特色的地方是除了提供基本的分類查詢和關(guān)鍵字查詢,還為用戶增加本周新站、好站推薦、熱門關(guān)鍵字搜索、專題搜索、搜索留言版等多項(xiàng)服務(wù)。” “好了,國內(nèi)幾大搜索引擎的情況就介紹到這里,此外還有很多比如天網(wǎng)、網(wǎng)擎、中國導(dǎo)航等等,美美可以通過閱讀相關(guān)的搜索文章了解。” |
|