免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

四種中文搜索引擎比較

  2006-08-09
 

而今,因特網(wǎng)的發(fā)展也許不能用日新月異來形容,因為它每時每刻都在發(fā)生變化。由于因特網(wǎng)上的信息是極其無序的,信息量越大,越難被利用。沒有人對因特網(wǎng)上信息的有效性和有序性負責,因此如何獲取和利用因特網(wǎng)上的信息就成了一個大問題。人們想要在因特網(wǎng)上查找自己所需要的資料,就猶如大海撈針一樣。搜索引擎的出現(xiàn)在一定程度上幫助人們解決了問題,但是搜索引擎本身也存在自身的缺陷,再加上中文搜索引擎中的中文分詞和切詞技術(shù)發(fā)展的不完善,因此,人們在使用檢索技術(shù),通過搜索引擎在因特網(wǎng)上查找所需要的信息,成為了一個需要研究和解決的課題?;谶@個目的,筆者通過對比四個比較有規(guī)模的中文搜索引擎,向用戶展示了他們分別所適合的檢索對象,并提出了一些檢索的小技巧,敬請專家學者批評指正。

 

一、             網(wǎng)絡信息的發(fā)展帶動了搜索引擎的發(fā)展

1 搜索引擎的興起

據(jù)發(fā)表在《科學》雜志1997年7月文章《WEB信息的可訪問性》估計,全球目前的網(wǎng)頁超過8億,有效數(shù)據(jù)超過9T,并且仍以每個月翻一番的速度增長。在如此浩瀚的信息海洋中尋找信息,就猶如“大海撈針”。為了解決尋求信息這一難題,搜索引擎應運而生了。這里所說的搜索引擎是指因特網(wǎng)上專門提供查詢服務的一類網(wǎng)站,這些網(wǎng)站通過網(wǎng)絡搜索軟件(又稱為網(wǎng)絡搜索機器人)或網(wǎng)站登錄等方式,將因特網(wǎng)上大量網(wǎng)站的頁面收集到本地,經(jīng)過加工處理而建庫,從而能夠?qū)τ脩籼岢龅母鞣N查詢作出響應,提供用戶所需的信息①。

2 搜索引擎的發(fā)展

現(xiàn)代意義上的搜索引擎的祖先,是1990年有蒙利特爾大學學生Alan Emtage發(fā)明的 Archie,主要用來檢索散布在各個分散的FTP主機中的大量文件。隨后,Matthew Gray開發(fā)了World wide web Wanderer,即搜索引擎的“機器人”程序,剛開始它只是用來統(tǒng)計互聯(lián)網(wǎng)上的服務器數(shù),后來則發(fā)展為能夠檢索網(wǎng)站域名。RBSE是第一個在搜索結(jié)果排列中因如關(guān)鍵字串匹配程序概念的引擎。最早現(xiàn)代意義上的搜索引擎出現(xiàn)于1994年7月。當時Michel Mauldin 將John Leavitt的蜘蛛程序接入到其索引程序中,創(chuàng)建了大家現(xiàn)在熟知的Lycos。同年4月,斯坦福大學的兩名博士生,David Filo和美籍華人楊致遠(Gerry Yang)共同創(chuàng)辦了超級目錄索引Yahoo,并成功地使搜索引擎深入人心。從此搜索引擎進入了高速發(fā)展時期。目前,互聯(lián)網(wǎng)上有名有姓的搜索引擎已達數(shù)百家,其檢索的信息量也與前不可同日而語。比如最近風頭正勁的Google,其數(shù)據(jù)庫已達到30億之巨。隨著因特網(wǎng)規(guī)模的急劇膨脹,一家搜索引擎光靠自己單打獨斗已無法適應目前的市場狀況,因此現(xiàn)在搜索引擎之間出現(xiàn)了分工協(xié)作,并有了專業(yè)的搜索引擎技術(shù)和搜索數(shù)據(jù)庫服務提供商。象國外的Inttomi,它本身并不是直接面向用戶的搜索引擎,但象包括Qverture,LookSmart,MSN,HotBot等在內(nèi)的其他搜索引擎提供全文網(wǎng)頁搜索服務。國內(nèi)的百度也屬于這一類,搜狐和新浪用的是它的技術(shù)。      因此從這個意義上說,他們是搜索引擎的搜索引擎。

 

3 搜索引擎在網(wǎng)絡信息檢索中有著舉足輕重的作用

    搜索引擎的出現(xiàn)大大節(jié)省了人們搜尋信息的時間,也減輕了人們記憶網(wǎng)址的負荷。搜索引擎可以大量的用物理存儲介質(zhì)來“記憶”網(wǎng)址。它的記憶時間和記憶量比人腦長得多也大得多,而且它的記憶類型也有嚴格的歸類。因此,利用搜索引擎這個記憶庫調(diào)取數(shù)據(jù),可以既省卻大腦苦苦記憶網(wǎng)站的煩惱,也會大大提高進入網(wǎng)站的效率和速度。除此之外,人們還可以通過其豐富的分類來擴展思路。例如:我們搜索“音樂”這個關(guān)鍵詞時,搜索引擎就會“制作音樂”、“音樂會”、“音樂下載”等許多分類和相關(guān)鏈接,而許多分類則我們往往想到的。顯然,搜索引擎使得我們了解網(wǎng)絡信息的精力付出達到最小化。因此,搜索引擎在網(wǎng)絡信息檢索中有著舉足輕重的作用。

 

二、比較四大典型中文搜索引擎(一搜、中國搜索、百度、Google)

既然搜索引擎如此重要,而現(xiàn)在有名有姓的搜索引擎如此之多。我們又如何選擇搜索引擎來搜索信息呢?針對我們采用的漢語這種語種,搜索引擎技術(shù)中本身存在著分詞切詞難題,在這里就只比較四大典型的中文搜索引擎,以期提高檢索中文信息的效率。他們分別是一搜、中國搜索、百度和Google。

 

1         簡單普通關(guān)鍵詞的比較

所謂普通關(guān)鍵詞,就是不含任何技巧性的基本關(guān)鍵詞的搜索,比如“長城”,“射雕英雄傳”等常見、很普通的名詞的搜索。

在這里我們想了解一下有關(guān)長城的基本情況,那么我們在四種搜索引擎中分別輸入關(guān)鍵詞“長城”,其結(jié)果如下表所示:

 

長城

搜索范圍

搜索結(jié)果

用時

一搜

默認所有

7,610,000條結(jié)果

0.05秒

中國搜索

默認所有

11,800,001 條結(jié)果

0.006秒

百度

默認所有

10,700,000條結(jié)果

0.001秒

Google

默認所有

5,900,000條結(jié)果

0.06秒

       表1 簡單普通關(guān)鍵詞的比較(資料來源:一搜,中國搜索,百度,Google)

   搜索感受:從搜索時間上來看,百度搜索引擎的速度最快,Google搜索的速度最慢;從搜索結(jié)果來看,中國搜索的結(jié)果最多,Google搜索的結(jié)果最少;四家均給出了一定的參考關(guān)鍵詞;其中只有中國搜索給出了關(guān)于“長城”的其他相關(guān)鏈接,例如圖片,新聞等。其第一頁的新聞都是2005年12月5號的,因為測試搜索的時間是2005年12月5號,所以“中國搜索”給出的搜索結(jié)果更另人滿意。根據(jù)上述的反饋信息綜合來看,此次搜索感受是:“中國搜索”的表現(xiàn)最佳;雖然百度是在搜索速度上勝出,但是并沒有象“中國搜索”一樣給出普通用戶最想看的時效性最強的新聞,因此,相信搜索用戶會更傾向于“中國搜索”的表現(xiàn)。

2         技巧性關(guān)鍵詞搜索的比較

技巧性關(guān)鍵詞需要搜索引擎有一定判斷力才能保證搜索結(jié)果的準確性。比方說“長城長”這個關(guān)鍵詞,用戶到底搜索的是包含有“長城長”的音樂,還是想知道“長城到底有多少”的信息?下面讓我們來看看四大搜索引擎的表現(xiàn)——

比如說,我們要搜索范曉萱的《健康歌》,輸入關(guān)鍵詞健康范,其結(jié)果為:

 

健康范

搜索范圍

搜索結(jié)果

用時

一搜

默認所有

1,490,000條結(jié)果

0.74秒

中國搜索

默認所有

9,590,000條結(jié)果

0.425秒

百度

默認所有

290,000條結(jié)果

0.146秒

Google

默認所有

2,000,000條結(jié)果

0.39秒

       表2 技巧性關(guān)鍵詞的比較(資料來源:一搜,中國搜索,百度,Google)

搜索感受:在搜索結(jié)果頁面中,“一搜”、中國搜索在前幾條找到了“健康歌 范曉萱”的信息;從給出的參考關(guān)鍵詞來看,百度和Google都沒有給出參考關(guān)鍵詞,中國搜索給出的參考關(guān)鍵詞準確率最好,除了“一搜”和中國搜索外,百度和Google沒有給出任何關(guān)于“范曉萱健康歌”的信息。

綜合上述的反饋信息,從搜索準確度來看,覺得中國搜索讓人最為滿意,“一搜”其次;在參考關(guān)鍵詞方面也是中國搜索最佳了。

3         圖片搜索的比較

圖片搜索是順應網(wǎng)民需求而推出的一項專業(yè)搜索技術(shù),它可以通過圖片名稱、大小等特征幫助網(wǎng)民高效地搜索到所需要的圖片。

四種搜索引擎中,就只有“一搜”的圖片搜索方式提供有“翻譯為英文后搜索”。雖然四種搜索引擎圖片搜索下都有下屬分類,但是“一搜”,百度,Google的下屬分類都大同小異。只有“中國搜索”下設“最新更新”,“熱門分類”,“繽紛專題”,“排行榜”,“新聞快車”,“超級爆笑”,“明星圖庫”分類。每一個分類下面又有更小的分類。因此,網(wǎng)民們可以根據(jù)自己的需求,在分類里一級一級尋求自己需要的圖片。我們再來看看通過輸入關(guān)鍵詞來搜索來檢索圖片,例如我們想找一些“流程圖”的圖片,下面是四種搜索引擎的搜索結(jié)果:

 

流程圖

搜索范圍

搜索結(jié)果

用時

一搜

默認所有

4,329條結(jié)果

0.123秒

中國搜索

默認所有

15,893條結(jié)果

0.002秒

百度

默認所有

17,900條結(jié)果

0.003秒

Google

默認所有

23,600條結(jié)果

0.20秒

表3 圖片搜索的比較(資料來源:一搜,中國搜索,百度,Google)

搜索感受:從檢索結(jié)果來看,Google的檢索結(jié)果最多,百度其次,中國搜索也有1萬多條;從搜索時間來看,中國搜索的用時最少,百度次之。

綜合上述反饋信息,覺得中國搜索不管是在分類搜索方面還是在關(guān)鍵詞檢索方面都最令人滿意。

 

4         新聞搜索的比較

世界之大,每天都會發(fā)生各種各樣的事情,因此人們也迫切需要了解當天發(fā)生了什么事情,想了解自己迫切需要了解的新聞。所以我們在這里對四大搜索引擎的新聞搜索進行比較是非常有必要的。

最近的一個熱門新聞就是關(guān)于“臺灣選舉”的問題了,所以我們用關(guān)鍵詞“臺灣選舉”來搜索一下新聞,讓我們來看看這四個搜索引擎的表現(xiàn)——

 

臺灣選舉

搜索范圍

搜索結(jié)果

用時

一搜

新聞全文

138條結(jié)果

0.13秒

中國搜索

新聞全文

5,499條結(jié)果

0.294秒

百度

新聞全文

6,390條結(jié)果

0.056秒

Google

新聞全文

489條結(jié)果

0.21秒

表4 新聞搜索的比較(資料來源:一搜,中國搜索,百度,Google)

 

搜索感受:從檢索結(jié)果來看,百度的結(jié)果最多,中國搜索次之,一搜的結(jié)果最少;從檢索效率來看,百度的檢索速度最快,中國搜索最慢。從新聞的適時性來看,一搜最近的新聞是2005年12月5日15點的,而中國搜索的最近的新聞是2005年12月5日18:09的,百度最近的是2005年12月5日18:02分,Google則是2005年12月5日早晨的新聞。搜索時間是2005年12月5日21:20。因此從新聞的時效性要求來看,中國搜索和百度的表現(xiàn)最好。再從參考關(guān)鍵詞來看,只有中國搜索提供了參考關(guān)鍵詞,而且其準確度也比較高。

綜合上述信息反饋,中國搜索和百度的表現(xiàn)很不錯,因此,網(wǎng)民們可以采用這兩種搜索引擎搜索新聞。

 

5         音樂搜索的比較

在當今這個經(jīng)濟快速發(fā)展的時代,娛樂業(yè)也發(fā)展得更加迅猛,許多有實力的新歌手層出不窮,給人們忙碌的生活增添了不少色彩。人們在工作學習閑暇聽聽音樂,放松一下自我,緩解一下壓力也變得越來越重要。因此,人們對音樂搜索的需求也越來越大。為此,我們來比較一下四大搜索引擎在音樂搜索方面的表現(xiàn)吧——

隨著韓國電視劇《大長今》的推出,在國內(nèi)翻唱的版本也推出了不少,我們想搜索一下《大長今》所有的翻唱版,其結(jié)果如下:

 

大長今

搜索范圍

搜索結(jié)果

用時

一搜

全部歌曲

906條結(jié)果

0.003秒

中國搜索

全部歌曲

1,389條結(jié)果

0.004秒

百度

全部歌曲

1,770條結(jié)果

0.003秒

Google

 

 

 

表5 音樂搜索的比較(資料來源:一搜,中國搜索,百度,Google)

搜索感受:Google不支持音樂搜索,比較其他三個搜索引擎,從搜索結(jié)果來看,百度的搜索結(jié)果最多,中國搜索其次;從搜索效率來看,“一搜”和百度的速度一樣,中國搜索的速度也慢不了多少。雖然“一搜”搜索的結(jié)果并不如其他兩中搜索引擎,但是“一搜”提供了比較詳細的分類目錄,用戶可以通過分類目錄搜索自己喜歡的歌曲。

綜合上述信息反饋,覺得“一搜”最適合搜索音樂。

6         文擋搜索的比較

互聯(lián)網(wǎng)上除一般網(wǎng)頁外,還有如PDF、DOC、PPT之類的文檔文件,雖然這些文件不像HTM那么多,但這些文件通常會包含一些別處沒有的重要資料,因此具有獨特的價值和吸引力!所以對網(wǎng)絡中這部分資源的挖掘和利用也是搜索引擎的一個重要功能。在四大搜索引擎中支持PDF、DOC、PPT 等文件格式的檢索。但是,除了“一搜”提供了點擊相應格式就可以進行相應文檔搜索的“化繁為簡”式搜索技術(shù)外,其他三個搜索引擎的專業(yè)文檔的搜索過程都比簡單的網(wǎng)頁搜索要復雜得多。他們必須在搜索關(guān)鍵詞中輸入諸如filetype:doc的語法,才能檢索到所需要的專業(yè)文檔。還值得一提的是,因為“一搜”主要是面向中國用戶的,所以這項功能可算是大大彌補了國內(nèi)對專業(yè)文檔搜索服務的空白。由此,我們可以看出,“一搜”在文檔搜索方面最令人滿意。

 

7         商業(yè)信息搜索的比較

“點擊出的財富”是網(wǎng)絡交易的最大魅力!如果我們的輕輕松松一點擊就可以讓我們豁免千萬里的奔波勞苦,幾分鐘的搜索就可以讓我門將商界風云盡收眼底,這是一件多么愜意的事情啊。

經(jīng)過比較,中國搜索以其商業(yè)、行業(yè)搜索引擎提供了繁多產(chǎn)品供應和求購分類、龐大的企業(yè)信息庫、區(qū)域化、時段化的搜索設計,商業(yè)機會、行業(yè)咨詢、技術(shù)文章等輔助信息的提供……這些在搜索用戶角度進行的搜索設計,充分地說明了“專業(yè)”這兩個字。

因此,如果用戶要搜索商業(yè)信息的話,建議大家使用中國搜索引擎。

 

8         輔助信息的比較

生活中我們需要大量的各種各樣的信息,例如旅行前要看看天氣預報、寄信時要知道郵政編碼,遠方的朋友來時提供當?shù)氐娘w機航班、列車時刻表等……這些信息平時看起來作用并不大,但一到用時就缺他不行了。搜索引擎及時應對用戶的需求,提供了輔助信息的搜索。因此我們對四大典型的中文搜索引擎的輔助信息進行比較也是很有必要的。

一搜:提供了一些簡單的輔助信息的搜索。

中國搜索:提供計算器計算表達式,量制轉(zhuǎn)換對不同量制單位之間進行換算,IP查詢,英漢雙向詞典,郵政編碼查詢,電話區(qū)號查詢。

百度:提供的輔助信息搜索包括拼音提示,錯別字提示,英漢互譯詞典,計算器和度量單位的轉(zhuǎn)換,股票、列車時刻表以及飛機航班的查詢,天氣查詢,外匯牌價、電視預報、萬年歷、學歷查詢搜索IP地址以及地區(qū)(郵政編碼和電話區(qū)號)等大量輔助信息的搜索。

Google:提供的輔助信息搜索主要包括拼音漢字的轉(zhuǎn)換,計算器,貨幣轉(zhuǎn)換,錯別字改正,中英文字典,天氣查詢,股票查詢,郵政區(qū)號查詢,手機號碼,列車時刻表和飛機航班的查詢以及一些專用詞匯的定義。

經(jīng)過比較,百度不論在繁多的數(shù)量上,還是多個頗具創(chuàng)新理念的設計上,它都可以算是輔助信息搜索業(yè)界中的經(jīng)典。百度的輔助信息搜索徹底顛覆了人們對搜索引擎只能單一進行網(wǎng)頁搜索的一慣看法。

 

9         參考關(guān)鍵詞的比較

參考關(guān)鍵詞是一條不起眼,卻極其有效的搜索關(guān)鍵詞組成方式,它可以大大提高搜索結(jié)果的質(zhì)量,使搜索的結(jié)果更加精確。對于普通用戶來說,這是一項非常好的,可以開拓關(guān)鍵詞組成思路的搜索功能。對于搜索引擎來說,這卻是一項需要一定智能化的搜索判斷技術(shù),它需要搜索引擎能夠盡可能準確地分析當前用戶輸入的關(guān)鍵詞,并能即時給出盡可能的符合關(guān)鍵詞搜索意圖的參考關(guān)鍵詞。

我們使用“微軟歷史”作為關(guān)鍵詞進行搜索來比較這四個搜索引擎的參考關(guān)鍵詞。結(jié)果如下:

一搜:微軟拼音輸入法,微軟拼音,微軟拼音輸入法2003,中國歷史,微軟輸入法,微軟公司,歷史的天空,更多相關(guān)搜索。

中國搜索:微軟公司的歷史。

百度:微軟的歷史,微軟公司歷史,微軟公司發(fā)展歷史,微軟產(chǎn)品的歷史,微軟 發(fā)展歷史,微軟產(chǎn)品的發(fā)展歷史,微軟,微軟中國,微軟拼音輸入法,更多相關(guān)搜索。

Google:微軟,微軟歷史論壇,歷史,微軟中國歷史,微軟歷史論文,微軟歷史地圖,微軟歷史課件,微軟認證歷史,微軟中國,歷史論文。

對比結(jié)果,一搜給出的參考關(guān)鍵詞的確很多,但是都是關(guān)于“微軟”的,因此失誤也很大,沒有一個是我們想要的結(jié)果;百度搜索給出的關(guān)鍵詞質(zhì)量最好、最準確,其中除了最后一個關(guān)鍵詞與我們想要的內(nèi)容的聯(lián)系不大之外,其他的都與我們想要搜索的內(nèi)容有比較緊密的聯(lián)系。此外,Google的參考關(guān)鍵詞給得也比較令人滿意。但是相比之下,我們還是更加樂意使用百度搜索。

 

三、結(jié)論

根據(jù)上面對四大典型中文搜索引擎的比較,我們可以得出這樣的結(jié)論,搜索圖片信息、商業(yè)信息和新聞信息時,采用中國搜索;如果就一般的關(guān)鍵詞和技巧性關(guān)鍵詞搜索,采用中國搜索;搜索音樂信息、文檔信息時,使用一搜;搜索新聞信息和輔助信息,采用百度;搜索輔助信息也可以采用Google;如果你覺得你輸入的關(guān)鍵詞不夠準確,需要參考關(guān)鍵詞幫助你搜索,那么你可以采用百度。

 

主要參考文獻:

[1] 國內(nèi)中文搜索引擎比較研究[J/OL] http://www./eschool/includes/zhuanti/book/200410/sousuo/index.shtml.

[2] 陳晉.國內(nèi)中文搜索引擎現(xiàn)狀及檢索技巧[J/OL].福建師范大學圖書館.

[3] 彭敏.互聯(lián)網(wǎng)文獻資源的索取[J].現(xiàn)代情報.2005,(7):178-179.

[4] 搜索革命.[EB].博客科技網(wǎng).2005.

[5] 刑志宇.重要的網(wǎng)絡檢索方法[EB].http://www.yushtrip.com/showWeb/0/3/23451.aspx.

[6] 文獻搜索方法概述[EB].http://www.yushtrip.com/showWeb/0/3/23460.aspx.

[7] 統(tǒng)計、事實和有機的搜索引擎優(yōu)化[EB].http://www.yushtrip.com/showWeb/0/0/27122.aspx.

[8] 張帆.朱紅濤. 基于關(guān)鍵詞的網(wǎng)絡信息檢索優(yōu)化探索[J].情報科學.2005,23(6):912-916. 

[9] 井底之蛙的檢索經(jīng)驗[EB].http://www.yushtrip.com/showWeb/0/3/23453.aspx.

[10] 康桂英.張帆等.新一代搜索引擎網(wǎng)典研究[J].情報理論與實踐.2000,23(3):218-220.

[11] 張帆.信息存儲與檢索[M].北京:高等教育出版社,2003:214-271. 

[12] 張朝陽在國內(nèi)最早推出中文搜索引擎.[EB].http://www.yesky.com/Etimes/74872343805034496/20000730/101134.shtml.

[13] 鄧錦月.互聯(lián)網(wǎng)搜索的發(fā)展.[EB] http://cisnet.blogchina.com/576094.html

 

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多