免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

[搜索技術(shù)]搜索引擎從入門到精通

 Enprince 2011-08-09

搜索引擎從入門到精通

陸元婕 2001.12

搜索引擎從入門到精通之一 基礎(chǔ)篇


  美美(15歲)愛上網(wǎng),通常她就是泡聊天室、看新聞、玩網(wǎng)絡(luò)游戲之類的,時(shí)間一長,覺得有些無聊了。這天美美問:“妮妮表姐,你整天上網(wǎng)做什么呢?”妮妮說:“上網(wǎng)查資料呀。查資料?”“怎么查?上哪查?……”美美一連串的疑問。妮妮說:“查資料當(dāng)然是要用搜索引擎啊。我平時(shí)寫論文用的資料、做主頁用的圖片、電腦知識(shí)、甚至電子版的小說、最新的CD試聽都是通過搜索引擎找到的。還有,我的主頁這半年訪問量劇增,也要?dú)w功于搜索引擎啊。”

  搜索引擎?美美覺得挺奇怪的:“這搜索引擎有這么大威力?嗯,我也要學(xué)習(xí)用搜索引擎。”“可以啊,不過,最近我挺忙的,要不,先讓小張(妮妮的男朋友)教你一些基本知識(shí)吧。”

  “美美,學(xué)習(xí)使用搜索引擎先要了解一些基本知識(shí),可是有點(diǎn)枯燥哦,要有心理準(zhǔn)備喲。”小張?jiān)谂赃吅俸俚男χ?。美美嘴里哼了哼?#8220;誰怕呀,來吧。”小張清了清嗓子,開始了講解:

  “十幾年前,WWW(World Wide Web,萬維網(wǎng))還沒有出生的時(shí)候,互聯(lián)網(wǎng)上只有冰冷的文字,沒有圖像和聲音,而且網(wǎng)站數(shù)量也不多,感興趣的網(wǎng)站就那么幾個(gè),可以在很短的時(shí)間內(nèi)就掌握其中的全部信息,搜索引擎完全沒有出現(xiàn)的必要。1993年,互聯(lián)網(wǎng)上出現(xiàn)了最早的Web瀏覽器Mosaic,次年Netscape推出了Navigator。瀏覽器的發(fā)展促使Web得到迅速推廣,站點(diǎn)數(shù)目以驚人的速度增加,我們再也不能用傳統(tǒng)記憶方式來應(yīng)付與日俱增的站點(diǎn)。于是,搜索引擎就誕生了。第一個(gè)搜索引擎的出生地在美國,它的名字叫Archie,是由McGill大學(xué)的一個(gè)小組開發(fā)的。”

  “早期的搜索引擎是把互聯(lián)網(wǎng)中資源服務(wù)器的地址收集起來,由其提供資源的類型不同而分成不同的目錄,再一層層地進(jìn)行分類。人們要找自己想要的信息可按它們的分類一層層進(jìn)入,就能最后到達(dá)目的地,找到自己想要的信息。這種方式,只適用于互聯(lián)網(wǎng)信息并不多的時(shí)候。”

  “隨著互聯(lián)網(wǎng)的信息按幾何式增長,搜索引擎開始快速發(fā)展。1994年春天,世界上出現(xiàn)了真正意義上的搜索引擎——Lycos。隨著Yahoo!的出現(xiàn),搜索引擎的發(fā)展也進(jìn)入了黃金時(shí)代。搜索引擎家族不斷發(fā)展壯大,逐漸分布到信息世界的各個(gè)角落,它們的種類、技術(shù)也在不斷的發(fā)生變化。”

  美美聽了半天,嘴越張?jiān)酱螅?#8220;哇,沒想到搜索引擎也有這樣的歷史呀。”

  “那當(dāng)然了,別打岔,下面要講搜索引擎的分類及原理了,仔細(xì)聽著。”

  “盡管目前存在數(shù)量眾多的搜索引擎,但按照它們信息搜集方法和服務(wù)提供方式的不同,可以大致劃分為三大類型。”

  “我們先來講講基于蜘蛛程序的的機(jī)器人搜索引擎,這種搜索引擎由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序自動(dòng)訪問Web站點(diǎn),提取站點(diǎn)上的網(wǎng)頁,并根據(jù)網(wǎng)頁中的鏈接進(jìn)一步提取其它網(wǎng)頁,或轉(zhuǎn)移到其它站點(diǎn)上。由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。”

  美美又忍不住了:“太難了,我聽不懂。”

  “聽起來感覺很復(fù)雜吧?簡單講,就是由程序自動(dòng)抓去網(wǎng)上的信息,‘搜索引擎’這個(gè)詞的原義就是指這種狹義的搜索引擎。”

  “該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista、Excite、Inktomi、FAST、Lycos、Google;國內(nèi)代表為:百度、OpenFind等。”

  “哦,我這下我明白了,而且我還知道Google呢,好有名的。呵呵!你接著講吧。”美美終于弄懂了。

  “接著給你講引擎目錄式搜索引擎,它是以人工方式或半自動(dòng)方式搜集信息,由編輯人員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類搜索引擎的國外代表是:Yahoo、LookSmart、Open Directory等;國內(nèi)代表有新浪網(wǎng)、搜狐等的網(wǎng)站目錄。”

  “美美,美美,哎,你在干嘛喲,睡著了?”
  “哪里呀,我只是在想它和前面那種搜索引擎有什么不同嘛!”

  “哦,我正要講呢。目錄的數(shù)據(jù)庫是依靠專職編輯或志愿人員建立起來的,這些編輯人員在訪問了某個(gè)Web站點(diǎn)后撰寫一段對(duì)該站點(diǎn)的描述,并根據(jù)站點(diǎn)的內(nèi)容和性質(zhì)將其歸為一個(gè)預(yù)先分好的類別,把站點(diǎn)的URL和描述放在這個(gè)類別中,當(dāng)用戶查詢某個(gè)關(guān)鍵詞時(shí),搜索軟件只在這些描述中進(jìn)行搜索。”

  “目錄的用戶界面基本上都是分級(jí)結(jié)構(gòu),首頁提供了最基本的幾個(gè)大類的入口,用戶可以一級(jí)一級(jí)地向下訪問,直至找到自己感興趣的類別,另外,用戶也可以利用目錄提供的搜索功能直接查找一個(gè)關(guān)鍵詞,不過,由于目錄只在保存的對(duì)站點(diǎn)的描述中進(jìn)行搜索,因此站點(diǎn)本身的動(dòng)態(tài)變化不會(huì)反映到搜索結(jié)果中來,這也是目錄與基于Robot的搜索引擎之間的一大區(qū)別。”

  “最后要講的是Meta元搜索引擎,它的特點(diǎn)是本身并沒有存放網(wǎng)頁信息的數(shù)據(jù)庫,當(dāng)用戶查詢一個(gè)關(guān)鍵詞時(shí),它把用戶的查詢請求轉(zhuǎn)換成其它搜索引擎能夠接受的命令格式,并訪問數(shù)個(gè)搜索引擎來查詢這個(gè)關(guān)鍵詞,并把這些搜索引擎返回的結(jié)果經(jīng)過處理后再返回給用戶。對(duì)于返回的結(jié)果系統(tǒng)會(huì)進(jìn)行重復(fù)排除、重新排序等處理。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等,國內(nèi)的一網(wǎng)打盡、颶風(fēng)搜索通等提供類似的功能。”

  “我真不知道搜索引擎還有這么多名堂呀,真是長了見識(shí)。”美美感嘆道。

  “呵,這還只是開始呢,今天我們就到這兒了,你也該休息了,下次我們再繼續(xù)吧。”

 


搜索引擎從入門到精通之二 基本方法篇


  上次在基礎(chǔ)篇中我們已經(jīng)向大家介紹了搜索引擎的歷史以及分類,讓同學(xué)們對(duì)搜索引擎有了一個(gè)基本的了解,今天 我們就來向大家介紹搜索引擎使用的基本方法?,F(xiàn)在就跟我來吧。
  
  又是周末了,美美大清早就從床上起來,她還一直惦記著學(xué)習(xí)搜索引擎的事呢,趕緊找來妮妮姐和小張哥,催著他們開始講課??粗烂赖姆e極樣,小張和妮妮只好從命。

  “目錄式搜索引擎最簡單的搜索方法就是掌握它的目錄分類原則,確定你要找的網(wǎng)站應(yīng)該在哪個(gè)分類,然后逐級(jí)點(diǎn)擊尋找。這種方法在你需要尋找某一類網(wǎng)站時(shí)效果較好,不過,這里必須提醒同學(xué)們的是:各搜索引擎的目錄分類原則不盡相同,而且還經(jīng)常變化,并且隨著網(wǎng)站數(shù)量呈幾何級(jí)數(shù)增長,你需要點(diǎn)擊翻找的頁數(shù)也會(huì)越來越多。

  如果我們需要根據(jù)一些特定的條件來搜索,就最好使用關(guān)鍵詞搜索的方法,現(xiàn)在就跟我一起來學(xué)習(xí)一些基本的搜索的數(shù)學(xué)規(guī)則,以便使搜索結(jié)果更迅速準(zhǔn)確。下面Google為例來介紹。”

一、查詢條件具體化

  “你的查詢條件越具體,你就越容易找到你需要的資料。所以別怕在搜索引擎中輸入有點(diǎn)復(fù)雜的搜索條件。”

  “舉例來講,如果你想找一些有關(guān)‘Excel的數(shù)學(xué)函數(shù)的使用方法’的資料,你可搜索 ‘Excel數(shù)學(xué)函數(shù) ’(Excel和數(shù)學(xué)函數(shù)之間用空格隔開),不要僅查詢‘Excel’。試比較這兩種查詢所返回的結(jié)果。第一種搜索條件返回了64項(xiàng)搜索結(jié)果,而第二種搜索條件返回了3,100,000項(xiàng)搜索結(jié)果。顯然輸入較具體的條件可以過濾掉大量的無用信息,從而減少我們的工作量。”

二、使用加號(hào)

  “有時(shí)我們需要搜索結(jié)果中包含有查詢的兩個(gè)或是兩個(gè)以上的內(nèi)容,這時(shí)我們可以把幾個(gè)條件之間用“ ”號(hào)相連。比如說想查詢王菲的歌曲《香奈兒》,你可以輸入
‘王菲 香奈兒’(小張此時(shí)在屏幕上兩個(gè)詞之前輸入的是空格)……”小張剛要繼續(xù)往下講時(shí),美美喊了起來:“等一下!”

  “怎么了,哪兒不對(duì)嗎?”小張問。妮妮也奇怪的看著美美。 “哎,為什么你在兩個(gè)詞語之間輸入的是空格而不是‘ ’號(hào),空格和加號(hào)不一樣啊。”

  小張和妮妮相視一笑。“我來解釋一下吧,”妮妮站起來說,“美美觀察得很仔細(xì),學(xué)得很認(rèn)真。其實(shí)大多搜索引擎用空格的查詢結(jié)果和用加號(hào)是相同的,這方面可以參看具體的搜索引擎的幫助說明。再說明一下吧,省的美美越聽越糊涂。小張介紹的是搜索的基本數(shù)學(xué)規(guī)則,這些規(guī)則表現(xiàn)在不同的搜索引擎中是有少量的差別的。所以,美美要想真正的會(huì)使用各種搜索引擎,還是要好好看看各搜索引擎的搜索幫助,要記住哦。”

  “嗯,知道了。小張,繼續(xù)講吧。”

三、使用減號(hào)-

  “有時(shí)你可能在查詢某個(gè)題材時(shí)并不希望在這個(gè)題材中包含另一個(gè)題材,這時(shí)你就可以使用減號(hào)了。”

  “什么嘛?這么復(fù)雜,講簡單一點(diǎn)啊。”

  “別急,舉個(gè)例子就明白了。比如你想查找‘劉德華的歌曲《享用你的姓》’,但又不希望得到的結(jié)果是RM格式(Realplayer)的。你就可以輸入“劉德華 歌曲 享用你的姓 -RM”,記住一定要在減號(hào)前留一個(gè)空格位。”

  “哦,原來是這樣,我來試試看。嗯,真的不錯(cuò)耶,搜索結(jié)果比不用減號(hào)時(shí)少多了。”

  “是的,減號(hào)的作用就在于可以使搜索結(jié)果集中反映你的需求,讓你無須為大量無關(guān)的搜索結(jié)果而頭疼。”

四、使用引號(hào)“”

  “你已經(jīng)學(xué)會(huì)加法與減法,現(xiàn)在可以學(xué)乘法了,在搜索引擎中,乘法的公式是:‘短語’。使用這一公式可以保證你的搜索結(jié)果非常準(zhǔn)確。因?yàn)椋词故怯蟹衷~功能的搜索引擎也不會(huì)對(duì)引號(hào)內(nèi)的內(nèi)容進(jìn)行拆分。在很多搜索引擎中,給這種查詢方式起名叫短語查詢,或者專用詞語查詢。這一方法在查找名言警句或?qū)S忻~時(shí)顯得格外有用。

  美美這時(shí)插了一句:“什么叫分詞功能啊,介紹一下嘛!”

  “看你急的,簡單來講分詞就是把詞語進(jìn)一步劃分。比如,將一個(gè)長的詞組甚至句子分成多個(gè)詞語。分詞的方法有很多,比如最小分詞法、最大分詞法之類的。分詞技術(shù)主要是用在像中文、日文這樣的亞洲語言。因?yàn)檫@些語言字與字之間,詞與詞之間是沒有空格的,它在搜索引擎中的應(yīng)用也是最近幾年的事情了。像Google可以對(duì)中文句子作智能化處理,會(huì)自動(dòng)把句子分割成詞語作為關(guān)鍵詞。”

  “明白了,你繼續(xù)說吧。“

  “好,我們還是言歸正傳。其實(shí),關(guān)于基本的數(shù)學(xué)規(guī)則已經(jīng)講得差不多了。在有些搜索引擎中還會(huì)支持什么通配符之類的,因?yàn)椴⒉黄毡?,就不多說了。美美,多多練習(xí)一下。試著用這些原則在搜索引擎中找找你將來想考的大學(xué)的網(wǎng)站吧。”

  “好的,謝謝小張。我去試試了。”美美去練習(xí)了。過了一會(huì),她又垂頭喪氣的來找妮妮:“妮妮,很奇怪啊,怎么這些方法不好用呢?我還是找不到要找的資料。” 妮妮笑著說:“別急別急,搜索是有很多技巧的。不過,美美,最好你能把要搜索的問題列出來,我好有針對(duì)性地介紹。”

  “嗯,謝謝妮妮。那么我去把問題寫出來吧……”


搜索引擎從入門到精通之三 使用技巧篇


  “美美,問題列出來了嗎?”
  “嗯,給你看吧。大部分都不是我想要找的。搜索引擎還是不好用。”
  “美美,別急,會(huì)有辦法的,我們一起來找找看。”

  司坦福大學(xué)——用Google、新浪都沒找到與之相符的網(wǎng)頁
  歌星王菲 精選專輯 -rm——用新浪和Google都沒找到有價(jià)值的結(jié)果
  世界杯預(yù)選賽 最新新聞——用Google找的都是舊聞。用新浪倒是找到了一些,可是點(diǎn)擊過去一看鏈接的不對(duì)啊。
  大連 天津街 地圖——用Google、新浪都查不到有用的信息。
  IT 新聞——在Google中給出的都只是新聞,而沒有IT業(yè)的新聞。不過新浪倒是不錯(cuò),有相關(guān)的新聞。

  看到美美的這張問題列表,小張和妮妮私下研究了一會(huì)。 “這些其實(shí)不難找。先讓小張給你介紹一些基本的搜索技巧吧。然后我們再實(shí)戰(zhàn)演練幾番。”

  “好啊,真的能很快就學(xué)會(huì)搜索嗎?我會(huì)努力的?,F(xiàn)在開始吧……”

一、選擇合適的搜索工具

  “每種搜索引擎都有不同的特點(diǎn),只有選擇合適的搜索工具才能得到最佳的結(jié)果。之前已經(jīng)介紹過了搜索工具基本上可以分為網(wǎng)頁檢索(也就是上次說的基于蜘蛛程序的機(jī)器人檢索系統(tǒng))和分類目錄(即目錄式搜索引擎)兩種(我們先不談元搜索引擎)。”
  “網(wǎng)頁檢索實(shí)際上是網(wǎng)頁的完全索引。分類目錄則是由人工編輯整理的網(wǎng)站的鏈接。”
  “這兩種搜索工具哪種好用呢?”

  “這取決于你想查詢的問題。一般來說,如果你需要查找非常具體或者特殊的問題,用網(wǎng)頁檢索比較合適;如果你希望瀏覽某方面的信息、專題或者查找某個(gè)具體的網(wǎng)站,分類目錄會(huì)更合適。”

  “要是你需要查找的是某些確定的信息,比如Mp3、地圖等,就最好使用專門的Mp3、地圖等搜索引擎。”

  “有這樣的專業(yè)搜索引擎嗎?”

  “當(dāng)然,實(shí)際上幾乎每一類信息都有非常專業(yè)的搜索工具,它們有個(gè)名稱叫垂直搜索引擎。比如賽迪網(wǎng)的IT羅盤就是以精選式IT垂直搜索為特征的搜索引擎。”

二、使用正確的搜索詞

  “使用搜索引擎要注意不能寫錯(cuò)別字,此外要盡量使用大家比較常用的詞語。”
  “這是為什么呢?”
  “就目前而言,多數(shù)搜索引擎不支持容錯(cuò)查詢。所以,一定要注意不寫錯(cuò)別字。”

  “容錯(cuò)查詢,就是指即使用戶輸入了錯(cuò)別字,搜索引擎也能根據(jù)某種規(guī)則推斷出該詞的正確寫法,給出正確的搜索結(jié)果。”

  “由于互聯(lián)網(wǎng)的信息是人來提交的,如果你使用了不常用的詞語來搜索,就不大容易找到答案了。比如,你想查有關(guān)鼠標(biāo)的信息,但輸入的是‘滑鼠’(港臺(tái)地區(qū)用語),就不容易找到資料了。”

三、正確使用布爾檢索

  “正確的使用布爾檢索方式可以減少搜索結(jié)果的返回?cái)?shù)。”
  “什么是布爾檢索?我好像沒聽過”。

  “布爾檢索,就是應(yīng)用布爾表達(dá)式的檢索方式,比如‘和’(And)、‘或‘(OR)、‘非’(NOT)。其實(shí)前面介紹的搜索的數(shù)學(xué)規(guī)則就是這種布爾檢索。加號(hào)就相當(dāng)于和,減號(hào)就相當(dāng)于非。而或關(guān)系沒有介紹,它并不是很常用的檢索規(guī)則。在搜索時(shí)一方面要注意不同搜索引擎工具的布爾檢索的表達(dá)方法。另一方面,也要注意自己要搜索的內(nèi)容邏輯關(guān)系是否合理。”

四、在點(diǎn)擊之前要思考

  “成功的搜索=正確的提問 點(diǎn)擊有用的結(jié)果。”
  “這么深?yuàn)W?解釋一下吧。”
  “就是說要想得到滿意的搜索結(jié)果除了要注意搜索條件之外,還取決于你最終點(diǎn)擊的那個(gè)搜索結(jié)果。” “在返回的搜索結(jié)果中究竟哪個(gè)是真正滿意的?在點(diǎn)擊之前,你需要通過比較排序位置、網(wǎng)址鏈接、文字說明等來分析。關(guān)于這方面的知識(shí)我們在實(shí)戰(zhàn)演練時(shí)再學(xué)習(xí)。”

五、在實(shí)踐中取得搜索經(jīng)驗(yàn)

  “搜索技巧和其他的技術(shù)一樣是在不斷練習(xí)中總結(jié)與成熟起來的。因此你必須不斷練習(xí)、不斷總結(jié)。”

  “同時(shí),通過練習(xí)總結(jié),你可以形成自己的一套有效的搜索習(xí)慣。這將有助于更快的完成搜索。好像美美現(xiàn)在這樣,遇到一點(diǎn)困難就打了退堂鼓,可是不行的。”

  “好了,基本的搜索技巧先講到這,關(guān)鍵還是多加練習(xí)。我們就以美美在搜索時(shí)遇到的那幾個(gè)問題試一下這些搜索技巧吧。” “先讓我來試試。我好像已經(jīng)找到一些原因了。”
  “那就說說看吧。”
  “司坦福大學(xué),是錯(cuò)別字。應(yīng)該是斯坦福大學(xué)。”

  “歌星王菲 精選專輯 –rm,是不是搜索條件太多?試一下,輸個(gè)簡單點(diǎn)的‘王菲 專輯 –rm’,找到了。”

  “不僅是這個(gè)原因。你要搜索的關(guān)鍵字要符合習(xí)慣。這方面,新浪的幫助信息的有介紹。”

  “世界杯預(yù)選賽 最新新聞。這個(gè)問題怎么解決呢?”

  “用Google找到的結(jié)果確實(shí)是比較舊,因?yàn)槟壳癎oogle的搜索數(shù)據(jù)庫的更新是每月一次(平均為28天),所以顯然用它來搜索新聞是不合適的。”

  “而你在新浪遇到的是死鏈問題。死鏈對(duì)于搜索引擎而言是很正常的,這不是我?guī)退阉饕骈_脫。實(shí)在是因?yàn)榛ヂ?lián)網(wǎng)的信息更新的太快,它不容易抓取。除了死鏈問題,以后你還會(huì)遇到很多屬于搜索引擎的不足之處,比如它對(duì)于動(dòng)態(tài)網(wǎng)頁處理能力不強(qiáng)之類的。”

  “那有辦法找到這些死鏈的內(nèi)容嗎?”

  “辦法有一些。比如google就采用了網(wǎng)頁快照的技術(shù)。這個(gè)我們會(huì)在實(shí)戰(zhàn)演練中詳細(xì)介紹。”

  “另一個(gè)辦法是:運(yùn)用一些偵察技巧,加上你的好運(yùn)氣,有可能會(huì)找到。”
  “什么偵察技巧?”
  “由于死鏈有時(shí)是因?yàn)榫W(wǎng)站制作者將文件更換路徑而搜索引擎沒有及時(shí)更新造成的。”

  “據(jù)此,我們可以使用一種叫做‘URL退選’的方法。也就是將地址欄的網(wǎng)址的文件名一點(diǎn)點(diǎn)刪除,在碰到第一個(gè)斜杠后停止,然后敲回車鍵。重復(fù)此動(dòng)作,不斷嘗試。運(yùn)氣夠好的話,就能找到了。”

  “聽起來很復(fù)雜啊。”

  “要是你了解一些網(wǎng)站發(fā)布的知識(shí)會(huì)比較容易懂。雖然這種辦法并不總有效,但是還是值得嘗試的。”

  “大連 天津街 地圖,這個(gè)是不是該用地圖搜索引擎?”
  “對(duì)。比如Go2Map,ChinaQuest之類的地圖搜索引擎就能查到。”
  “IT 新聞,為什么會(huì)查不到呢?”
  “這個(gè)估計(jì)是因?yàn)镾topWords造成的。”
  “什么是StopWords?”

  “這個(gè)涉及一些搜索技術(shù)方面的知識(shí)了。就拿英文而言,有大約300個(gè)最常用單詞本身缺乏實(shí)際意義或者使用過于廣泛,一旦用來搜索的話,會(huì)返回大量的無用的搜索結(jié)果甚至導(dǎo)致搜索引擎錯(cuò)誤。因此很多搜索引擎都會(huì)屏蔽這些關(guān)鍵詞。”

  “那在新浪怎么就能找到呢?”
  “新浪能夠給出正確結(jié)果可能與它的搜索引擎服務(wù)提供商百度的技術(shù)有關(guān)。”
  “太好了,我的問題幾乎都解決了。我還想學(xué)習(xí)更多的搜索知識(shí)呢?你們繼續(xù)教我啊。”

  “可以啊,下一次我們會(huì)介紹幾個(gè)比較常用的搜索引擎。”


搜索引擎從入門到精通之四 Google實(shí)戰(zhàn)篇


  “妮妮,今天給我講講Google吧?聽說它是目前最好用的搜索引擎之一。”

  “好。Google的確是非常好用的搜索引擎。我記得Google由兩個(gè)斯坦福大學(xué)博士生Larry Page和Sergey Brin設(shè)計(jì),于1998年9月發(fā)布測試版,一年后正式開始商業(yè)運(yùn)營。Google發(fā)布至今才不過短短幾年,就由于對(duì)搜索引擎技術(shù)的創(chuàng)新而獲獎(jiǎng)無數(shù)。它最擅長的是易用性和高相關(guān)性。”

  “不僅如此,”,小張接過話題說,“Google提供一系列革命性的新技術(shù),包括完善的文本對(duì)應(yīng)技術(shù)和先進(jìn)的Page Rank排序技術(shù),還有非常獨(dú)特的網(wǎng)頁快照、手氣不錯(cuò)等功能。此外還有很多英文站點(diǎn)的獨(dú)有功能,比如電話搜索、地圖搜索等等。” “嗯,我在它的網(wǎng)站幫助中看到過一些介紹,可是有些地方還是搞不大明白究竟該怎么用。要不,妮妮就結(jié)合實(shí)際例子給我講講吧。”

Google入門知識(shí)

  “Google支持大多數(shù)的搜索基本語法規(guī)則,比如‘ ’、‘-’、‘OR’。Google無需用明文的‘ ’來表示邏輯‘與’操作,只要空格就可以了。Google用減號(hào)‘-’表示邏輯‘非’操作。Google用大寫的‘OR’表示邏輯‘或’操作。”

  “需注意的是,Google不支持通配符,如‘*’、‘?’等,只能做精確查詢。Google對(duì)英文字符大小寫不敏感,‘GOD’和‘god’搜索的結(jié)果是一樣的。Google的關(guān)鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關(guān)鍵字,必須加英文引號(hào)。”

  “這些知識(shí)在Google的幫助中都可以看到詳細(xì)的例子,想來美美一定看得懂,我就不在這舉例了。”

Google特色服務(wù)

  “Google提供很多非常有特色的功能,比如前面介紹的‘網(wǎng)頁快照’,‘手氣不錯(cuò)’等。這些輔助功能會(huì)幫助使用者更快速、方便的找到需要的資料。”


  “比如Google的專利網(wǎng)頁級(jí)別技術(shù)Page Rank能夠提供高命中率的搜索結(jié)果; Google的搜索結(jié)果摘錄查詢網(wǎng)頁的部分具體內(nèi)容,而不僅僅是網(wǎng)站簡介;Google智能化的‘手氣不錯(cuò)’功能,提供可能最符合要求的網(wǎng)站;Google的‘網(wǎng)頁快照’功能,能從Google服務(wù)器里直接取出緩存的網(wǎng)頁。”

  “咦,美美你在想什么?”
  “這些特色服務(wù)聽起來是不錯(cuò),可是有什么用呢?比如‘網(wǎng)頁快照’?”

  “還記得上一次你遇到過的死鏈問題嗎?你想,要是有這個(gè)網(wǎng)頁快照的功能,即使是死鏈不也可以看到具體的網(wǎng)頁內(nèi)容了嗎。”

  “有道理啊。那Google要有多少地方放這些網(wǎng)頁啊。”
  “據(jù)說,今年上半年,Google就宣稱有超過1萬臺(tái)服務(wù)器了。”

Google高級(jí)搜索

  “Google支持很多高級(jí)搜索的語法格式,比如site、link等。這方面挺復(fù)雜的,你還是看看這個(gè)表格自己試試看吧。”

  “對(duì)了,表格中所列出的也是一些比較常用的語法規(guī)則,更多特殊的用法還需要在實(shí)踐中慢慢積累。”

特殊操作符 語法說明 語法規(guī)則 注意事項(xiàng) 用法舉例
site 搜索結(jié)果局限于某個(gè)具體網(wǎng)站或者網(wǎng)站頻道。 site頻道名.網(wǎng)站名.域名
如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”。
 
網(wǎng)站域名不能有“http”以及“www”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。 搜索包含“劉德華”和“張學(xué)友”的中文新浪網(wǎng)站頁面,搜索:
劉德華 張學(xué)友site:sina.com.cn

 
link 返回所有鏈接到某個(gè)URL地址的網(wǎng)頁 link:頻道名.網(wǎng)站名.域名 “link”不能與其他語法相混合操作,所以“link:”后面即使有空格,也將被忽略。 搜索所有含指向Google “www.google.com”鏈接的網(wǎng)頁
link:www.goole.com
 
inurl 返回的網(wǎng)頁鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接或者網(wǎng)頁文檔中 inurl:關(guān)鍵字1 關(guān)鍵字2 “inurl:”后面不能有空格,Google也不對(duì)URL符號(hào)如“/”進(jìn)行搜索。Google對(duì)“cgi-bin/phf”中的“/”當(dāng)成空格處理。 查賽迪網(wǎng)站上關(guān)于Excel函數(shù)的資料。
inurl:excel 函數(shù) www.ccidnet.com
 

 

Google特殊功能

  “上面介紹的是一些Google的綜合搜索使用方法方面的內(nèi)容。隨著Google的不斷發(fā)展,它也逐漸開始提供更多的垂直搜索的功能。比如目錄服務(wù)、新聞組檢索、PDF文檔搜索、地圖搜索、電話搜索、圖像搜索,還有工具條、搜索結(jié)果翻譯、搜索結(jié)果過濾等更多的功能。”

  “哇, Google有這么多功能?天,要講多久才能講完啊。”
  “是呀,所以……”,妮妮神秘的一笑,“我和小張決定不再講Google了,我們把這些功能的網(wǎng)址給你,你自己摸索使用,到時(shí)候也教教我們。因?yàn)?,其?shí)很多功能我們也還沒用呢。”

分類目錄 http://directory.google.com/
工具條 http://toolbar.google.com/
新聞組 http://groups.google.com/
PDF搜索語法規(guī)則:inurl:pdf 搜索內(nèi)容
圖像搜索 http://images.google.com/
搜索結(jié)果翻譯 http://www.google.com/preferences
更多搜索內(nèi)容 http://www.google.com/


搜索引擎從入門到精通之五 國內(nèi)篇


  “妮妮,Google真的很好用,這些日子仔細(xì)研究,嘻嘻,不好意思,就是試了試Google的功能,越來越喜歡用了??墒?,Google到底是國外的產(chǎn)品,國內(nèi)的搜索引擎有沒有類似的呢?”

  “看來美美很……啊。要說國內(nèi)的搜索引擎不能不提百度。年輕的百度公司自2000年6月起迅速地拿下了硅谷動(dòng)力、Chinaren、搜狐、新浪、21CN、廣州視窗、263、TOM等門戶網(wǎng)站的全文搜索引擎服務(wù),成為中文檢索市場中的佼佼者。百度的成功不但使中國網(wǎng)民有更好的搜索體驗(yàn),也激勵(lì)了同行的進(jìn)取心,使得國內(nèi)中文搜索引擎的發(fā)展進(jìn)入你爭我趕的良性發(fā)展時(shí)代。”

  “啊,那么多著名的網(wǎng)站的搜索引擎原來使用的是同一家搜索引擎服務(wù)公司的服務(wù)啊。那豈不是用哪個(gè)都一樣了。” “不完全如此。大部分網(wǎng)站使用的是百度公司的網(wǎng)頁搜索服務(wù),并且這一服務(wù)也是按照各個(gè)網(wǎng)站的個(gè)性化要求重新設(shè)定的,因此仍然是各具特色。”

  “咦,你好象沒有提到網(wǎng)易和Yahoo?”

  “美美果然是變成搜索通了,網(wǎng)易、Yahoo使用的是Google的網(wǎng)頁搜索服務(wù)。”小張說。

  “原來如此。”

  “既然美美已經(jīng)掌握了大部分的搜索方法與技巧,我看在各家搜索引擎的使用方面由美美自己練習(xí)就可以了。我們主要介紹一下各家搜索引擎的特點(diǎn)吧。
你看呢,妮妮?” “好,那我們就介紹幾家比較有代表性的吧。就介紹新浪、網(wǎng)易、搜狐、263。”

新浪

  “新浪搜索是目前互聯(lián)網(wǎng)上規(guī)模最大的中文搜索引擎之一,網(wǎng)站收錄資源豐富,以中文網(wǎng)站GB碼為主。分類目錄規(guī)范細(xì)致,層次合理,遵循中國用戶習(xí)慣。”

  “去年,也就是2000年11月,新浪搜索推出了新一代綜合搜索引擎,這可是中國第一家可多個(gè)數(shù)據(jù)庫查詢的綜合搜索引擎啊。”

  “綜合搜索是怎么回事?”

  “所謂綜合搜索就是一次輸入搜索關(guān)鍵詞,符合查詢條件的搜索結(jié)果,不管它是新聞、網(wǎng)站還是網(wǎng)頁都會(huì)顯示在用戶眼前。”

  “噢,這多方便啊。連新聞都可以搜出來?”

  “是。全新的新浪綜合搜索方便實(shí)用,省卻了用戶分門別類搜索的麻煩.這些全方位的資訊依照與搜索條件符合的程度排列,在保持快速、準(zhǔn)確的基礎(chǔ)上,給用戶提供了更多的選擇。”

  “這挺抽象的。讓我來試一下,在新浪搜索中輸入‘劉德華’,天啊,不僅可以查到關(guān)于劉德華的網(wǎng)站,還可以搜索到關(guān)于劉德華的最新動(dòng)態(tài)、照片等等許多信息。太好了。”

  “同樣的,搜索‘mp3’,就可以輕而易舉地搜出各種關(guān)于mp3的目錄和網(wǎng)站;mp3播放機(jī)的圖片;在新浪內(nèi)容板塊中找到諸如:最新的mp3播放軟件、mp3播放機(jī)、MP3的數(shù)碼相機(jī)等及時(shí)、詳盡的相關(guān)信息;在商品信息中了解最新mp3產(chǎn)品的品牌、價(jià)格、技術(shù)參數(shù)等資料。”

  “新浪搜索還有一些特點(diǎn)。比如,在搜索結(jié)果相關(guān)方面提供與所搜索的關(guān)鍵詞最為相關(guān)的部分內(nèi)容供選擇。當(dāng)搜索‘oicq’時(shí),在給出包含符合搜索要求的目錄、網(wǎng)站、新浪內(nèi)容、商品信息等綜合結(jié)果外,還會(huì)根據(jù)以往用戶的搜索習(xí)慣提供諸如:icq、騰訊、oicq工具、騰訊oicq、oicq下載等相關(guān)的關(guān)鍵詞供選擇,如果用戶正好接下來想搜oicq工具的相關(guān)內(nèi)容,只要在網(wǎng)頁上給出的oicq工具這個(gè)詞上輕輕一點(diǎn)就可以了。”

  “對(duì)了,其實(shí)關(guān)于相關(guān)關(guān)鍵詞這一技術(shù)可并非是新浪獨(dú)有的,其實(shí)這是百度公司的技術(shù),所以,百度的客戶,比如搜狐、263等都有這一功能。”

  “此外,新浪搜索特別設(shè)有搜索論壇,如果用戶在搜索中有什么不明白的地方,或是有一時(shí)搜不到的東西,到搜索論壇中提問,就立即會(huì)有熱心網(wǎng)友解答,形成了一種搜索教幫的文化。”

  “是啊,搜索論壇可是很有人氣的啊。其實(shí),我和小張的很多搜索知識(shí)都是從論壇里學(xué)來的。搜索論壇里的VIP網(wǎng)友以及壇主可都是知識(shí)豐富的搜索高手呢,比如搜索引擎9238、shuxun、wyle等等。”

網(wǎng)易

  “網(wǎng)易搜索引擎采用模糊搜索方式(就是我們之前提過的智能分詞技術(shù))對(duì)用戶輸入的關(guān)鍵詞,先作語言分析,分解成多個(gè)詞或詞組,再去數(shù)據(jù)中心匹配結(jié)果,因此允許用戶輸入整句。” “真的呀。那可太方便了,有時(shí)候我就是搞不懂該用什么樣的多個(gè)關(guān)鍵詞搜索。”

  “網(wǎng)易搜索引擎提供多語言檢索,英語,日語,俄語等幾十種語言關(guān)鍵詞都可以直接輸入搜索框檢索網(wǎng)頁資料。其實(shí)這應(yīng)該算是Google的功勞。”

  “此外,網(wǎng)易擁有全國最大的開放式管理目錄ODP,有約5000名各行業(yè)目錄管理員負(fù)責(zé)管理網(wǎng)站注冊信息。美美,是不是想知道ODP是怎么回事???”

  “嗯,什么是ODP?”

  “ODP是Open Directory Project(開放式目錄管理)的縮寫。 從誕生至今,只有短短三年的歷程。1998年6月,當(dāng)時(shí)一位程序員Rich Skrenta對(duì)Yahoo!的搜索結(jié)果中經(jīng)常出現(xiàn)老的和死的鏈接感到非常厭煩,于是他在Internet上發(fā)出了倡議,請求位于全球各地的Internet用戶都志愿來幫助編輯這個(gè)目錄。倡議很快得到了很多熱心志愿者的支持,于是劃時(shí)代的管理方式ODP就此誕生。國外比較著名的ODP網(wǎng)站當(dāng)屬Dmoz,它由4萬多名志愿編輯免費(fèi),提供給任何個(gè)人和組織免費(fèi)使用。Google的網(wǎng)站搜索其實(shí)就是Dmoz的杰作。”

搜狐

  “搜狐公司于1998年推出中國首家大型分類查詢搜索引擎,經(jīng)過幾年的發(fā)展,其內(nèi)容更新迅速,網(wǎng)站收錄資源豐富,以中文網(wǎng)站為主,如今累計(jì)收錄中文網(wǎng)站已達(dá)150多萬,?每日瀏覽量超過800萬。搜狐有很多技術(shù)、功能與新浪類似,在此就不多說了。”

263首都在線

  “263首都在線的搜索引擎可謂百度公司技術(shù)的完美體現(xiàn),因?yàn)樗鼜木W(wǎng)頁搜索到網(wǎng)站搜索都使用了百度的技術(shù),為廣大中文網(wǎng)絡(luò)用戶提供豐富有效的目錄指南服務(wù)和全文檢索服務(wù)。它比較有特色的地方是除了提供基本的分類查詢和關(guān)鍵字查詢,還為用戶增加本周新站、好站推薦、熱門關(guān)鍵字搜索、專題搜索、搜索留言版等多項(xiàng)服務(wù)。”

  “好了,國內(nèi)幾大搜索引擎的情況就介紹到這里,此外還有很多比如天網(wǎng)、網(wǎng)擎、中國導(dǎo)航等等,美美可以通過閱讀相關(guān)的搜索文章了解。”

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多