免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

搜索巨鱷邁克林奇來華斡旋 Autonomy中國布局加速

 黑傳說 2006-07-25

724日凌晨,現(xiàn)年40歲的英國Autonomy全球CEO邁克·林奇 Mike Lynch )和公司COO安迪·康特Andy katner)一行從英國飛抵北京國際機場。自2003Autonomy進入中國市場以來,這還是邁克·林奇第二次來華——此前的一次是去年3月,當(dāng)時由他親自操刀,Autonomy首次在國內(nèi)互聯(lián)網(wǎng)搜索市場進行了前期部署。

盡管Autonomy大中華區(qū)首席代表伍昕對邁克·林奇此行的計劃諱莫如深,但記者從多種途徑獲悉,邁克·林奇此次來華,可能主要是為在企業(yè)級搜索市場進行相關(guān)投資。

暗戰(zhàn)企業(yè)搜索

公開資料顯示,Autonomy成立于1996年,曾先后在布魯賽爾的EASDAQ、倫敦股票交易所和美國NASDAQ上市,但因為一向?qū)W⒂谄髽I(yè)級搜索市場,其名頭遠(yuǎn)不如專注于互聯(lián)網(wǎng)搜索的Google來得響亮,雖然自200511月以5億美元完成對另一家企業(yè)搜索廠商Verity的收購后,Autonomy在企業(yè)搜索市場的份額已飆升至80%,遠(yuǎn)超排名第二的Fast及微軟、Google、IBM等廠商。

不過,有跡象表明,Autonomy已有意整個切入到第三代互聯(lián)網(wǎng)搜索領(lǐng)域。20047Autonomy通過其位于美國舊金山的控股公司Blinkx推出的視頻搜索門戶Blinkx,可視為其向互聯(lián)網(wǎng)搜索市場延伸的試探性舉措。

不無意味的是,在Autonomyweb搜索進行外延擴張的同時,web搜索市場巨頭Google、MSN等也在悄然向企業(yè)搜索市場滲透。

2002推出搜索專用設(shè)備GSA,Google一直不斷擴展其企業(yè)搜索業(yè)務(wù)線,包括推出Gmail的改良版和桌面搜索工具,以便通過捆綁不同的產(chǎn)品模塊形成整合優(yōu)勢。但由于種種原因,從那時迄今,其市場份額一直徘徊于1%以下,難有突破。為此,2003年,Google高層曾就是否砍掉企業(yè)搜索業(yè)務(wù)進行過多次激辯,最后還是決定保留下來,以觀后效。

此后,Google投注到企業(yè)市場的砝碼愈來愈大。今年一季度,Google先是推出了一款面向小型企業(yè)的新版Google Mini搜索工具,并在其中集成了企業(yè)版桌面搜索功能,接著又推出企業(yè)搜索設(shè)備OneBox 的升級版以及售價更高的企業(yè)級搜索工具。盡管并無革命性的技術(shù),但憑借同業(yè)最低價和個人市場的用戶口碑,Google已開始慢慢打開局面。

與此同時,包括微軟MSN、IBM在內(nèi)的軟件巨頭也磨刀霍霍,試圖在走入上升通道的企業(yè)搜索市場取一瓢飲。今年5月,在微軟發(fā)布最新的企業(yè)搜索工具之后,微軟首席運營官特納在一次會議上甚至對外放話說:“企業(yè)搜索是我們的地盤,我們不會讓Google奪走它。”

而IBM,雖然沒有如此張揚,卻也在暗中畜勢,一面打造看家搜索產(chǎn)品,一面則遠(yuǎn)交近攻,與Google、百度等搜索廠商展開多種合作。

出人意料的倒是百度。就在邁克·林奇來華的前夕,百度不光一股腦砍掉了運營企業(yè)搜索業(yè)務(wù)的ES部門,還裁撤了該部門的大部分員工,從此將企業(yè)搜索從自己的擴張版圖中一筆勾銷。百度對外的解釋是,企業(yè)軟件與公司的搜索核心業(yè)務(wù)背離,且只占據(jù)很少的業(yè)務(wù)線,比例不到2%;選擇撤銷,是為了騰出精力發(fā)展包括競價排名、精準(zhǔn)廣告在內(nèi)的互聯(lián)網(wǎng)搜索業(yè)務(wù)。

有消息說,百度的部分離職員工已向Autonomy以及國內(nèi)另一家企業(yè)搜索廠商TRS投遞簡歷并接受面試,但這一消息沒有得到上述兩家企業(yè)的確認(rèn)。

算法之爭

業(yè)內(nèi)人士認(rèn)為,包括Google、MSN、百度在內(nèi)的基于關(guān)鍵詞搜索的廠商之所以遲遲難以在企業(yè)搜索市場打開局面,取得較大的市場份額,與關(guān)鍵詞搜索引擎技術(shù)本身的算法局限性有關(guān)。

pagerank為代表的超鏈分析技術(shù),大多基于如下假設(shè):某個網(wǎng)頁被鏈接得越多,則其重要性就越大。由于只是根據(jù)網(wǎng)頁之間的超鏈關(guān)系來決定網(wǎng)頁內(nèi)容的重要程度,又只限于提取關(guān)鍵詞而不是提取基于內(nèi)容識別的概念,該算法一當(dāng)面臨企業(yè)級的精準(zhǔn)搜索要求時,就顯得捉襟見肘。雖然Google已試圖引進其他算法來克服這一局限性,但迄今收效甚微。

在看到pagerank的局限性以后,一些新興的搜索公司已開始嘗試更新的算法。例如Clusty,該公司通過借鑒Autonomy的模式識別技術(shù)以及自動分類等功能,可基于對概念的理解提供搜索結(jié)果的自動分類等功能。

Autonomy的模式識別技術(shù)的理論支撐點是貝葉斯概率論和申農(nóng)信息論,其核心是一個名為智能信息操作層(IDOL)的底層技術(shù)。因為不依賴于語言分析,而只是把語言當(dāng)成一種符號,根據(jù)關(guān)鍵詞的出現(xiàn)頻率來識別不同文本在上下文環(huán)境中的模式,以此來抽取文檔中的文本要素進行概念識別,因此,相比于pagerank算法,IDOL可以提供更精確的文本上下文分析和概念抽取,進而對信息進行超鏈接、自動聚類、自動分類、主動匹配、信息地圖等自動化操作。

搜索3.0浮現(xiàn)

Google、百度等當(dāng)然沒有停止對核心算法的改進,不管是簡單的修修補補,還是投資浩大的技術(shù)研發(fā)。

多種證據(jù)顯示,Google正準(zhǔn)備研發(fā)包括語義搜索在內(nèi)的下一代智能搜索引擎,微軟也開始研發(fā)基于Web Block(網(wǎng)頁塊)而不是網(wǎng)頁的搜索技術(shù),而一家叫Senopy的公司則正在研究自然語言搜索引擎。

同樣研發(fā)自然語言搜索技術(shù)的還有IBM。據(jù)悉,IBM公司的研究和開發(fā)部門在UIMA平臺上早已開始進行基于語言分析、知識庫、問答系統(tǒng)、機器翻譯等功能的自然語言搜索研究。

在國內(nèi),暗中著手人工智能搜索的還包括百度、搜狗、海量科技、Aisou等。其中海量推出的digdig更聲稱已掌握了基于“語義數(shù)據(jù)挖掘”的中文信息處理技術(shù),并涉足到軟件、人物、圖片等垂直搜索領(lǐng)域。不妨順帶提及的是,在2003年Autonomy進軍中國之初,采用的就是海量的中文分詞技術(shù)。

伍昕告訴記者,目前通過語義分析進入第三代搜索的路徑大約有三種:一種通過真正的語法、詞法分析理解文字,諸如貓狗到底是什么之類,不過到現(xiàn)在為止,上述努力基本上無大建樹,因為語言比我們想象的要復(fù)雜得多,計算機要想完全理解語言,幾乎是不可能的;還有一種是模仿人腦進行人工智能分析,但由于比起所需要的精確度,現(xiàn)有電腦的處理能力還遠(yuǎn)遠(yuǎn)不夠,因此該方法雖然可以做到一定程度的精確搜索,但至少眼下看來還難有大成;第三種是基于概率論和信息論的模型匹配技術(shù),即通過統(tǒng)計分析理解文章的核心概念及概念間的關(guān)系。

算法之外,搜索引擎領(lǐng)域的另一個發(fā)展重點是對搜索結(jié)果呈現(xiàn)方式的處理。在美國,像Grokker、Snap這樣的后起之秀即以更個性化的搜索結(jié)果分類、呈現(xiàn)方式等為招徠,吸引了大批忠誠用戶。

不過伍昕表示,上述以web2.0為賣點的搜索引擎仍沒有走出將非結(jié)構(gòu)化信息進行結(jié)構(gòu)化處理的誤區(qū),其特征之一就是把每個信息都人工打上標(biāo)簽,依此來進行人工分類和信息聚合,這其實是吃力不討好的一件事。因為每個文檔、網(wǎng)頁上的信息都涵蓋眾多,張貼一個或幾個標(biāo)簽,不光不確切、有歧義,而且容易丟掉很多信息,于是給信息管理制造出新的難題。更好的做法應(yīng)該是對文章的內(nèi)容進行分析和概念提取,基于此,真正的關(guān)聯(lián)、分類和聚類才成為可能。

“互聯(lián)網(wǎng)其實是一個語義網(wǎng),Google只做到了很淺的一部分,就是通過關(guān)鍵詞搜索把信息從一個地方搬到另一個地方,但其實這里面可以構(gòu)建一個知識網(wǎng),而搜索引擎應(yīng)該成為這個知識網(wǎng)的操作系統(tǒng)。”伍昕說。

促使搜索引擎成為信息操作系統(tǒng),這其實一直是每一個搜索廠商的終極目標(biāo)。不論是個性化搜索、社區(qū)化搜索、知識問答社區(qū),還是人工智能、模式匹配、語義搜索,都是這一努力不可分割的一部分。盡管眼下關(guān)于第三代搜索引擎的激辯中不無喧嘩的噪音,也不無誤入歧途的風(fēng)險,但呼聲甚高的第三代搜索引擎或者搜索3.0的浮現(xiàn)和大面積井噴,相信只是個時間問題。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多