中文搜索引擎檢視原始碼討論檢視歷史
中文搜索引擎 |
中文名: 中文搜索引擎 外文名: Chinese search engine 性 質: 自動搜索信息 |
中文搜索引擎指的是中文類的搜索引擎,中文引擎,國內瀏覽網頁大多均採用中文搜索引擎。[1]
中文搜索引擎
國內目錄索引
搜狐(Sohu)— 國內三大門戶之一,最早在國內推出搜索引擎收費登錄服務。
新浪(Sina)— 最大的中文門戶網站,同樣也推出了搜索引擎收費索引項目。
網易(Netease)— 網易搜索是ODP的國內翻版,其目錄由志願管理員維護,是google的網頁搜索用戶。
國內搜索引擎
百度(Baidu)— 國內唯一商業化的全文搜索引擎,提供搜狐、新浪、Tom等站點網頁搜索服務。
中搜(ZhongSou)— 網絡豬是一隻神奇的小豬,是中國搜索強力推出的桌面軟件,但它不僅僅是一個軟件,而是代表了新一代的搜索文化 ――快樂搜索。
搜索引擎對比
搜狐、新浪,263等三十多家網站公司均採用中文搜索引擎。相反網易、雅虎、netscape、Deja等全球一百三十多家公司採用Google,各大引擎競相模仿Google的功能和特色,如網頁快照,偏好設置等。而且Google引擎的技術發展很快,經常有更新的技術誕生;而Go,GoTo等 許多公司則採用全球另一著名引擎--overturn,其特點是搜索很準,速度尚可,但商業化太重。過去Lycos公司收購了altavista,hotbot ,成為全球最重要的搜索公司,然而Lycos的精準、hotbot的全的風格卻並沒有保留,已經明顯遜色於google等着名專業引擎了,尤其是 速度太慢。dmoz只搜索站點,但所有站點皆是精選而成。可確保每一個均極佳,而且還可自定義站點,不過對中文支持不理想。All the Web與Google類似,均支持中英文等多語言,速度快,搜索麵廣,然而必須先選擇語言,否則可能出現亂碼,而不如Google自動識別多種 語言。而且界面較Google遜色。這幾大引擎已成為最主要的引擎,另外象search163, search,excite, northernlight,AltaVista,HotBot,Infoseek,等是過去名聲赫赫的,但近來發展卻不十分如意,尤其是Excite,過去其中文引擎很有特色,被廣泛採用,雖仍支持中文,但數據庫已太小,無法收到新的內容了,而英文方面又不如Google快捷,數據庫大。Hotbot曾全球排名第一(搜索頁面數),自從被Lycos收並後,反而不行了,而且不支持中文。wisenut和teoma剛剛興起,極具代表性引擎,它們還不能對Google構成危脅,而且二者均是 英文的,前者速度類似Google,非常快,數據庫也較大,而後者界面幾乎完成模仿Google,但速度稍差數據庫偏小。因而綜合引擎主要選擇上述幾家引擎,如果能恰當應用的話,幾乎能找到一切所需的東西。其中Google繼承了原Altavista的多語言風格,而且由於網易的購 賣,它對簡、繁體中文支持都十分良好。但其它英文引擎卻不可。
工作原理
搜索引擎的工作原理大致可以分為:
搜集信息:搜索引擎的信息搜集基本都是自動的。搜索引擎利用稱為網絡蜘蛛(spider)的自動搜索機器人程序來連上每一個網頁上的超連結。機器人程序根據網頁鏈到其他中的超鏈接,就象日常生活中所說的「一傳十,十傳百……」一樣,從少數幾個網頁開始,連到數據庫上所有到其他網頁的鏈接。理論上,若網頁上有適當的超鏈接,機器人便可以遍歷絕大部分網頁。
整理信息:搜索引擎整理信息的過程稱為「建立索引」。搜索引擎不僅要保存搜集起來的信息,還要重新翻查它所有保存的信息而迅速找到所要的資料。想象一下,如果信息是不按任何規則地隨意堆放在搜索引擎的數據庫中,那麼它每次找資料都得把整個資料庫完全翻查一遍,如此一來再快的計算機系統也沒有用。
接受查詢:用戶向搜索引擎發出查詢,搜索引擎接受查詢並向用戶返回資料。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發出的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內找到用戶需要的資料,並返回給用戶。
搜索引擎主要返回以網頁鏈接的形式提供的,通過這些鏈接,用戶便能到達含有自己所需資料的網頁。通常搜索引擎會在這些鏈接下提供一小段來自這些網頁的摘要信息以幫助用戶判斷此網頁是否含有自己需要的內容。
發展史
1996年8月成立的搜狐公司是最早參與作網絡信息分類導航的網站,曾一度有「出門找地圖,上網找搜狐的」美譽。由於其人工分類提交 的局限性,隨着網絡信息的暴增,逐漸被基於robot自動抓取智能分類的新一代信息技術取代。
1998年1月,台灣中正大學吳升教授所領導的GAIS實驗室創立了Openfind中文搜索引擎,是最早開發的中文智能搜索引擎,採用GAIS實驗室推出多元排序(PolyRankTM)核心技術,截止2002年6月,宣布累計抓取網頁35億,開始進入英文搜索領域。
北大天網是教育網最流行的搜索引擎,它由北大計算機系網絡與分布式系統研究室開發,於1997年10月29日正式在CERNET上提供服務, 2000年初成立天網搜索引擎新課題組,由國家973重點基礎研究發展規劃項目基金資助開發,收錄網頁約6000萬,利用教育網優勢,有強大 的ftp搜索功能。
中文搜索由超鏈分析專利發明人、前Infoseek資深工程師李彥宏和好友徐勇2000年1月創建,支持網頁信息檢索,圖片,Flash,音樂等多 媒體信息的檢索。並且在中文領域第一個開始使用ppc經營模式。
2002年開始進入搜索引擎市場的中搜是由慧聰國際主持開發的,是搜索領域的後起之秀。處於起步階段,技術沒有特別見長的優勢。
搜索引擎商務
搜索引擎的商務是一種新的商業模式,在國內的大多數人還在用網址大全去尋找商業平台網站的時候,搜索引擎營銷的方式慢慢的興起,傳奇私服 、網站建設 、網站製作 、網站推廣, 獵頭越來越多的買家又或賣家通過搜索引擎來尋找自己的需要。其中以google最為出名,可以說是一代搜索引擎的楷模。google以其優秀的搜索算法,不被競價排名所籠罩的口碑成為全世界最為出名的搜索引擎。