搜索技术的历史
?搜索技術歷史:
- 搜索技術的歷史—萌芽階段:Archie 、Gopher
最早出現的搜索引擎:
1990年,加拿大蒙特利爾(Montreal)的麥吉爾大學學生Alan Emtage、Peter Deutsch、Bill Wheelan發明了一個自動索引互聯網上匿名FTP網站文件的程序Archie
(只能索引網絡上的文件)
Gopher搜索協議
1991年美國明尼蘇達大學學生Mark McCahill發明了一種名為Gopher的搜索協議
(具有Archie的功能,還可以對網頁進行索引)
- 搜索技術的歷史—起步階段:Robot 、Spider
Robot 網絡機器人
1993年MIT Matthew Gray的World wide Web Wanderer,用于追蹤互聯網發展規模。剛開始它只用來統計互聯網上的服務器數量,后來則發展為也能夠捕獲網址(URL)。
Spider網絡爬蟲
1993年10月Martijn Koster創建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相當于Archie的HTTP版本。ALIWEB允許用戶提交自己網站簡介信息,但這有一個缺點,用戶認為不需要提交站點。(不需要通過網絡抓取數據。不會消耗大量帶寬。數據信息有限)
(Martijn Koster是機器人拒絕協議Robots Exclusion主要設計參與者,這個協議是現代搜索引擎的標準功能之一)
- 搜索技術的歷史—發展階段: Excite 、Galaxy、Yahoo
Excite
?1993年2月,6個Stanford(斯坦福)大學生的想法是分析字詞關系,以對互聯網上的大量信息作更有效的檢索。這就是Excite。后來曾以概念搜索聞名,2002年5月,被Infospace收購的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile
Galaxy
1994年1月,第一個既可搜索又可瀏覽的分類目錄EINet Galaxy(Tradewave Galaxy)上線。除了網站搜索,它還支持Gopher和Telnet搜索
Yahoo
1994年4月,Stanford兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。
Yahoo目錄開始支持簡單的數據庫搜索。因為Yahoo的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。搜索效率明顯提高。(Yahoo以后陸續使用Altavista、Inktomi、Google提供搜索引擎服務)
第一個支持搜索文件全部文字的全文搜索引擎
?1994年初,Washington大學CS學生Brian Pinkerton開始了他的小項目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個服務器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。(后來webcrawler陸續被AOL和Excite收購,現在和excite一樣改用元搜索引擎Dogpile)
Lycos
?Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一個重要的進步。Carnegie Mellon University的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。1994年7月20日,數據量為54,000的Lycos正式發布。除了相關性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服務)
- 搜索技術的歷史—繁榮階段: Infoseek 、Alta Vista ,Google ,Baidu
?Infoseek以相關性聞名
1994年底, Infoseek友善的用戶界面、大量附加服務(such as UPS tracking, News, a directory, and the like) 使它聲望日隆。而1995年12月與Netscape的戰略性協議,使它成為一個強勢搜索引擎。(雖然公司聲稱1994年1月已創立,但直到年底它的搜索引擎才與公眾見面)
這個搜索引擎沿用的Yahoo和Lycos的概念,沒有什么獨特的創新。2001年2月,Infoseek停止了自己的搜索引擎,開始改用Overture的搜索結果。這讓我懂得技術好再加上UI設計好才算是完美。早幾年出生我就學美術了~~
?Alta Vista第一個支持自然語言搜索
1995年12月, Alta Vista推出第一個支持自然語言搜索的搜索引擎 。?AltaVista是一個以網頁全文檢索為主、同時提供分類目錄的搜索引擎。內容極其豐富,真正可以稱海量信息檢索。
?AltaVista于1995年由迪吉多公司(Digital Equipment Corporation)創立。2003年被 Overture 以1.4億美元現金加股票的形式購得,同年轉手給雅虎[1]。 北京時間2013年6月29日,雅虎宣布將于2013年7月8日關閉搜索引擎AltaVista服務。
?1998年Google(谷歌)創始人拉里.佩奇和布林在美國斯坦福大學的學生宿舍內共同開發了全新的在線搜索引擎,然后迅速傳播給全球的信息搜索者.Google 被公認為全球最大的搜索引擎
Baidu
百度(Nasdaq簡稱:BIDU)是全球最大的中文搜索引擎,2000年1月由李彥宏、徐勇兩人創立于北京中關村,致力于向人們提供“簡單,可依賴”的信息獲取方式。“百度”二字源于中國宋朝詞人辛棄疾的《青玉案·元夕》詞句“眾里尋他千百度”,象征著百度對中文信息檢索技術的執著追求。
2000年5月百度首次為門戶網站“硅谷動力”提供搜索技術服務。之后它迅速占領中國搜索引擎市場。2001年8月百度公司發布了baidu.com搜索引擎beta版,從后臺服務轉向了獨立提供搜索服務。2001年10月22日,正式發布baidu搜索引擎。2005年8月5日,百度在納斯達克上市
?
轉載于:https://www.cnblogs.com/gne-hwz/p/6951867.html
總結
- 上一篇: python pep8
- 下一篇: 标准输入与标准输出