2021年大数据ELK(二):Elasticsearch简单介绍
全網最詳細的大數據ELK文章系列,強烈建議收藏加關注!?
新文章都已經列出歷史文章目錄,幫助大家回顧前面的知識重點。
目錄
系列歷史文章?
一、Elasticsearch簡介
1、介紹
2、創始人
二、Elasticsearch可以做什么
1、信息檢索
2、企業內部系統搜索
3、數據分析引擎
三、Elasticsearch特點
1、海量數據處理
2、開箱即用?
3、作為傳統數據庫的補充
四、哪些公司在使用Elasticsearch
五、ElasticSearch使用案例
六、ElasticSearch對比Solr
七、發展歷史
系列歷史文章
2021年大數據ELK(六):安裝Elasticsearch
2021年大數據ELK(五):Elasticsearch中的核心概念
2021年大數據ELK(四):Lucene的美文搜索案例
2021年大數據ELK(三):Lucene全文檢索庫介紹
2021年大數據ELK(二):?Elasticsearch簡單介紹
2021年大數據ELK(一):集中式日志協議棧Elastic Stack簡介
一、Elasticsearch簡介
Elasticsearch:官方分布式搜索和分析引擎 | Elastic在 RESTful 風格的分布式免費開源搜索和分析引擎開源中,Elasticsearch 處于領先地位,速度快,可實現水平可擴展性和可靠性,并能讓您輕松進行管理。免費啟用。https://www.elastic.co/cn/elasticsearch
1、介紹
- Elasticsearch是一個基于Lucene的搜索服務器、
- 提供了一個分布式多用戶能力的全文搜索引擎,基于RESTful web接口
- Elasticsearch是用Java語言開發的,并作為Apache許可條款下的開放源碼發布,是一種流行的企業級搜索引擎。Elasticsearch用于云計算中,能夠達到實時搜索,穩定,可靠,快速,安裝使用方便。官方客戶端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和許多其他語言中都是可用的
- 根據DB-Engines的排名顯示,Elasticsearch是最受歡迎的企業搜索引擎,其次是Apache Solr,也是基于Lucene。
2、創始人
Shay Banon?(謝巴農)
二、Elasticsearch可以做什么
1、信息檢索
?
電商?/ 門戶 / 論壇?
2、企業內部系統搜索
- 關系型數據庫使用like進行模糊檢索,會導致索引失效,效率低下
- 可以基于Elasticsearch來進行檢索,效率杠杠的
OA / CRM / ERP
3、數據分析引擎
Elasticsearch 聚合可以對數十億行日志數據進行聚合分析,探索數據的趨勢和規律。
三、Elasticsearch特點
1、海量數據處理
- 大型分布式集群(數百臺規模服務器)
- 處理PB級數據
- 小公司也可以進行單機部署
2、開箱即用?
- 簡單易用,操作非常簡單
- 快速部署生產環境
3、作為傳統數據庫的補充
- 傳統關系型數據庫
- 排名、海量數據存儲、分析等功能
- Elasticsearch可以作為傳統關系數據庫的補充,提供RDBM無法提供的功能
四、哪些公司在使用Elasticsearch
- 京東
- 攜程
- 去哪兒
- 58同城
- 滴滴
- 今日頭條
- 小米
- 嗶哩嗶哩
- 聯想
- 思科
- Airbus
- ebay
- 暴雪
- 德國大眾
- 微軟
- Symantec
- BBC
- 英偉達
- Uber
- IBM
- Github
- Docker
五、ElasticSearch使用案例
- 2013年初,GitHub拋棄了Solr,采取ElasticSearch 來做PB級的搜索。 “GitHub使用ElasticSearch搜索20TB的數據,包括13億文件和1300億行代碼”
- 維基百科:啟動以elasticsearch為基礎的核心搜索架構
- SoundCloud:“SoundCloud使用ElasticSearch為1.8億用戶提供即時而精準的音樂搜索服務”
- 百度:百度目前廣泛使用ElasticSearch作為文本數據分析,采集百度所有服務器上的各類指標數據及用戶自定義數據,通過對各種數據進行多維分析展示,輔助定位分析實例異常或業務層面異常。目前覆蓋百度內部20多個業務線(包括casio、云分析、網盟、預測、文庫、直達號、錢包、風控等),單集群最大100臺機器,200個ES節點,每天導入30TB+數據
- 新浪使用ES 分析處理32億條實時日志
- 阿里使用ES 構建挖財自己的日志采集和分析體系
六、ElasticSearch對比Solr
- Solr 利用 Zookeeper 進行分布式管理,而 Elasticsearch 自身帶有分布式協調管理功能;
- Solr 支持更多格式的數據,而 Elasticsearch 僅支持json文件格式;
- Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高級功能多有第三方插件提供;
- Solr 在傳統的搜索應用中表現好于 Elasticsearch,但在處理實時搜索應用時效率明顯低于 Elasticsearch
七、發展歷史
- 2004年,發布第一個版本名為Compass的搜索引擎,創建搜索引擎的目的主要是為了搜索食譜
- 2010年,發布第二個版本更名為Elasticsearch,基于Apache Lucene開發并開源
- 2012年,創辦Elasticsearch公司
- 2015年,Elasticsearch公司更名為Elastic,是專門從事與Elasticsearch相關的商業服務,并衍生了Logstash和Kibana兩個項目,填補了在數據采集、數據可視化的空白。于是,ELK就誕生了
- 2015年,Elastic公司將開源項目Packetbeat整合到Elasticsearch技術棧中,并更名為Beats,它專門用于數據采集的輕量級組件,可以將網絡日志、度量、審計等各種數據作為不同的源頭發送到Logstash或者Elasticsearch
- ELK不再包括Elastic公司所有的開源項目,ELK開始更名為Elastic Stack,將來還有更多的軟件加入其中,包括數據采集、清洗、傳輸、存儲、檢索、分析、可視化等
- 2018年,Elastic公司在紐交所掛牌上市
- 📢博客主頁:https://lansonli.blog.csdn.net
- 📢歡迎點贊 👍 收藏 ?留言 📝 如有錯誤敬請指正!
- 📢本文由 Lansonli 原創,首發于 CSDN博客🙉
- 📢大數據系列文章會每天更新,停下休息的時候不要忘了別人還在奔跑,希望大家抓緊時間學習,全力奔赴更美好的生活?
總結
以上是生活随笔為你收集整理的2021年大数据ELK(二):Elasticsearch简单介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据ELK(一):集中式日志
- 下一篇: 2021年大数据ELK(三):Lucen