ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解
前言
在上一篇中介紹了ElasticSearch集群和kinaba的安裝教程,本篇文章就來講解下 ElasticSearch的DSL語句使用。
ElasticSearch DSL 介紹
Elasticsearch提供了基于JSON的完整查詢DSL(特定于域的語言)來定義查詢。將查詢DSL視為查詢的AST(抽象語法樹),它由兩種子句組成:
- 葉子查詢子句:
葉查詢子句中尋找一個特定的值在某一特定領(lǐng)域,如 match,term或 range查詢。這些查詢可以自己使用。 - 復(fù)合查詢子句
復(fù)合查詢子句包裝其他葉查詢或復(fù)合查詢,并用于以邏輯方式組合多個查詢(例如 bool或dis_max查詢),或更改其行為(例如 constant_score查詢)。
查詢子句的行為會有所不同,具體取決于它們是在 查詢上下文中還是在過濾器上下文中使用。
我們在使用ElasticSearch的時候,避免不了使用DSL語句去查詢,就像使用關(guān)系型數(shù)據(jù)庫的時候要學(xué)會SQL語法一樣。如果我們學(xué)習(xí)好了DSL語法的使用,那么在日后使用和使用Java Client調(diào)用時候也會變得非常簡單。
ElasticSearch DSL 語句使用
這里我們先來介紹下DSL 語句簡單的使用,從最常用的增刪改查開始!
一、新增數(shù)據(jù)
ElasticSearch可以直接新增數(shù)據(jù),只要你指定了index(索引庫名稱)和type(類型)即可。在新增的時候你可以自己指定主鍵ID,也可以不指定,由 ElasticSearch自身生成。
新增數(shù)據(jù)命令示例:
POST test1/_doc/1 {"uid" : "1234","phone" : "12345678909","message" : "qq","msgcode" : "1","sendtime" : "2019-03-14 01:57:04" }kinaba示例圖:
注: POST test1/_doc/1 這是指定主鍵ID為1,如果POST test1/_doc 的話,那么便是es自身生成ES語句。
這里我們還可以通過 GET test1/ 或 GET test1/_settings和GET test1/_mapping查看該index的狀態(tài),也就是 setting(設(shè)置選項) 和mapping(數(shù)據(jù)結(jié)構(gòu))。
二、創(chuàng)建索引庫
在上述示例中,我們通過直接通過創(chuàng)建數(shù)據(jù)從而創(chuàng)建了索引庫,但是沒有創(chuàng)建索引庫而通過ES自身生成的這種并不友好,因為它會使用默認(rèn)的配置,字段結(jié)構(gòu)都是text(text的數(shù)據(jù)會分詞,在存儲的時候也會額外的占用空間),分片和索引副本采用默認(rèn)值,默認(rèn)是5和1,ES的分片數(shù)在創(chuàng)建之后就不能修改,除非reindex(下面會講到),所以這里我們還是指定數(shù)據(jù)模板進行創(chuàng)建。
這里先簡單介紹一下ES的數(shù)據(jù)結(jié)構(gòu),以下的數(shù)據(jù)結(jié)構(gòu)為ES的6.x版本。
-
核心數(shù)據(jù)類型
text 和 keyword -
數(shù)值數(shù)據(jù)類型
long,integer,short,byte,double,float,half_float,scaled_float -
日期數(shù)據(jù)類型
date -
布爾數(shù)據(jù)類型
boolean -
二進制數(shù)據(jù)類型
binary -
范圍數(shù)據(jù)類型
integer_range,float_range,long_range,double_range,date_range -
復(fù)雜數(shù)據(jù)類型編輯
-
對象數(shù)據(jù)類型
object 用于單個JSON對象 -
嵌套數(shù)據(jù)類型
nested 用于JSON對象數(shù)組 -
地理數(shù)據(jù)類型編輯
-
地理位置數(shù)據(jù)類型
geo_point 緯度/經(jīng)度積分 -
地理形狀數(shù)據(jù)類型
geo_shape 用于多邊形等復(fù)雜形狀 -
專業(yè)數(shù)據(jù)類型編輯
-
IP數(shù)據(jù)類型
ip 用于IPv4和IPv6地址 -
完成數(shù)據(jù)類型
completion 提供自動完成建議 -
令牌計數(shù)數(shù)據(jù)類型
token_count 計算字符串中令牌的數(shù)量
mapper-murmur3
murmur3 在索引時計算值的哈希并將其存儲在索引中
mapper-annotated-text
annotated-text 索引包含特殊標(biāo)記的文本(通常用于標(biāo)識命名實體) -
滲濾器類型
接受來自query-dsl的查詢 -
join 數(shù)據(jù)類型
為同一索引內(nèi)的文檔定義父/子關(guān)系 -
別名數(shù)據(jù)類型
為現(xiàn)有字段定義別名。 -
多字段編輯
為不同的目的以不同的方式對同一字段建立索引通常很有用。例如,一個string字段可以映射為text用于全文搜索的字段,也可以映射為keyword用于排序或聚合的字段。或者,您可以使用standard分析儀, english分析儀和 french分析儀索引文本字段。
這是多領(lǐng)域的目的。大多數(shù)數(shù)據(jù)類型通過fields參數(shù)支持多字段。
上面介紹的字段介紹雖然比較復(fù)雜,但是我們常用的幾個類型也就是這幾種 text、keyword、byte、short、integer、long、float、double、boolean、date,其中text和keyword都是string類型,選擇區(qū)分很簡單,需要進行分詞用text,不需要并且進行排序或聚合的可以用keyword。
關(guān)于ES的數(shù)據(jù)結(jié)構(gòu)就到這里了,我們來進行索引庫的創(chuàng)建吧!
新增索引庫的命令示例:
PUT test1 {"settings" : {"number_of_shards" : 10,"number_of_replicas" : 1,"refresh_interval" : "1s"},"mappings" : {"_doc" : {"properties" : {"uid" : { "type" : "long" },"phone" : { "type" : "long" },"message" : { "type" : "keyword" },"msgcode" : { "type" : "long" },"sendtime" : { "type" : "date","format" : "yyyy-MM-dd HH:mm:ss" }}}} }示例圖:
注:
- number_of_shards: 是設(shè)置的分片數(shù),設(shè)置之后無法更改!
- refresh_interval: 是設(shè)置es緩存的刷新時間,如果寫入較為頻繁,但是查詢對實時性要求不那么高的話,可以設(shè)置高一些來提升性能。可以更改
- number_of_replicas : 是設(shè)置該索引庫的副本數(shù),建議設(shè)置為1以上。
其中這里還有幾個重要參數(shù)也順便說一下:
- store: true/false 表示該字段是否存儲,默認(rèn)存儲。
- doc_values: true/false 表示該字段是否參與聚合和排序。
- index: true/false 表示該字段是否建立索引,默認(rèn)建立。
關(guān)于這幾個字段的取值可以參考一下的示例圖:
三、修改數(shù)據(jù)
其實ES的新增和修改可以看做是一樣,存在則修改,不存在則新增,不過這里還是簡單的介紹下吧。
修改數(shù)據(jù)的方式主要有兩種,一種是通過主鍵ID進行修改,這種比較簡單,就是和新增一樣即可。
另一種則是通過條件進行修改,相當(dāng)于SQL更新語句的 where條件。
根據(jù)主鍵修改的命令示例:
POST test1/_doc/1 {"uid" : "1234","phone" : "12345678909","message" : "qq","msgcode" : "1","sendtime" : "2019-03-14 01:57:04" }根據(jù)條件修改的命令示例:
POST test1/_update_by_query {"query": {"term": {"phone": "12345678909"}} ,"script": {"source": "ctx._source['message'] = 'xuwujing'"} }原有的數(shù)據(jù):
修改后的數(shù)據(jù):
注:這里的根據(jù)條件進行修改用到的腳本語言,ES除了使用DSl語句之后,使用一些官方定義的腳本語言和SQL語句也能進行操作,腳本語言和SQL語句的操作留到以后在來講下。
四、刪除數(shù)據(jù)、字段和索引庫
ES根據(jù)主鍵刪除數(shù)據(jù)的命令示例是DELETE 索引庫/id,簡單實用,但是一定要要加上ID,不然就是刪除索引庫了!
根據(jù)主鍵刪除數(shù)據(jù)命令示例:
DELETE test1/1根據(jù)條件刪除數(shù)據(jù)的命令示例:
POST test/_delete_by_query {"query": {"term": {"phone": "12345678909"}} }當(dāng)然ES還可以根據(jù)條件只刪除某一個字段的數(shù)據(jù),比如刪除字段msgcode的數(shù)據(jù)。
刪除字段數(shù)據(jù)的命令示例:
POST test/_doc/_update_by_query { "script":{ "lang":"painless", "inline":"ctx._source.remove(\"msgcode\")" } }示例圖:
查詢語句
查詢所有
match_all可以查詢集群所有索引庫的信息,包括一些隱藏索性庫的信息。
命令示例:
示例圖:
查詢索引庫所有的數(shù)據(jù),命令格式為GET 索引庫名稱/索引庫類型/_search,也可以不需要索引庫類型。
命令示例:
GET test1/_doc/_search如果根據(jù)ID查詢某一條數(shù)據(jù)的話,也比較簡單,只需要將上述的_search換成主鍵ID即可。
命令示例:
等值(term)查詢
term主要用于精確匹配哪些值,比如數(shù)字,日期,布爾值或 not_analyzed 的字符串(未經(jīng)分析的文本數(shù)據(jù)類型)
比如根據(jù)手機號進行查詢。
命令示例:
當(dāng)然,如果想在一個字段匹配多個值的話,可以使用terms,相當(dāng)于SQL的in語法。
命令示例:
GET test1/_doc/_search {"query": {"terms": {"uid": [ 1234, 12345, 123456] }} }示例圖:
注:上述中是沒有123456這條數(shù)據(jù),這樣只是為了做下簡單的測試而已。
范圍(range )查詢
range可以理解為SQL中的><符號,其中g(shù)t是大于,lt是小于,gte是大于等于,lte是小于等于。
命令示例:
GET test1/_doc/_search {"query": {"range": { "uid": { "gt": 1234,"lte": 12345} } } }存在(exists)查詢
exists可以理解為SQL中的exists函數(shù),就是判斷是否存在該字段。
這里我們新增一條沒有msgcode的字段,然后用exists去查詢。
POST test1/_doc/3 {"uid" : "123456","phone" : "12345678909","message" : "qq","sendtime" : "2019-03-14 01:57:04" }存在查詢命令示例:
GET test1/_doc/_search {"query": {"exists": { "field":"msgcode" } } }示例圖:
組合(bool)查詢
bool 可以用來合并多個過濾條件查詢結(jié)果的布爾邏輯,它包含這如下幾個操作符:
- must : 多個查詢條件的完全匹配,相當(dāng)于 and。
- must_not ::多個查詢條件的相反匹配,相當(dāng)于 not。
- should : 至少有一個查詢條件匹配, 相當(dāng)于 or。
查詢的命令示例:
GET /test1/_search {"query": {"bool": {"must": {"term": {"phone": "12345678909"}},"must_not": {"term": {"uid": 12345}},"should": [{"term": {"uid": 1234}},{"term": {"uid": 123456}}],"adjust_pure_negative": true,"boost": 1}} }示例圖:
模糊(wildcard)查詢
wildcard查詢相當(dāng)于SQL語句中的like語法,只不過它查詢的數(shù)據(jù)需要加上*符號。
模糊查詢命令示例:
GET /test1/_search {"query": {"wildcard": { "message":"*wu*" } } }正則(regexp)查詢
regexp可以支持正則查詢,比如查詢短信內(nèi)容中的驗證碼之類的。
下面的這個示例就是查詢以xu開頭,后面是0-9數(shù)字的內(nèi)容的數(shù)據(jù)。
正則查詢命令示例:
GET /test1/_search {"query": {"regexp": { "message":"xu[0-9]" } } }示例圖:
查詢語句的示例到這里就差不多就結(jié)束了,這里在推薦一下kinaba查詢的幾個小技巧,如圖所示:
其它
參考:
https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html
ElasticSearch個人已經(jīng)使用一年多了,在學(xué)習(xí)的過程中也積攢了一些相關(guān)資料其,只不過今年特別忙,沒有太多時間將其整理成博客進行分享了。說來慚愧,今年寫博客的數(shù)量有些少了,下半年自己從一個周更博主變成了月更博主了,不過后面若是時間充足的話也會多些一些的,再忙每個月至少也會寫一篇 ヾ(?°?°?)ノ゙
ElasticSearch實戰(zhàn)系列:
ElasticSearch實戰(zhàn)系列一: ElasticSearch集群+Kinaba安裝教程
音樂推薦
原創(chuàng)不易,如果感覺不錯,希望給個推薦!您的支持是我寫作的最大動力!
版權(quán)聲明:
作者:虛無境
博客園出處:http://www.cnblogs.com/xuwujing
CSDN出處:http://blog.csdn.net/qazwsxpcm
個人博客出處:http://www.panchengming.com
總結(jié)
以上是生活随笔為你收集整理的ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【生活】换手机号需要更改哪些绑定
- 下一篇: 强大的sed_拔剑-浆糊的传说_新浪博客