1.导入ES官方检索测试数据
本次使用kibana操作ES以这些数据为基础
ES在GitHub的地址
这段数据存在这个目录下
将这2000行json复制出来
2.使用Kibana将2000行数据导入到ES中
POST /bank/account/_bulk
3.根据ES官方文档对数据检索
ES官网
进入文档–>选择其他版本
进入对应版本
进入这个页面有点慢
脚本文件还没加载完,加载完了的界面是这样的
点击+好展开
进入检索文档
这里我的步骤做的这么详细是不是因为CSDN资源服不要我付费,而是防止这些链接改变,而找不到界面
4.开始检索
ES支持两种基本方式检索
1.通过使用REST request URL 发送搜索参数(url+检索参数)
2.使用REST request body来发送他们(url+请求体)
1.使用REST request URL检索
GET bank/_search?q=*&sort=account_number:asc
#查询bank这个索引下的数据,q=*查询所有,sort=account_number:asc 按照account_number进行asc升序排列
检索结果
这些检索结果前面的key代表什么意思官网上也有描述
至于写的什么自己翻译
这里检索到1000条数据,但是只给我们返回10条,这是因为ES默认值返回10条数据,做了分页处理
2.使用REST request body来发送他们(url+请求体)–Query DSL
官方推荐使用Query DSL模式检索数据
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "account_number": "asc" },
{ "balance": "desc" }
]
}
#query查询查询条件,match_all这个代表查询所有
#sort排序条件,account_number asc按照账号升序排列,这里演示两个字段排序,先根据account_number升序排列,然后根据balance降序排列
其他一些写法官网上面也有描述
分页查询
Query DSL
Elasticsearch提供了一个可以执行查询的Json风格的DSL (domain-specific language领域特定语言) 。这个被称为Query DSL.该查询语言非常全面,并且刚开始的时候感觉有点复杂,真正学好它的方法是从一些基础的示例开始的。
1.语法结构
一个典型的检索机构是这样的
GET /索引/类型/_search
{
#这里是做什么的操作
"query": {
#查询详细操作
"match_all": {}
},
xxxxxx
xxx
xxx
}
下面就一个一个学咯
查询所有根据balance字段倒叙
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "balance": "desc" }
]
}
查询所有并分页按照指定字段排序
这里取下一页和Mysql不一样哦,下一页from不是1,而是5,开始数据位置
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "balance": "desc" }
],
"from": 5,
"size": 5
}
检索所有数据,返回部分字段
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "balance": "desc" }
],
"from": 5,
"size": 5,
"_source": ["gender","age","employer"]
}
全文检索 match
这里不区分大小写,只要address中包含mill数据的,那么都会被查询出来,类似于Mysql中的模糊查询,这也是ES的倒排索引机制
GET /bank/_search
{
"query": {
"match": {
"address": "mill"
}
}
}
GET /bank/_search
{
"query": {
"match": {
"address": "Mill"
}
}
}
这里全文检索出来的数据会按照匹配得分进行排序展示
当查询的数据条件为数据类型,而不是字符串那么就是精确查询
GET /bank/_search
{
"query": {
"match": {
"account_number": "20"
}
}
}
短语匹配 match_phrase
这里使用match_phrase这个将mill lane组成一个短语
GET /bank/_search
{
"query": {
"match_phrase": {
"address": "mill lane"
}
}
}
对比match全文检索
GET /bank/_search
{
"query": {
"match": {
"address": "mill lane"
}
}
}
这里使用match就会检索address字段中包含mill lane这两项的都能匹配上
多字段匹配 multi_match
这里使用multi_match,条件数据为mill Blackgum,参与匹配的字段为[“city”,“address”],会进行分词,匹配度度高的分数大
GET /bank/_search
{
"query": {
"multi_match": {
"query": "mill Blackgum",
"fields": ["city","address"]
}
}
}
第一条数据两个字段都命中上了,分数较高
复合查询
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": {
"gender": "F"
}
},
{ "match": {
"address": "Mill"
}
}
]
}
}
}
#bool复合多个条件
#must是条件必须满足
必须满足gender=F和address=Mill
还有一种必须不满足
先试用必须满足查出几条数据
然后在使用must_not不满足age=38
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": {
"gender": "M"
}
},
{ "match": {
"address": "Mill"
}
}
],
"must_not": [
{"match": {
"age": "38"
}}
]
}
}
}
should应该匹配
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": {
"gender": "M"
}
},
{ "match": {
"address": "Mill"
}
}
],
"must_not": [
{"match": {
"age": "18"
}}
],
"should": [
{"match": {
"lastname":"Wallace"
}
}
]
}
}
}
#bool复合多个条件
#must是条件必须满足
#must_not是条件必须不满足
#should是满足更好+分,不满足也能查,作为加分项
第一条结果和第二条结果gender、address都是一样的,且age不为18,后面的lastname只有第一条数据匹配到了,那么他的命中分数就高一些
结果过滤 filter
filter使用过滤检索不会影响档命中得分/单独使用没有文档命中得分
这个是有文档命中得分的
GET /bank/_search
{
"query": {
"bool": {
"must":[
{
"range": {
"age": {
"gte": 18,
"lte": 30
}
}
}
]
}
}
}
使用filter是没有的
GET /bank/_search
{
"query": {
"bool": {
"filter": {
"range": {
"age": {
"gte": 18,
"lte": 30
}
}
}
}
}
}
复合检索+filter过滤
这是将复合检索出来的数据在进行filter过滤的
先不过滤检索数据
{
"query": {
"bool": {
"must": [
{ "match": {
"gender": "M"
}
},
{ "match": {
"address": "Mill"
}
}
],
"must_not": [
{"match": {
"age": "18"
}}
],
"should": [
{"match": {
"lastname":"Wallace"
}
}
]
}
}
}
加入filter
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": {
"gender": "M"
}
},
{ "match": {
"address": "Mill"
}
}
],
"must_not": [
{"match": {
"age": "18"
}}
],
"should": [
{"match": {
"lastname":"Wallace"
}
}
],
"filter": {
"range": {
"age": {
"gte": 18,
"lte": 30
}
}
}
}
}
}
这里就可以对比没加filter的数据,这里filter确实没有影响文档命中得分
非文本字段使用term更加精确
默认情况下,Elasticsearch在分析时更改文本字段的值。这使得查找文本字段值的精确匹配变得困难。要搜索文本字段值,请使用匹配查询。
GET /bank/_search
{
"query": {
"term": {
"address":"694 Jefferson Street"
}
}
}
#查询非字符串类型数据使用term
#文本类型的就用match检索
如果使用term检索字符串
这里是匹配不到的
.keyword精确匹配
GET /bank/_search
{
"query": {
"match": {
"address.keyword":"694 Jefferson Street"
}
}
}
#查询任何字段是都可以.keyword,这个的作用就是将这个694 Jefferson Street值精确匹配==,只有当694 Jefferson Street完全等于是才能匹配
这个.keyword和match_phrase有点像,其实有一个很大的区别
match_phrase是包数据即可含即可,而.keyword是必须等于
演示代码
使用.keyword
GET /bank/_search
{
"query": {
"match": {
"address.keyword":"694 Jefferson"
}
}
}
无法匹配
使用match_phrase
GET /bank/_search
{
"query": {
"match_phrase": {
"address":"694 Jefferson"
}
}
}
包含即可
本篇文章主要演示Elasticsearch的检索操作,下一篇将演示数据分析操作