ElasticSearch学习：文档的基本操作

2023-11-10

上一个我们基本是围绕索引操作，里面的指定类型，或者文档里面的一些属性。

这里是主要关注文档操作，毕竟主要常见的操作就是围绕文档内容来进行的，毕竟主要是做搜索。

首先先导入一些数据进去。
一简单的查询操作

put /testdoc/user/1
{
  "name": "张三",
  "age": 28,
  "desc": "法外狂徒",
  "tags": ["旅游", "渣男", "交友"]
}
 
put /testdoc/user/2
{
  "name": "李四",
  "age": 30,
  "desc": "佳木斯大拐",
  "tags": ["旅游", "靓女", "唱歌"]
}
 

#以下是查询
#id查询
GET testdoc/user/1
 
 #分词查询
GET testdoc/user/_search?q=name:张

以下是GET testdoc/user/_search?q=name:张的返回结果：

{
  "took" : 9,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.6931471,
    "hits" : [
      {
        "_index" : "testdoc",
        "_type" : "user",
        "_id" : "1",
        "_score" : 0.6931471,
        "_source" : {
          "name" : "张三",
          "age" : 28,
          "desc" : "法外狂徒",
          "tags" : [
            "旅游",
            "渣男",
            "交友"
          ]
        }
      }
    ]
  }
}

二复杂的查询
排序、分页、高亮、模糊查询、标准查询
首先再添加俩用户

put /testdoc/user/3
{
  "name": "王二麻子",
  "age": 28,
  "desc": "买豆腐",
  "tags": ["游戏", "猛男", "宅"]
}
 
put /testdoc/user/4
{
  "name": "王二麻",
  "age": 30,
  "desc": "主播",
  "tags": ["直播", "购物", "吹牛"]
}

模糊查询

GET testdoc/user/_search
{
  "query": {
    "match": {
      "name": "王二麻"
    }
  }
}

返回结果

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 2.5518394,
    "hits" : [
      {
        "_index" : "testdoc",
        "_type" : "user",
        "_id" : "4",
        "_score" : 2.5518394,
        "_source" : {
          "name" : "王二麻",
          "age" : 30,
          "desc" : "主播",
          "tags" : [
            "直播",
            "购物",
            "吹牛"
          ]
        }
      },
      {
        "_index" : "testdoc",
        "_type" : "user",
        "_id" : "3",
        "_score" : 2.234622,
        "_source" : {
          "name" : "王二麻子",
          "age" : 28,
          "desc" : "买豆腐",
          "tags" : [
            "游戏",
            "猛男",
            "宅"
          ]
        }
      }
    ]
  }
}

套用一下别人的截图
在这里插入图片描述
针对模糊搜索的添加过滤

#真对_source的过滤
#_source先看一下都有些什么
{
  "_index" : "testdoc",
  "_type" : "user",
  "_id" : "4",
  "_version" : 2,
  "_seq_no" : 4,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "name" : "王二麻",
    "age" : 30,
    "desc" : "主播",
    "tags" : [
      "直播",
      "购物",
      "吹牛"
    ]
  }
}



#根据_source里面的name和desc来过滤
GET testdoc/user/_search
{
  "query": {
    "match": {
      "name": "王二麻"
    }
  },
  "_source": ["name", "desc"]
}

排序过滤

# ASC 升序 DESC降序
GET testdoc/user/_search
{
  "query": {
    "match": {
      "name": "王二麻"
    }
  },
  "sort":[{
    "age": "asc"
  }]
}

分页查询

#这里的form和size类似我们的分页参数的pageNum和pageSize
GET testdoc/user/_search
{
  "query": {
    "match": {
      "name": "王二麻"
    }
  },
  "sort":[{
    "age": "asc"
  }],
  "from":0,
  "size":1
}

布尔值查询
这里要注意bool的几个设置，must shuould must_not gt大于 lt小于 (当然还有gte 大于等于 lte 小于等于)


# 多条件查询 must 相当于and
GET testdoc/user/_search
{
  "query": {
    "bool": {
      "must": [
        {"match": {
          "name": "王二麻"
        }},
        {"match": {
          "age": 30
        }}
      ]
    }
  }
}


# 多条件查询 should 相当于or
GET testdoc/user/_search
{
  "query": {
    "bool": {
      "should": [
        {"match": {
          "name": "王二麻"
        }},
        {"match": {
          "age": 30
        }}
      ]
    }
  }
}


# 多条件查询 must_not 相当于 not
GET testdoc/user/_search
{
  "query": {
    "bool": {
      "must_not": [
        {"match": {
          "name": "王二麻"
        }},
        {"match": {
          "age": 30
        }}
      ]
    }
  }
}


# 过滤查询1 age > 24

GET testdoc/user/_search
{
  "query": {
    "bool": {
      "must_not": [
        {"match": {
          "name": "王二麻"
        }}
      ],
      
       "filter": [
        {"range": {
          "age": {
            "gt": 24
          }
        }}
      ]

    }
  }
}


# 过滤器2  22<age<30
GET testdoc/user/_search
{
  "query": {
    "bool": {
      "must_not": [
        {"match": {
          "name": "王二麻"
        }}
      ],
      
        "filter": [
        {"range": {
          "age": {
            "lt": 28,
            "gt": 25
          }
        }}
      ]

    }
  }
}

多条件查询
实际还是match匹配的引用，只不过不是完全用上面那些关键字来

GET testdoc/user/_search
{
  "query": {
    "match": {
      "tags": "主播 男"
    }
  }
}

精确插叙
term关键字根据底层的倒排索引
于match对比：

term直接精确查找
match根据分词器来查找

keyword类型和text类型
keyword类型不会被分词器解析，term: 精确匹配

PUT test4
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "desc": {
        "type": "keyword"
      }
    }
  }
}


PUT /test4/_doc/1
{
  "name": "Java Name",
  "desc": "Java Desc"
}

PUT /test4/_doc/2
{
  "name": "Java Name",
  "desc": "Java Desc 2"
}


GET test4/_search
{
  "query": {
    "term": {
      "desc": "ZP Java Desc"
    }
  }
}

# 按照text类型匹配(查不到可能是自己的分词器不行我这个用的是ik，没加别的分词器，单词的匹配就不行)
GET test4/_search
{
  "query": {
    "term": {
      "desc": "Java"
    }
  }
}

_analyze, _explain是Elasticsearch提供的辅助API，经常不为人所知和所用。_explain 用来帮助分析文档的relevance score是如何计算出来的，而_analyze是Elasticsearch一个非常有用的API，它可以帮助你分析每一个field或者某个analyzer/tokenizer是如何分析和索引一段文字。

GET test4/_search
{
  "query": {
    "term": {
      "desc": "ZP Java Desc"
    }
  }
}




GET _analyze
{
  "analyzer": "standard",
  "text":"ZP JAVA"
}

多个值精确匹配

PUT /test_db/_doc/3
{
  "t1": "22",
  "t2": "2020-09-10"
}
 
PUT /test_db/_doc/4
{
  "t1": "33",
  "t2": "2020-09-11"
}
 
GET test_db/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "t1": "22"
          }
        },
         {
          "term": {
            "t1": "33"
          }
        }
      ]
    }
  }
}

高亮查询

GET test5/user/_search
{
  "query": {
    "match": {
      "name": "张三"
    }
  },
  "highlight": {
    "pre_tags": "<p class='key' style='color:red'>",
    "post_tags": "</p>", 
    "fields": {
      "name": {}
    }
  }
}

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

搜索引擎

大数据

ElasticSearch学习：文档的基本操作的相关文章

Elasticsearch批量设置_id

当我使用 id 设置将文档添加到 elasticsearch 时我得到 Field id is a metadata field and cannot be added inside a document Use the index AP
ElasticSearch：对聚合键进行排序，不区分大小写，并保持键的大小写

我想从汽车中获得不同的制造值并且制造值应该不区分大小写地按升序排序我使用的是elasticsearch版本2 4 4 颜色和制作字段的映射 color type string fields keyword type string ind
向 ElasticSearch 术语聚合添加其他字段

索引文档如下 id 1 title Blah platform id 84 url http facebook com title Facebook 我想要的是按平台计数和输出统计数据为了计数我可以使用术语聚合platform id作为
将 Elasticsearch 结果导出到 CSV 文件

我正在尝试将使用以下查询找到的结果导出到桌面上的 CSV 中这是我第一次使用 Elasticsearch 和 cURL 所以我对如何做到这一点感到困惑 from elasticsearch import Elasticsearch es
使用 KMS 的 AWS RDS 加密是否会影响性能？

Amazon states https aws amazon com about aws whats new 2015 01 06 amazon rds encryption with kms mysql postgresql that 加
弹性搜索模糊匹配，精确匹配首先显示

我想在查询中使用模糊匹配但精确匹配显示在结果的顶部我已经尝试过以下方法 return this gt client gt search array index gt self INDEX type gt self TYPE body g
如何将2个匹配查询加入到elasticsearch的查询中？

我想查询以下数据user id is 1 and name is John 写一个常用的SQL很容易 select from t where user id 1 and name John 但对我来说进行elasticsearch的查询并不
Elasticsearch：如何查询连接数？

如何询问我的 Elasticsearch 服务器现在有多少个连接这与插座数量相同吗我也不知道如何获得这些数字这与客户端的数量不同对吧因为每个客户端可能打开多个连接找不到任何相关信息但我确实发现您可以在 Elasticsearc
elasticsearch查询字符串分析器针对不同字段使用不同的分析器

当对具有不同分析器 stem ngram等的多个字段执行查询时 elasticsearch是否对每个字段的查询字符串执行特定的分析是的除非您在查询中指定分析器这请求参数 http www elasticsearch org guid
ElasticSearch 多滚动 Java API

我想从索引中获取所有数据由于项目数量对于内存来说太大我使用滚动很好的功能 client prepareSearch index setTypes myType setSearchType SearchType SCAN setScro
ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
ElasticSearch 定义自定义映射与默认“_doc”映射冲突

尝试创建自定义映射类型时会发生此问题为第一个插入弹性创建自定义映射后想要创建 doc映射类型和冲突就发生在这里第一步我创建一个映射 mappings properties field1 type keyword field2 type
在Windows Xampp上安装和使用elasticsearch php客户端

我下载的是elasticsearch 5 1 1 zip来自https www elastic co downloads elasticsearch https www elastic co downloads elasticsearch
Elasticsearch 单个字段的多个分析器

我使用严格的预定义映射将不同类型的文档存储在单个索引中它们都有一些字段例如 body 但我希望在索引时对它们进行稍微不同的分析例如对特定文档使用不同的标记过滤器并在搜索时以相同的方式处理据我所知分析器不能按文档指定我还考虑使
在 ElasticSearch API 应用程序中找不到 NodeBuilder

我正在尝试实现 Elasticsearch API 我的系统接受 nodeBuilder 时出现错误这是代码 import org elasticsearch action index IndexResponse import org e
ElasticCloud 的 ElasticSearch 身份验证错误？

我刚刚在 ElasticCloud 上设置了一个新的 ElasticSearch 集群我正在尝试遵循帮助文档 https cloud elastic co help 它说您可以按如下方式发布文档 curl https
无法使用 java 8 在 Windows 10 上安装 elasticsearch 5.1.1

我正在尝试在安装了 java 8 111 的 Windows 10 笔记本电脑上安装 ElasticSearch 5 1 1 当我尝试安装 Elastic search 时触发错误 C Users 用户名 Downloads elastic
search_after 在弹性搜索中如何工作？

我一直在尝试在我们的应用程序中使用 Elasticsearch 但分页限制为 10k 对我们来说实际上是一个问题并且由于必须超时问题滚动 API 也不是推荐的选择我发现 Elasticsearch 有一个叫做 search after
Elasticsearch 在 Mac 上存储数据的位置

类似的问题this one https stackoverflow com questions 24694201 where are data files of elasticsearch on a standard debian inst
自动完成建议中的输出字段

当我想在 elasticsearch 中索引文档时会发生此问题 message MapperParsingException failed to parse nested IllegalArgumentException unknown

随机推荐

Linux内核源码分析-进程调度(三)-从进程创建到唤醒的过程去了解CFS调度器

从进程创建到唤醒的过程去了解CFS调度器从do fork开始创建子进程初始化新建进程p相关的调度参数 cfs的task fork操作更新cfs rq上正在运行的进程的运行时间信息更新cfs rq的最小虚拟运行时间更新进程p对应的
redis学习笔记

概述 redis可以当作缓存来使用存在内存里比读数据库更快但是比从内存变量里取数据还是要慢不少的 redis sql 内存变量的对比按存取速度来看内存变量最快 sql最慢但按照持久化的角度来说正好相反各有优缺点按需选择使用
加法乘法原理、排列组合、线性规划

排列组合 1 加法原理与乘法原理加法原理分类思想一个事件的发生分为几类事件的发生通俗的说是好几种情况的发生乘法原理分步思想一个事件的发生分为几个子事件分步发生这里要注意 1 子事件如何把事件划分为几个子事件呢子事件是
dlopen “no suitable image found ”问题之解决

做一个练手小项目基于 react transform boilerplate 的demo 克隆 react transform boilerplate项目装包 package json中的包 style loader css loade
并发、并行、同步、异步的概念

并发与并行假设一个工厂包含多个车间一个车间包含多个工人和多个房间什么是cpu 工厂是时刻在运行的因此可以理解cpu时刻在运行什么cpu的核数假设把一个cpu比作一份电量的话一份电量又只能满足一个车间运行那么其他车间就得停止
使用python写一个星球大战游戏.py

如果要使用 Python 写一个类似于星球大战的游戏需要用到一些专业的游戏引擎比如 Pygame 首先需要安装 Pygame 库可以使用以下命令进行安装 pipinstall pygame 其次可以在 Pygame 中使用 pyt
网络安全人才青黄不接、数字化转型迫在眉睫、你还在犹豫吗？

大专能不能学网络安全呢大专学网络安全能不能找到工作呢大专学网络安全有竞争力吗网络上关于质疑大专学历进入网络安全行业的声音越来越多了居然有很多人在质疑大专学历从事网络安全没有竞争力很多人看到某些招聘软件上起薪12K的薪资就望而却步了
Linux文件管理

成功不易加倍努力 1 文件系统目录结构 1 1文件系统的目录结构 1 2 常见的文件系统目录功能 1 3 应用程序的组成部分 1 4 Linux下的文件类型 2 文件操作命令 2 1 显示当前工作目录 2 2 绝对和相对路径 2 3 更改
Nano编辑器安装使用指南

关于nano Nano编辑器是一个命令行文本编辑器具有简单易用的界面和一些基本功能 Nano小巧友好提供许多额外的特性例如交互式的查找和替换定位到指定的行列自动缩进特性切换国际化支持文件名标记完成等 Nano是为了代替闭源的
《Zookeeper-分布式过程系统技术详解》第一部分基础概念笔记学习

1 Zookeep的客户端API功能强大其中包括保障强一致性有序性和持久性实现通用的同步原语的能力在实际分布式系统中并发往往导致不正确的行为 ZooKeeper提供了一种简单的并发处理机制 2 ZooKeeper不适用的场景整
重新学javaweb---JSTL标签

JSTL简介标准标签库JSTL的全名为 Java Server Pages Standard Tag Library JSTL主要提供了5大类标签库核心标签库为日常任务提供通用支持如显示和设置变量重复使用一组项目测试条件以及其他
Promise常用API介绍

Promise中的API PromiseState 实例对象中的一个属性 Promisestate 状态 pending 未决定 resolved fullfilled 成功 rejected 失败 pending 变为resolved p
CSDN周赛64期题解（含部分代码）

计算之魂主题周赛如期回归因为差不多每次都是新题让人多了点期待相信非编程题无需多言答案都在书里翻书翻得快满分无障碍当然如果提前读过此书就更好了比如原书中把金块切了 2 刀问题中扩展了一下变成切 9 刀如果提前理解过原
【推荐系统】一、推荐系统简介

1 推荐系统的作用和意义在这个时代无论信息消费者还是信息生产者都面临巨大的挑战信息消费者在大量信息中找到自己感兴趣的信息很困难信息生产者将自己生产的信息让广大消费者关注很困难推荐系统将用户与信息联系起来 1 1 用户角度推荐
Mysql语句执行顺序

1 SQL书写顺序 select distinct 显示字段 from 表名 join 要连接的表名 on 连接查询条件 where 约束条件 group by 分组字段 having 分组过滤条件 order By DESC 降序或AS
NSLog效率低下的原因以及NSLog宏定义

我是前言打Log是我们debug时最简单朴素的方法 NSLog 对于objc开发就像 printf 对于c一样重要但在使用 NSLog 打印大量Log 尤其是在游戏开发时如每一帧都打印数据 NSLog 会明显的拖慢程序的运行速度游戏
java实现敏感词过滤算法DFA并忽略敏感词中的特殊字符

参考文章 https blog csdn net chenssy article details 26961957 补充说明 1 具体的DFA介绍参考原文章此处只是补充了文章中没有介绍的点以及根据实际需求进行了改造 2 最大小匹配规则
Flask学习笔记_BBS论坛搭建（三）

Flask学习笔记 BBS论坛搭建三 1 cms管理 1 1 项目模块划分目录结构搭建 1 2 每个模块注册蓝图并绑定 1 3 数据库配置连接迁移控制这里本来用了flask script 但migrate的新版不支持他了所以就
CSDN竞赛第41期题解

CSDN竞赛第41期题解非编程题部分第一题算盘是一种古代中国发明的计算机原因在于人们在操作算盘时可以充分利用人脑的计算能力错的第二题以下选项中哪一项不属于计算机的本质特征 C 受电力驱动电力不是本质特征第三题布莱兹帕
ElasticSearch学习：文档的基本操作

上一个我们基本是围绕索引操作里面的指定类型或者文档里面的一些属性这里是主要关注文档操作毕竟主要常见的操作就是围绕文档内容来进行的毕竟主要是做搜索首先先导入一些数据进去一简单的查询操作 put testdoc user 1 n

ElasticSearch学习：文档的基本操作

ElasticSearch学习：文档的基本操作 的相关文章

随机推荐

热门标签

ElasticSearch学习：文档的基本操作的相关文章