Elasticsearch知识点

索引（index）对应数据库
类型（type）对应数据库中的数据表(注意：ES6.0以后就不支持一个索引指定多个类型了，默认一个类型且不能修改)
文档（Document）文档是存储在ES中的一个JSON字符串，相当于数据库中表的具体数据行。
字段（Field）对应数据库中每一行数据的具体的列
ID序列：ID是一个未接的唯一标识，如果在库中没有提供ID,系统会自动生成一个ID
映射（Mapping）代表索引的结构，类似于数据库表结构。动态映射和静态映射
索引模板（template）: 使用索引模板
路由：当存储一个文档的时候，它会存储在唯一的主分片中。内部routing算法将数据路由到各个分片：shard = hash(routing) % number_of_primary_shards，routing 是一个可变值，默认是文档的 _id ，也可以设置成一个自定义的值，number_of_primary_shards 主分片的数量

4 Elasticsearch基本数据类型(看这里)

5 Elasticsearch基本检索类型

5.1 检索和过滤

检索和过滤的区别（看这里）
检索和过滤的适用场景，针对他们的区别可以确定各自的使用场景

5.2 结构化检索

精确匹配检索：term查询单值精确匹配、terms查询多值精确匹配，terms_set多值匹配并且可以定义返回文档所需的匹配术语数
范围检索：range query（低版本用 range filter）
存在与否检索：exists query
前缀查询：prefix query
通配符检索：wildcard query
正则检索：regexp query
类型检索：type query
id检索：ids query
模糊查询：fuzzy query,与通配符查询类似，但是fuzzy查询，当搜索条件是个不准确的单词或词时，可以自动帮助纠正后查询

5.3 全文检索

分词全文检索：match
布尔前缀检索：match_bool_prefix
短语检索：match_phrase
短语前缀检索：match_phrase_prefix
多字段匹配检索：multi_match
支持与或非的字符串检索：query_string
简化的字符串检索：simple_query_string
间隔检索：intervals

5.4 复合检索

固定得分检索看这里
bool组合检索：must、should(通过minimum_should_match指定匹配的个数)、must_not、filter 看这里
改变评分检索：boosting、function score、dis max query

5.5 特定检索

嵌套检索：nested query
父子检索：has_child query、has_parent query、parent_id query
地理检索：geo 查询和 distance_feature query(查询更接近提供的origin日期或时间点的数据。或者查询来查找某个位置最近的邻居）
相似文档检索：more_like_this
脚本检索：script query

6 Elasticsearch基本基本聚合类型

6.1 Metric聚合

去重统计：cardinality
平均统计：Avg
最大和最小统计：Max、Min
求和统计：Sum
统计汇总：Stats(包含平均值、最大最小值、总数)
更多

6.2 Buckting聚合

terms按字段分组统计：terms
根据字段值统计：histogram
根据时间值统计：datehistogram
根据时间段统计：daterange（可以指定时间段格式和具体查询的时间区间）
过滤Filter聚合：filter 和 filters
嵌套聚合：nested
更多

6.3 Pipeline聚合

bucked script聚合：bucket script
bucked selector聚合：bucket selector
bucked sort聚合：bucket sort
Avg/Max/Min/Sum bucked聚合
更多

7 Elasticsearch基本操作类型

7.1 Elasticsearch集群基本操作

集群健康状态分类：green健康，yellow亚健康，red病态，集群健康可以使用 health api 查看情况
集群状态监控API：集群状态state、集群统计stats、集群任务管理_tasks、集群待处理任务pending_tasks、节点信息_nodes、活跃线程信息_nodes/hot_threads、更多集群api
集群备份：_snapshot、_restore

7.2 Elasticsearch索引基本操作

增：put index
删：delete index
索引数据迁移：
reindex
第三方工具：elasticsearch-dump、Elasticsearch-Exporter、logstash、elasticsearch-migration
修改副本数，注意索引一旦创建，分片数不可更改，除非reindex
索引压缩：shrink
查：Get index、 get/index/_settings

7.3 Elasticsearch文档基本操作

单个文档写入：put document
批量写入：bulk写入
第三方导入：1.通过logstash导入多种数据源的数据（关系型数据库，非关系型数据库，大数据存储），2.kafka推送，3.利用flume
单个删除：delete document
批量删除：delete-by-query
单个修改：update 结合 script
批量修改：update-by-query
单个检索：get
批量检索：mult get、scroll游标
分页：from+size
高亮：Unified Highlighter(默认)、plain ighlighter、fvh highlighter(适合大文件)
搜索推荐：Term suggester、Phrase suggester、Completion suggester、Context Suggester
分词：中英文分词的区别，
中文分词插件有：ik、jieba、ansj
动态更新词典策略
同义词词典配置
分析调试：profile:true

7.4 Elasticsearch常用的工具

kibana工具：xpack提升安全
Head浏览器插件
cerebro监控工具

8 Elasticsearch进阶

8.1 Elasticsearch集群规划

节点数规划：Master主节点、Client路由节点、data数据节点
分片、副本规划：每个分片支持的数据量、业务数据分类梳理
堆内存核心原理
部署优化：堆内存部署优化、线程数/队列优化设置、候选主节点设置、更新中文分词词典

8.2 Elasticsearch数据建模

数据建模的重要性
数据建模的流程

8.3 Elasticsearch生命周期管理

基于时间轴动态创建索引（利用滚动索引和索引模板）
定时清理索引：curator
冷热数据分离

8.4 Elasticsearch写入性能优化

Elasticsearch写入慢的原因：1.没有使用批量操作，2.使用批量操作，但值设置不合理，3.ES队列线程池设置不合理
Elasticsearch写入提速：1. 采用bulk批量写入 2. 使用多线程写入 3. 增加refesh间隔，默认1s，每秒都会将内存的数据刷新到磁盘，如果设为30S，表示30S的数据是写入内存缓存的，30秒才将内存的数据刷新到磁盘 4. 如果搭建ES集群，禁止refresh和replica，当批量导入大数据时可以禁止副本复制操作 5. 采用自增ID

8.5 Elasticsearch检索性能优化

Elasticsearch检索慢的原因：
1）索引设置不合理（如所有数据写入一个固定索引）
2）Mapping映射字段设置不合理
3）DSL设置不合理，有优化空间，如：wildcard
4）返回字段非常多，如：cont/html_cont
5）慢日志查询
6）监控集群状态：cpu、内存、磁盘使用情况判断是否是硬件原因，确认是否有并行写入等
Elasticsearch检索提速：
1）先确认哪里慢了？利用 profile:true 分析
通过在 query 部分上方提供 “profile: true” 来启用Profile API。
```
GET /ljjtest/book/_search
{
  "profile":"true",
  "query":{
    "match":{
      "author":"鲁迅"
    }
  }
}
```
2）如果是硬件层面，直接扩展硬件
3）数据层面：提前数据建模、减少检索字段、Mapping优化、避免使用script、使用近似日期、只读数据force_merge、范围检索使用keyword而非range
4)缓存方面：使用独立缓存系统，preference优化缓存使用率

8.6 Elasticsearch磁盘读写优化

8.7 Elasticsearch插件开发

9 Elasticsearch实践

Elasticsearch日志分析：借助ELK可视化分析
Elasticsearch全文检索，做搜索引擎

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

关于Java开发知识点系统整理

javaweb

搜索引擎

elasticsearch

Elasticsearch知识点的相关文章

ElasticSearch：对聚合键进行排序，不区分大小写，并保持键的大小写

我想从汽车中获得不同的制造值并且制造值应该不区分大小写地按升序排序我使用的是elasticsearch版本2 4 4 颜色和制作字段的映射 color type string fields keyword type string ind
Elasticsearch 对字符串排序未返回预期结果

当对包含多个单词的字符串字段进行排序时 Elasticsearch 会拆分字符串值并使用最小值或最大值作为排序值即当对值为老虎之眼的字段进行升序排序时排序值为 Eye 当按降序排序时排序值为 Tiger 假设我的索引中有老虎之
为什么我在elasticsearch中需要“store”：“yes”？

我真的不明白为什么核心类型链接 http www elasticsearch org guide reference mapping core types 它在属性描述中说例如对于数字 store 设置为 yes 将实际字段存储在索引中
match_none 有什么用？

我浏览了docs https www elastic co guide en elasticsearch reference current query dsl match all query html query dsl match no
Python elasticsearch DSL 聚合/每个文档嵌套值的度量

我试图找到 2 级嵌套中的最小值每个文档单独的最小值到目前为止我能够进行聚合计算搜索结果中所有嵌套值的最小值但无需按文档进行分隔我的示例架构 class MyExample DocType myexample id Intege
Logstash删除类型并保留_type

我有一个logstash 客户端和服务器客户端将带有logstash的udp输出的日志文件发送到服务器服务器也运行logstash来获取这些日志在服务器上我有一个 json 过滤器它会在实际日志的字段中提取 json 格式的消息
如何使用elasticsearch进行分页？来自 vs 滚动 API

我使用elasticsearch作为数据库来存储大量日志数据我知道有两种方法可以进行分页使用大小并来自 API 使用滚动API 现在我使用 from 进行分页从前端和后端获取页面和大小参数 Java searchSourceBuild
如何将2个匹配查询加入到elasticsearch的查询中？

我想查询以下数据user id is 1 and name is John 写一个常用的SQL很容易 select from t where user id 1 and name John 但对我来说进行elasticsearch的查询并不
从中间部分匹配完成建议elasticsearch

我有一个名为搜索建议具有以下 search suggest type completion analyzer simple payloads true preserve separators false preserve position
ElasticSearch 定义自定义映射与默认“_doc”映射冲突

尝试创建自定义映射类型时会发生此问题为第一个插入弹性创建自定义映射后想要创建 doc映射类型和冲突就发生在这里第一步我创建一个映射 mappings properties field1 type keyword field2 type
将 ElasticSearch SearchResponse 对象转换为 JsonObject

我想将elasticsearch搜索结果转换为Json对象我还没有找到任何直接转换的正确方法 SearchResponse response client prepareSearch index setExplain true execu
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
在 Elasticsearch 中删除文件后回收磁盘空间

当我从 Elasticsearch 中删除文档时为什么我的总大小保持不变尽管由于没有以前存储的数据而明显小得多我读过有关索引优化的内容但我不确定这是什么或如何做到这一点 Thanks 我确信 SO 和 Google 上都有大量与
从 node.js 创建对 AWS ES 实例的有效签名请求

我试图找到一个示例说明如何连接到 Node js 中的 AWS ES 实例然后通过一个简单的请求访问 ES 集群我正在尝试使用elasticsearch节点包 https www npmjs com package elasticse
Elasticsearch 关于“空索引”的查询

在我的应用程序中我使用了几个elasticsearch索引它们在初始状态下不包含索引文档我认为这可以称为空该文档的映射是正确且有效的该应用程序还有一个包含实体的关系数据库这些实体可能具有在 elasticsearch 中关联的
尝试在 ElasticSearch 中查询和聚合，但聚合不起作用 - elasticsearch.js 客户端

我尝试查询我的数据集有两个目的匹配一个术语可转售 true 按价格对结果进行排序最低到最高数据集文档是 data resellable true startingPrice 0 id 4emEe r x5DRCc5 buyNowP
Elasticsearch：根据类型对不同字段进行排序

我的索引中有两种类型 Event and City 我正在尝试按日期将它们全部排序但是每种类型的日期字段名称都不同为了Event该值是在updated at领域和City日期是在update at其嵌套对象之一中的字段city eve
Elasticsearch 在 Mac 上存储数据的位置

类似的问题this one https stackoverflow com questions 24694201 where are data files of elasticsearch on a standard debian inst
自动完成建议中的输出字段

当我想在 elasticsearch 中索引文档时会发生此问题 message MapperParsingException failed to parse nested IllegalArgumentException unknown
Elasticsearch：预期的字段名称，但得到了 START_OBJECT

我一直在尝试运行以下查询但每次运行时都会收到以下错误 nested ElasticsearchParseException Expected field name but got START OBJECT field value fact

随机推荐

第十四届蓝桥杯第三期模拟赛（python版）

总体难度不大正赛肯定比这难本人答案代码样例都能过前五个填空题正确性应该都问题不大有更好方法欢迎放出来大题但可能有一些细节没有考虑到时间复杂度这一方面是都考虑了的大题仅供参考有更好的方法的欢迎讨论目录问题1 问题2 问题
项目总结：如何开发出好的项目

每件事都需要考虑它的价值然后决定投入 1 项目如果要做的好必须要有丰富的文档支持文档的意义在于只有形成文档才能更好的去沟通和判断对有可能出现问题的地方提前预警另外任何一个系统不只有开发成本运维成本有时会超出我们的想象即便一
卷积神经网络在自然语言处理中的应用

卷积神经网络最典型的应用领域是计算机视觉卷积神经网络在图像分类中取得了重大突破典型应用有facebook的图像自动标注还有自动驾驶等卷积神经网络也可以用于自然语言处理由于卷积神经网络在计算机视觉中的应用最广首先阐述这个然后再介
点、线、面生成mvt（MapBox Vector Tile）格式的瓦片总结

矢量切片可以以三种形式呈现 GeoJSON TopoJSON 和 MapBox Vector Tile mvt 矢量切片技术继承了矢量数据和切片地图的双重优势有以下优点瓦片以mvt格式的存储是以每一个瓦片号为基准进行存储的大小都是2
Basic Level 1013 数素数 (20分)

题目令 P i表示第 i 个素数现任给两个正整数 M N 10 4 请输出 P M到 P N的所有素数输入格式输入在一行中给出 M 和 N 其间以空格分隔输出格式输出从 P M到 PN的所有素数每 10 个数字占 1 行其间
Java将数据导出为xml格式

需求前后端分离项目 Springboot项目需要将学生信息导出为xml文件 StudentController java GetMapping getXml public void studentXml HttpServletRequ
linux spi测试程序,spidev测试方法 /how to test spidev

在设备树中配置spidev 首先需要在设备树配置好spi设备可参考如下配置 ecspi3 pinctrl names default pinctrl 0 cs gpios dmas dma names rx tx status okay
Excel分段线性插值函数实现

问题已知 X和Y有下表的对应关系当一个新的4
高级FPGA设计技巧！多时钟域和异步信号处理解决方案

有一个有趣的现象众多数字设计特别是与FPGA设计相关的教科书都特别强调整个设计最好采用唯一的时钟域换句话说只有一个独立的网络可以驱动一个设计中所有触发器的时钟端口虽然这样可以简化时序分析以及减少很多与多时钟域有关的问题但是由于FP
python 连接MySQL数据库

方式一 pymysql 下载mysql驱动模块 pip install pymysql python 链接mysql示例导入mysql连接驱动模块 import pymysql host ip地址 port 端口号 user 数据库用户名
【华为OD统一考试B卷

在线OJ 已购买本专栏用户请私信博主开通账号在线刷题运行出现 Runtime Error 0Aborted 请忽略华为OD统一考试A卷 B卷新题库说明 2023年5月份华为官方已经将的 2022 0223Q 1 2 3 4 统一
链表算法的一些领会

有些题目是一节一节的处理链表比如reverseBetween ListNode head int m int swapPairs ListNode head reverseInKGroup ListNode head int k 主要考虑
docker操作

一 docker常用操作 1 docker基本命令批注第9条若不写版本号默认使用lastest 最新版本建议拉取镜像带上版本号第10条其中q是当下id队列的意思比如查看所有的容器的id docker ps a q docke
华为OD机试真题 Java 实现【支持优先级的队列】【2023 B卷 100分】

一题目描述实现一个支持优先级的队列高优先级先出队列同优先级时先进先出如果两个输入数据和优先级都相同则后一个数据不入队列被丢弃队列存储的数据内容是一个整数二输入描述一组待存入队列的数据包含内容和优先级三输出描述队列
如何设置电脑的固定IP地址

大家在上网时电脑的IP地址往往都是自动选择的但在局域网内有时会方便共享文件和监控流量等操作时需要固定的IP地址下面将简单介绍如何手设置电脑的固定IP地址步骤单击电脑网络连接图标打开网络和共享中心点击本地连接点击详细信息即可看
vue列表渲染，鼠标点击改变样式

话不多说看下面的代码吧 HTML div ul class nav li item li ul p list ind p div 注别忘记先引入vue js
淘宝滑块x82y-226流程分析(不涉及逆向)

分析目标微信公众号 y小白的笔记 https mp weixin qq com s Py7I6RG7UT9EtdpXlV98aA 只分析验证码加载流程不说具体细节版本 226 目标参数slidedata n 成功返回 code 0 r
webstorm快速配置react

以下都是废话建议看菜鸟教程也推荐这一个链接它是React几种基本配置方案你可以根据需求选择合适的配置默认你装了node js和npm还有ws2018 2 4 首先在设置 setting 里搜索lang 语言与框架找到并JavaS
怎样用Java求水仙花数和水仙花数的数量

首先我们了解一下水仙花数的定义一个各个位上的数字三次方之和等于他本身的三位数因此为了求水仙花数我们的程序会有以下几个需求 1 首先表示出所有的三位数用循环表示这里用for循环示例 2 然后表示出其个位十位百位 3 当这个三位
Elasticsearch知识点

目录 1 什么是Elasticsearch 2 Elasticsearch的特点 3 Elasticsearch基础概念 4 Elasticsearch基本数据类型看这里 5 Elasticsearch基本检索类型 5 1 检索和过滤 5

Elasticsearch知识点

1 什么是Elasticsearch?

2 Elasticsearch的特点

3 Elasticsearch基础概念

4 Elasticsearch基本数据类型(看这里)

5 Elasticsearch基本检索类型

5.1 检索和过滤

5.2 结构化检索

5.3 全文检索

5.4 复合检索

5.5 特定检索

6 Elasticsearch基本基本聚合类型

6.1 Metric聚合

6.2 Buckting聚合

6.3 Pipeline聚合

7 Elasticsearch基本操作类型

7.1 Elasticsearch集群基本操作

7.2 Elasticsearch索引基本操作

7.3 Elasticsearch文档基本操作

7.4 Elasticsearch常用的工具

8 Elasticsearch进阶

8.1 Elasticsearch集群规划

8.2 Elasticsearch数据建模

8.3 Elasticsearch生命周期管理

8.4 Elasticsearch写入性能优化

8.5 Elasticsearch检索性能优化

8.6 Elasticsearch磁盘读写优化

8.7 Elasticsearch插件开发

9 Elasticsearch实践

Elasticsearch知识点 的相关文章

随机推荐

热门标签

Elasticsearch知识点的相关文章