重学Elasticsearch7（来源官方文档）

2023-10-31

一、开篇总览

1. bulk操作最好请求体数据大小在5m-15m

2.由于要给文件系统缓存留下足够空间，es的jvm堆大小不要超过服务器可用内存空间的一半。

二、聚合

1.在聚合时，missing字段可以给没有该字段的文档以默认值

2.带权重的计算平均值,文档如果没有weight字段，值默认为1.

3.基数统计（`cardinality` ）基于hyperlog算法，相比hashset节约大量内存。如果聚合的字段是高基数字符串，那么可以在保存到es前先计算出hash值保存到文档中，最后计算的时候可以直接计算hash字段即可。

4.term聚合在数据分布式存储到多节点时是可能不准确的，默认是返回每个节点的前size个符合条件的数据然后聚合起来，不能保证精确性。可以选择加大size或者索引自定义路由解决问题。

5.聚合时大多时候应把外层的size设置为0，加快查询效率。

6.range聚合是左闭右开。

三、query dsl

1.must_not和filter都是一样的，不参加算分，属于filter上下文。

2.disjuction max（dis_max）复合查询，默认情况下会返回匹配度最高的那条查询语句所得的算分，如果两个文档同时符合匹配度最高的那条查询语句，他们的算分会相同，这时候可以使用tie_breaker参数，使得dis_max查询所得最后得分再加上Σ（其他条件所得的分数*tie_breaker）。

3.可以使用function score复合查询实现自定义算分规则。

4. match查询会对查询条件里面得文本进行分词，然后对分词后的结果进行查询，默认是满足分词的一个即可，也可设置operator参数使其为and全部满足。

5.M`ulti_match` query可以使一个查询对多个字段有效，类似于bool中的or，默认使用dis_max查询，即取得当中的最佳匹配条件作为分数。还可以对字段进行模糊匹配以及提高字段所得分比重，如下所示。

6.exist query

(1）exist query的存在的意思是该字段是否为空或者该字段是否能被索引。

7.prefix query可以开启index_prefixes参数使其指定范围内的字段进行索引加快前缀查询速度，典型的空间换时间。

8.match_phrase查询的流程：首先将输入的查询语句分词，然后去索引中查具有查询语句所有分词的文档，同时文档中的该字段分词必须按照查询语句的顺序进行。可以通过调整查询语句的slop,调整分词在文档中出现的顺序。

9.term query不会对搜索条件分词，别用term query查询text类型字段。

10.terms query可以对一个字段进行多个值查询，他们的关系是or，如果查询的值来源是文档本身。可以使用term lookup 语法:

11.可以使用terms_set对符合条件的查询语句数量进行限制，只返回满足特定匹配条件数量的结果才会返回。

12.可以使用script_score 进行简单的算分，例如使用文档的某个字段进行算分排序。

四、script

1.使用脚本时source内需要注入的参数必须写在外面的params字段，这样可以让脚本只编译一次，大大提高工作效率。

2.脚本可以先存储到集群中，使用的时候指定脚本名称即可，减少网络带宽消耗。

五、mapping

1.nested类型可以将数组内的对象每个都视作单独的对象，而不是object类型这样的会将数组内相同字段打平聚集在一起。

2.浮点类型最好使用scaled_float,其内部以long类型存储，因为压缩的原因可以更节约磁盘空间

3.自定义routing可以在查询时不必将搜索请求分散到索引中的所有分片，而是可以将请求仅发送到与特定路由值匹配的分片，同时为了防止将大索引全都放在一个分片导致数据倾斜，可以弄一个所有分片的子集作为索引的分片选择上，加快搜索性能提升。

4.定义数据结构时可以使用ignore_above这个参数限制字符串长度，当插入的字符超过这个参数大小，文档不能使用这个字段索引出来。

5.ignore_malformed参数可以忽略类型的不匹配，例如定义字段为integer,可以提交字符串类型，但是json类型是不能提交过来的，会忽略这个配置抛出异常，此外开启这个配置的字段是不能被索引的。

6.null_value可以使空值有一个默认值使其按照默认值被检索出来。

7._source可以指定哪些字段不保存到原始的json文档中，但是可以被索引，不过使用后有如下图片弊端，建议为了节省磁盘空间加大压缩等级。如果实在想让返回值没有某个字段，直接查询时进行source filter即可。

8.copy_to参数可以让某个字段的值复制到另外一个字段，source并不会改变

9.doc_value是专门存储用于在脚本等其他地方查询并且用于排序，聚合使用，如果某个字段没有这个需求可以使其关闭节省空间。

10.enbled只能用于obj对象，为false时对该字段插入不会有任何检查，该字段也不能进行任何索引。

六、模块

1.shard request cache

（1）默认只对size=0的结果有效，并且会缓存聚合结果和hits.total等信息。缓存会在节点refresh后失效,前提是真的有数据变更。

（2）如果请求中使用了脚本并含有随机数类似的参数，应该在url后面加上参数手动关闭本次请求缓存。缓存的key是请求体。

（3）缓存可以设置缓存大小以及缓存过期时间（通常是无意义的，因为索引refresh就会自动删除缓存）

2.node节点缓存仅仅缓存filter上下文的query语句。

七、通用推荐

1.在大索引中应该使用scroll或者search_after分页

(1)scroll:如果对结果没有排序要求只是简单的返回可以使用_doc排序，这样速度会更快，另外，scroll查询中如果有聚合，只会在第一次scroll查询返回，后续不会返回。弊端是不实时。当scroll到最后一页后，应该使用clear_scroll及时删除保存的快照。

(2)search after:需要在第一次查询时根据某个唯一字段（该字段是后续插入比前须大，这样保证了实时性）升序排列，然后根据排列后的升序字段最大值作为search after入参，这样就可以在分页时保证从各个节点返回的数据最大也只会有分页的size大小。弊端是不支持随机翻页。如果一定要随机翻页还是要使用from + size，可以在业务上规避翻页大小。

2.多使用bulk api来进行索引存取，这样有利于减少网络io，提高性能。当然对某个索引的bulk数量需要压测获取。不要超过几十mb。

3.使用多线程并发存取索引也是一个不错的方式去提高性能，这样有利于减少刷盘的性能损耗。

4.在业务允许的情况下，使用系统自动生成的id,这样可以少去集群查询一次id是否存在，提高了索引的插入速度。

5.index_buffer是用来暂存插入索引的文档的，最多给与512mb即可，超过这个大小对插入文档性能没有什么提升了。

6.尽量避免join,nested,parent_child,这个对索引检索的性能损耗很大。

7.索引的时候尽量查询更少的字段，可以用copy to代替multi_match这样的多字段查询。

8.如果范围聚合的范围查询都是固定的话，可以新增字段自己标识所属范围，用terms aggregation代替range aggragation加快查询速度。

9.有些字段虽然是数字但是仍然可以定义为keyword,取决于其是否常用作范围聚合或者term聚合。

10. 日期相关搜索尽量不要使用now，这样会无法利用缓存，建议可以四舍五入到分钟，这样在一分钟内的查询都是有缓存的，同时如果间隔越大，缓存越久，但是用户的体验就会有问题。

11.在多节点多副本情况下，可以使用preference指定分片顺序让缓存更好的利用起来。

12. 可以使用kibana的search profiler对查询进行多维指标观测。

13.如果对大量数据进行排序取出前n条（例如最新的前n条），1是可以手动指定搜索数据范围，例如最近一周发布的前n条，2是使用index sorting.详情见：得物社区亿级ES数据搜索性能调优实践

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从官方文档学习

elasticsearch

重学Elasticsearch7（来源官方文档）的相关文章

ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
C# Elasticsearch NEST 无法转换 lambda 表达式

我遇到了与此处描述的完全相同的问题但未得到解答 ElasticSearch NEST 搜索 https stackoverflow com questions 24615676 elasticsearch nest search I us
如何在不更改设置的情况下不区分大小写排序

我的索引名称是 data new 下面是插入索引的代码 test id 1 name A professor Bill Cage accounting id 2 name AB professor Gregg Payne engineeri
在流浪机器中使用elasticsearch设置graylog2服务器

我正在尝试在本地开发计算机上安装graylog2 服务器但遇到了elasticsearch 设置问题我的elasticsearch作为服务安装在我的开发机器上运行的vagrant机器上所以我的elasticsearch没有安装在127
ElasticCloud 的 ElasticSearch 身份验证错误？

我刚刚在 ElasticCloud 上设置了一个新的 ElasticSearch 集群我正在尝试遵循帮助文档 https cloud elastic co help 它说您可以按如下方式发布文档 curl https
Elasticsearch 数组必须和must_not

我的 elasticsearch 数据库中有一个如下所示的文档 tags gt tag 1 tag 2 tag 3 tag A created at gt 2013 07 02 12 42 19 UTC label gt Mon super
Elasticsearch：根据类型对不同字段进行排序

我的索引中有两种类型 Event and City 我正在尝试按日期将它们全部排序但是每种类型的日期字段名称都不同为了Event该值是在updated at领域和City日期是在update at其嵌套对象之一中的字段city eve
Elasticsearch 在 Mac 上存储数据的位置

类似的问题this one https stackoverflow com questions 24694201 where are data files of elasticsearch on a standard debian inst
Elasticsearch Nest 通配符查询（带空格）

简洁版本我想使用 Nest 编写一个弹性搜索查询来获取完整的索引项 ContentIndexables在我的例子中作为我的自定义类型已被索引该查询受 some string 术语查询的约束即 String StartsWith 其中
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
Elasticsearch 跨多个索引搜索 - 忽略不存在的索引

我有弹性集群其中我的索引包含当前日期例如 example idex 2016 07 26 gt exists example idex 2016 07 25 gt exists example idex 2016 07 24 gt do
我可以在 ids 过滤器或一般查询子句中指定的值数量的最大限制？

在elasticsearch中指定可以执行匹配的值数量的最大限制是多少我在某处读到它是 1024 但也是可配置的真的吗它如何影响性能 curl XPOST localhost 9200 my index search pretty d
连接所有 PostgreSQL 表并创建 Python 字典

我需要加入allPostgreSQL 表并将它们转换为 Python 字典数据库中有72张表总列数大于1600 我编写了一个简单的 Python 脚本该脚本连接多个表但由于以下原因无法连接所有表内存错误 https gist git
Elasticsearch 无法获取颁发者证书

我正在尝试使用 LetsEncrypt 加密 tls 证书但我的服务器页面显示 Kibana server is not ready yet 这是错误 etc kibana kibana yml type log timestamp 20
将 CSV 文件中的数字数据更改为文本

下面的查询是抓取数据并创建一个 CSV 文件我遇到的问题是名为 SPLE 的源在数据库中存储数字为 0 1 50 的数据然而在 CSV 中这些数字被收集在 CSV 中我希望在创建 CSV 时这些数字能够代表诸如以下的单词 0 T
如何在没有部署 K8S 的情况下重启 pod？

我部署了一个弹性搜索 https www elastic co elasticsearch使用此命令在 K8S 上集群helm install elasticsearch elastic elasticsearch 我可以看到 Pod 正在
NEST 搜索整个文档 C# Elasticsearch

我想使用 Nest 在 Elasticsearch 中查询超过一百万个文档我的代码 var response client Search
无法连接到docker中的elasticsearch容器

我正在尝试使用 docker 的官方 elasticsearch 镜像我遵循了本指南 https www elastic co guide en elasticsearch reference current docker html但是当
如何使用 monolog ElasticSearchHandler 登录 Laravel 应用程序

Monolog 包含弹性搜索处理程序和格式化程序但它作为自定义通道对 Laravel 的实现并不像 Laravel 文档网站上描述的那么简单以下是如何执行此操作的简要分步说明为您的弹性搜索日志记录创建一个配置文件 config ela
Elasticsearch 5.1 完成建议中的输出字段有什么好的替代方案吗？

在 ES 5 1 中索引数据时遇到的第一个错误是包含输出字段的完成建议映射 message MapperParsingException failed to parse nested IllegalArgumentException unk

随机推荐

Python 计算机视觉

Python 计算机视觉 from PIL import Image Image是PIL中比较重要的一个模块 im Image open F Desktop 今日须看代码 Python master back image bmp ims
python画散点图、折线图

Python 画图散点图scatter 保存savefig 及颜色大全 python中的散点图还可以这么画这个针对改变描点形状一散点图 import numpy as np import matplotlib pyplot as p
MySQL之锁的使用

MySQL表级锁的锁模式 MySQL的表级锁有两种模式表共享读锁 Table Read Lock 和表独占写锁 Table Write Lock 锁模式的兼容性对MyISAM表的读操作不会阻塞其他用户对同一表的读请求但会阻塞对同一表
Qt 类中Q_OBJECT的作用及其程序代码体现

Qt中类里为什么要加上Q OBJECT这个东西呢原来这是一个Qt定义的宏它的作用是什么呢原来这个宏中包含了Qt中最重要的一个机制也就是信号和槽的机制所有的Qt程序一定会使用这个机制下面我们可以先看一个简单的小程序一个类似于图片
c++自定义sort()函数的排序方法

1 引言在C 中 sort 函数常常用来对容器内的元素进行排序先来了解一下sort 函数 sort 函数有三个参数第一个是要排序的容器的起始迭代器第二个是要排序的容器的结束迭代器第三个参数是排序的方法是可选的参数默认的排序方法
Spring/Spring boot中静态变量赋值

情形1 静态变量为自动注入的对象解决方案设置两个变量非静态变量使用 resource注入Bean 然后使用 PostConstruct在Spring初始化Bean成功后为静态变量赋值 Component public class XX
sql语句直接执行很快，java程序执行慢

一次线上Case 一条联合查询语句直接在sql server查询分析器执行 1秒以内通过java程序执行很慢要7秒返回结果贴出sql 语句 select temp id temp userId temp operationUserId
紫枫术河 imx6 uboot的mtd分区总结（rootfs为ubi文件系统） imx6 uboot的mtd分区总结（rootfs为ubi文件系统）

版权声明本文为博主原创文章未经博主允许不得转载 https blog csdn net qq 29729577 article details 51130209 此文章基于U Boot 2014 04版本烧写工具为mfgtool 开发
蓝桥杯每日一题（18）：李白打酒（python）

Topic 话说大诗人李白一生好饮幸好他从不开车一天他提着酒壶从家里出来酒壶中有酒2斗他边走边唱无事街上走提壶去打酒逢店加一倍遇花喝一斗这一路上他一共遇到店5次遇到花10次已知最后一次遇到的是花他正好把酒喝光
ecshop中ajax的调用原理 1

ecshop中ajax的调用原理 1 首先ecshop是如何定义ajax对象的 ecshop中的ajax对象是在js transport js文件中定义的里面是ajax对象文件声明了一个var Ajax Transport 对象和一个方
大坝安全监测有哪些监测项目

大坝安全监测有工程主体结构地基基础两岸边坡相关设施以及周围环境所作的测量及观察也包括对建筑物外表及内部大范围对象的定期或不定期的直观检查和仪器探查通过观测仪器和设备以及时取得反映大坝和基岩性态变化以及环境对大坝作用的各种数据的
centos6.5搭建贴吧云签到平台（多图预警）

前提我已经用oneinstack服务搭建好了主机环境LNAMP Linux NginxApache Mysql php 默认目录是 data wwwroot default 详细步骤 1 先下载要安装的文件我用的是GitHub上star
虚拟机vmware安装win10提示operating system not found解决办法

首先如果启动提示进入BIOS 则删除下述文件的efi 首先先设置启动PE镜像加载启动盘PE ISO后进入PE 将系统镜像复制到U盘 PE里先分区然后再安装 PE里安装完后重启后面的步骤按自动的即可
postman循坏调用接口

postman循坏调用接口新建一个Collections 在新建的Collections里面新建需要循环的接口将需要循坏变化的参数设置成变量设置好变量之后运行整个collections 变量值的数量应该与迭代次数一致可以导入jso
YOLOv5+单目测距（python）

YOLOv5 单目测距 python 1 相关配置 2 测距原理 3 相机标定 3 1 标定方法1 3 2 标定方法2 4 相机测距 4 1 测距添加 4 2 细节修改可忽略 4 3 主代码 5 实验效果相关链接 1 YOLOV7 单目
python ttk Treeview的插入、清空、各种点击事件、获取条目值、标题单击排序

昨天整了一天Tkinter的treeview 发现中文的教程乃至提问都很少其中两个问题的解决都是靠steakoverflow上找到的在这里放出来我遇到并解决的问题大家以后可能遇到的话就能省点事了插入方法 import tkinter
第二章-Kali安装

目录 2 Kali Linux安装硬盘安装虚拟机安装 01硬盘安装 02DOCKER 03虚拟机安装 3 Kali Linux 安装持久加密USB安装熟悉环境熟悉BASH命令 01 持久加密USB安装 1 02 持久加密USB安装
专注于开源技术的研究与应用由Tencent://Message协议想到的一个解决方案

源代码下载 http files cnblogs com phinecos HelloWorldProtocal rar 前天在BruceZhang 的一篇博文求助如何在ASP页面中调用Winform程序呢中回答了他提出的问题但细想
jsp调用证书类ocx控件问题

1 先注册ocx 本次使用的方式是先将我调用的两个控件打包成 CAB文件然后做成一个exe让用户去下载注册 2 jsp页面上使用进行调用 ps clsid可以在注册表中找到 id是自己定义的因为控件在第一步已经注册到注册表里 code
重学Elasticsearch7（来源官方文档）

一开篇总览 1 bulk操作最好请求体数据大小在5m 15m 2 由于要给文件系统缓存留下足够空间 es的jvm堆大小不要超过服务器可用内存空间的一半二聚合 1 在聚合时 missing字段可以给没有该字段的文档以默认值 2 带权重的

重学Elasticsearch7（来源官方文档）

一、开篇总览

1. bulk操作最好请求体数据大小在5m-15m

2.由于要给文件系统缓存留下足够空间，es的jvm堆大小不要超过服务器可用内存空间的一半。

二、聚合

1.在聚合时，missing字段可以给没有该字段的文档以默认值

2.带权重的计算平均值,文档如果没有weight字段，值默认为1.

3.基数统计（cardinality ） 基于hyperlog算法，相比hashset节约大量内存。如果聚合的字段是高基数字符串，那么可以在保存到es前先计算出hash值保存到文档中，最后计算的时候可以直接计算hash字段即可。

4.term聚合在数据分布式存储到多节点时是可能不准确的，默认是返回每个节点的前size个符合条件的数据然后聚合起来，不能保证精确性。可以选择加大size或者索引自定义路由解决问题。

5.聚合时大多时候应把外层的size设置为0，加快查询效率。

6.range聚合是左闭右开。

三、query dsl

1.must_not和filter都是一样的，不参加算分，属于filter上下文。

3.可以使用function score复合查询实现自定义算分规则。

4. match查询会对查询条件里面得文本进行分词，然后对分词后的结果进行查询，默认是满足分词的一个即可，也可设置operator参数使其为and全部满足。

5.Multi_match query可以使一个查询对多个字段有效，类似于bool中的or，默认使用dis_max查询，即取得当中的最佳匹配条件作为分数。还可以对字段进行模糊匹配以及提高字段所得分比重，如下所示。

6.exist query

(1）exist query的存在的意思是该字段是否为空或者该字段是否能被索引。

7.prefix query可以开启index_prefixes参数使其指定范围内的字段进行索引加快前缀查询速度，典型的空间换时间。

8.match_phrase查询的流程：首先将输入的查询语句分词，然后去索引中查具有查询语句所有分词的文档，同时文档中的该字段分词必须按照查询语句的顺序进行。可以通过调整查询语句的slop,调整分词在文档中出现的顺序。

9.term query不会对搜索条件分词，别用term query查询text类型字段。

10.terms query可以对一个字段进行多个值查询，他们的关系是or，如果查询的值来源是文档本身。可以使用term lookup 语法:

11.可以使用terms_set对符合条件的查询语句数量进行限制，只返回满足特定匹配条件数量的结果才会返回。

12.可以使用script_score 进行简单的算分，例如使用文档的某个字段进行算分排序。

四、script

1.使用脚本时source内需要注入的参数必须写在外面的params字段，这样可以让脚本只编译一次，大大提高工作效率。

2.脚本可以先存储到集群中，使用的时候指定脚本名称即可，减少网络带宽消耗。

五、mapping

1.nested类型可以将数组内的对象每个都视作单独的对象，而不是object类型这样的会将数组内相同字段打平聚集在一起。

2.浮点类型最好使用scaled_float,其内部以long类型存储，因为压缩的原因可以更节约磁盘空间

4.定义数据结构时可以使用ignore_above这个参数限制字符串长度，当插入的字符超过这个参数大小，文档不能使用这个字段索引出来。

5.ignore_malformed参数可以忽略类型的不匹配，例如定义字段为integer,可以提交字符串类型，但是json类型是不能提交过来的，会忽略这个配置抛出异常，此外开启这个配置的字段是不能被索引的。

6.null_value可以使空值有一个默认值使其按照默认值被检索出来。

7._source可以指定哪些字段不保存到原始的json文档中，但是可以被索引，不过使用后有如下图片弊端，建议为了节省磁盘空间加大压缩等级。如果实在想让返回值没有某个字段，直接查询时进行source filter即可。

8.copy_to参数可以让某个字段的值复制到另外一个字段，source并不会改变

9.doc_value是专门存储用于在脚本等其他地方查询并且用于排序，聚合使用，如果某个字段没有这个需求可以使其关闭节省空间。

10.enbled只能用于obj对象，为false时对该字段插入不会有任何检查，该字段也不能进行任何索引。

六、模块

1.shard request cache

（1）默认只对size=0的结果有效，并且会缓存聚合结果和hits.total等信息。缓存会在节点refresh后失效,前提是真的有数据变更。

（2）如果请求中使用了脚本并含有随机数类似的参数，应该在url后面加上参数手动关闭本次请求缓存。缓存的key是请求体。

（3）缓存可以设置缓存大小以及缓存过期时间（通常是无意义的，因为索引refresh就会自动删除缓存）

2.node节点缓存仅仅缓存filter上下文的query语句。

七、通用推荐

1.在大索引中应该使用scroll或者search_after分页

2.多使用bulk api来进行索引存取，这样有利于减少网络io，提高性能。当然对某个索引的bulk数量需要压测获取。不要超过几十mb。

3.使用多线程并发存取索引也是一个不错的方式去提高性能，这样有利于减少刷盘的性能损耗。

4.在业务允许的情况下，使用系统自动生成的id,这样可以少去集群查询一次id是否存在，提高了索引的插入速度。

5.index_buffer是用来暂存插入索引的文档的，最多给与512mb即可，超过这个大小对插入文档性能没有什么提升了。

6.尽量避免join,nested,parent_child,这个对索引检索的性能损耗很大。

7.索引的时候尽量查询更少的字段，可以用copy to代替multi_match这样的多字段查询。

8.如果范围聚合的范围查询都是固定的话，可以新增字段自己标识所属范围，用terms aggregation代替range aggragation加快查询速度。

9.有些字段虽然是数字但是仍然可以定义为keyword,取决于其是否常用作范围聚合或者term聚合。

10. 日期相关搜索尽量不要使用now，这样会无法利用缓存，建议可以四舍五入到分钟，这样在一分钟内的查询都是有缓存的，同时如果间隔越大，缓存越久，但是用户的体验就会有问题。

11.在多节点多副本情况下，可以使用preference指定分片顺序让缓存更好的利用起来。

12. 可以使用kibana的search profiler对查询进行多维指标观测。

13.如果对大量数据进行排序取出前n条（例如最新的前n条），1是可以手动指定搜索数据范围，例如最近一周发布的前n条，2是使用index sorting.详情见：得物社区亿级ES数据搜索性能调优实践

重学Elasticsearch7（来源官方文档） 的相关文章

随机推荐

热门标签

3.基数统计（`cardinality` ）基于hyperlog算法，相比hashset节约大量内存。如果聚合的字段是高基数字符串，那么可以在保存到es前先计算出hash值保存到文档中，最后计算的时候可以直接计算hash字段即可。

5.M`ulti_match` query可以使一个查询对多个字段有效，类似于bool中的or，默认使用dis_max查询，即取得当中的最佳匹配条件作为分数。还可以对字段进行模糊匹配以及提高字段所得分比重，如下所示。

重学Elasticsearch7（来源官方文档）的相关文章