具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上

2024-02-13

这是我的没有功能分数的查询：

{
  "from": 200,
  "size": 25,
  "query": {
    "bool": {
    "filter": {
          "bool": {
            "must": [
              {
                "nested": {
                  "query": {
                    "terms": {
                      "cotypes.id": [
                        199
                      ]
                    }
                  },
                  "path": "cotypes"
                }
              },
              {
                "range": {
                  "relevance": {
                    "from": 6,
                    "to": null,
                    "include_lower": true,
                    "include_upper": true
                  }
                }
              }
            ],
            "must_not": {
              "terms": {
                "ontologyId": [
                  1314696,
                  1314691
                ]
              }
            }
          }
        },
      "must": {
        "match": {
          "name.nameStandard": {
            "query": "john smith",
            "type": "boolean",
            "boost": 10
          }
        }
      }
    }
  }
}

此查询将在约 250 毫秒内返回响应。

但我需要添加一些提升因子来提高默认得分。我修改了查询以使用函数得分，但之后查询花费了太长时间（~3000ms）

这是分数查询函数：

{
  "from": 200,
  "size": 25,
  "query": {
  "function_score": {
    "query": {
    "bool": {
    "filter": {
          "bool": {
            "must": [
              {
                "nested": {
                  "query": {
                    "terms": {
                      "cotypes.id": [
                        199
                      ]
                    }
                  },
                  "path": "cotypes"
                }
              },
              {
                "range": {
                  "relevance": {
                    "from": 6,
                    "to": null,
                    "include_lower": true,
                    "include_upper": true
                  }
                }
              }
            ],
            "must_not": {
              "terms": {
                "ontologyId": [
                  1314696,
                  1314691
                ]
              }
            }
          }
        },
      "must": {
        "match": {
          "name.nameStandard": {
            "query": "john smith",
            "type": "boolean",
            "boost": 10
          }
        }
      }
    }
    },
    "functions": [
      {
        "script_score": {
          "script": {
            "file": "calculate-score",
            "lang": "groovy",
            "params": {
              "relevance_boost": 0.5
            }
          }
        }
      }
    ],
    "boost_mode": "sum"
  }
}
}

calculate-score.groovy 脚本如下：

def penalize = 1
def penalizeClassDict = [
    '226': 0.25,
    '14106': 0.25,
    '656': 0.25
   ]
for (item in _source.cotypes)
{
    if(penalizeClassDict.containsKey(item.id.toString()))
        penalize = penalize * penalizeClassDict[ item.id.toString()]
}
_score + (pow(_source.relevance, relevance_boost)) * 1

请帮助我使查询执行得更好！

先感谢您！

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

performance

elasticsearch

Groovy

具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上的相关文章

如何加快 Java VM (JVM) 的启动时间？

我正在运行启动多个 JVM 进程的测试与 JVM 内运行的实际测试时间相比 JVM 的总结启动时间非常重要我怎样才能加快速度我已经使用了 client 选项这确实有帮助但没有我想要的那么多还有其他方法吗比如预加载一堆 JVM
Grails/GGTS 2.4.2 没有将插件放在类路径上？

我正在尝试将旧的 1 3 Grails 项目更新到最新的 Grails Groovy etc 所以我下载了 Grails 2 4 2 Groovy 2 3 和 Java 1 7 0 65 然后我通过 Import gt Grails 导入了
field 和 field.keyword 之间的区别

如果我将一个包含多个字段的文档添加到 Elasticsearch 索引中当我在 Kibana 中查看它时我每次都会得到相同的字段两次其中之一将被称为 some field 另一个将被称为 some field keyword 这种行为
如何针对 IE 进行优化？

我有一个 JS 密集型应用程序它在 IE 中运行缓慢我将花费大约一周的时间来优化 IE 并且我想要一些关于尝试的方向我发现这个线程引用Drip https ieleak svn sourceforge net svnroot iele
修改 Groovy 中现有的 xml 文件

我有一个 pom xml 文件例如
Numpy 与 Cython 速度

我有一个分析代码它使用 numpy 执行一些繁重的数值运算只是出于好奇尝试使用 cython 进行少量更改来编译它然后我使用 numpy 部分的循环重写它令我惊讶的是基于循环的代码要快得多 8 倍我无法发布完整的代码但我整理
我的 Delphi 11.1 调试器在 x64 项目上突然变得非常缓慢；大约一周前还可以。有什么想法吗？

更新拔掉网络电缆和wifi 会导致几乎恢复正常的调试速度已尝试禁用防火墙没有任何变化但没有网络恢复正常服务更新 2 所有 Windows x64 版本都存在缓慢问题而不仅仅是单个大型项目如果我构建并调试 32 位 Wind
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
如何查询elasticsearch大于和小于？

我想获取 1000 到 2000 之间的值我尝试了以下查询 query bool filter range price gte 1000 price lte 2000 但这并没有给出令
为什么我的代码在编译用于分析 (-pg) 时在多线程下运行比在单线程下运行慢？

我正在写一个光线追踪器最近我在程序中添加了线程以利用 i5 四核上的附加内核奇怪的是应用程序的调试版本现在运行速度变慢但优化后的构建运行速度比添加线程之前更快我将 g pg 标志传递给 gcc 以进行调试构建并将 O3 标志
为什么对本地列表求和比用“GHC -O2”对教会编码列表求和慢？

为了测试教会编码的列表如何针对用户定义的列表和本机列表执行我准备了 3 个基准测试用户定义的列表 data List a Cons a List a Nil deriving Show lenumTil n go n Nil where
在 groovy 脚本中执行外部程序并捕获输出

我需要编写一个常规脚本即执行外部程序并将该程序的输出打印到控制台这是相关的代码片段 def pmdCommand scriptDir run sh pmd d filesToAnalyse def sout new StringBuff
zk 与 gwt zk 请求太多

您好我正在尝试比较 zk 和 gwt 的性能在我的比较中如果框架本身将一些代码转换为js 那么我自己无法编写任何javascript 如get 但我无法自己编写js 在以上述方式编写代码时几乎所有在浏览器上完成的操作都会将请求发送到
为什么 ConcurrentHashMap::putIfAbsent 比 ConcurrentHashMap::computeIfAbsent 更快？

使用 ConcurrentHashMap 我发现computeIfAbsent 比putIfAbsent 慢两倍这是简单的测试 import java util ArrayList import java util List import
我必须做什么才能使通过 HTTPS 提供的图像等内容缓存在客户端？

我使用 Tomcat 作为服务器使用 Internet Explorer 6 作为浏览器我们应用程序中的网页大约有 75 张图像我们正在使用 SSL 加载所有内容似乎非常慢如何配置 Tomcat 以便 IE 缓存图像如果您通过 h
Elasticsearch，获取节点锁失败，是以下位置可写

Elasticsearch 不会开始使用 bin elasticsearch 它引发以下异常 ElasticsearchIllegalStateException Failed to obtain node lock is the foll
更快地评估从右到左的矩阵乘法

我注意到以二次形式评估矩阵运算右到左明显快于左到右在 R 中取决于括号的放置方式显然它们都执行相同的计算量我想知道为什么会这样这与内存分配有什么关系吗 A 5000 5000 B 5000 2 A matrix runif 5000
ElasticSearch：设置 search_analyzer 时必须设置字段分析器

我读过有关 ES 的早期版本 type mapper parsing exception reason analyzer on field email must be set when search analyzer is set 这是当我
numpy 数组最快的保存和加载选项

我有一个生成二维的脚本numpy数组与dtype float和形状的顺序 1e3 1e6 现在我正在使用np save and np load对数组执行 IO 操作然而这些函数对于每个数组都需要几秒钟的时间是否有更快的方法来保存和加载
Spring Data elasticsearch @Query 注解嵌套对象

我有两节课 Document public class PracticeQuestion private int userId private List

随机推荐

将 url 表放入 `data.frame` R-XML-RCurl

我正在尝试将网址表放入data frame 在其他示例中我发现以下代码有效 library XML library RCurl theurl lt https es finance yahoo com q cp s BEL20 BR ta
无法在vb.net中将文件写入硬盘

您好我检查了此处存在的所有问题对我没有帮助所以我问好的我们开始吧我尝试将文件从资源复制到 C Test 文件夹对我不起作用这是我尝试过的首先我将 test txt 文件放在资源中复制到 C Test 文件夹但出现错误
WebBrowser 控件和 cookie

我对 WebBrowser 控件和 cookie 有疑问首先当人们在普通的 Web 浏览器在我的例子中是 IE9 中导航时会发生什么 1 1 我打开网页http www gmail com http www gmail com 我输入
如何以编程方式获取计算机的本地网络 IP 地址？

我需要使用 C 和 NET 3 5 从我的程序中获取计算机的实际本地网络 IP 地址例如 192 168 0 220 在这种情况下我不能只使用 127 0 0 1 我怎样才能做到这一点如果您正在寻找命令行实用程序 ipconfig 可以
Python 在屏幕上绘图

我正在编写一个需要选择屏幕区域的应用程序我需要将光标更改为十字形然后在用户选择上绘制一个矩形我搜索的第一件事是如何操作光标然后我遇到了 wxPython 使用wxPython 我可以轻松地在带有面板的框架上执行此操作问题是我需要窗
如何在 Python 日志消息中将“levelname”重命名为“level”？

我有一个 Python 日志记录配置如下所示 LOGGING CONFIG version 1 formatters human class logging Formatter format asctime s levelname s m
我应该阻止密码自动完成吗？

有很多在这里回复 https stackoverflow com questions 2530 how do you disable browser autocomplete on web form field input tag on h
更新应用程序而不安装新的APK

我正在尝试查看是否可以远程更新用户手机上的应用程序无需下载 apk文件这是我的老板的信息收集请求他认为这在 iOS 上是可能的所以他希望我在 Android 上检查一下本质上我试图让我的应用程序偶尔从我们的网络服务器中提取版本
BigQuery 可以用作主要查询引擎吗？

我想知道是否可以深入了解使用 BigQuery 作为我们正在开发的分析工具的主要查询引擎的可行性我们的公共 API 实际上需要使用 PHP SDK 可能超过 1 亿行执行至少数百个并发 SELECT 查询但从当前文档来看 BigQue
使用 NodeJS+Express、aws-sdk 将文件直接流式传输到 s3

我想使用 NodeJS 通过浏览器直接上传一些大文件到 s3 目前还不清楚如何准备该文件上传到 s3 可能有更好的模块如 Knox 来处理这种情况但我不确定有什么想法吗文件对象 file webkitRelativePath las
如何使用带 IN 子句的 PDO 准备语句？ [复制]

这个问题在这里已经有答案了我以这种格式将一些数据存储在 MySQL 内的字段中 1 5 9 4我将这个字段命名为related 现在我想在一个内部使用这个字段IN 子句 with PDO 我将该字段内容存储在 related多变的这是我
为应用整个页面的正文提供背景颜色。为什么？

body background color red div Hello World div So the background color red 适用于整个页面高度但当我检查页面时正文的高度仅达到div含有你好世界有人请解释一下为什
根据设备大小缩放多行 UIButton 上的字体

当前设置我有一个多行的 UIButton它被添加到它的超级视图一个普通的UIView 按钮的宽度是其父视图的 90 因此当其父视图的大小发生变化时标签的宽度也会相应变化因为Autolayout限制接下来在 viewDidLoa
Firebase 处理与数据库的断开连接

我不确定它是否已断开连接或数据库错误事件首先当开始在 Firebase 上加载数据时我会显示一个对话框然后我想在两种情况下关闭该对话框有互联网加载数据成功我在 onDataChange 中关闭对话框应用程序启动时没有互联网连
使用 getters() 还是在 POJO 中使用直接字段访问？

给定一个简单的 POJO 它真的会产生影响吗或者使用以下任一方法是否可能产生副作用 total getPriorAmount getCurrentAmount OR total this priorAmount this currentA
从 Eclipse 运行干净的 Android 构建？

有没有办法从 Eclipse 运行构建每次都会清除应用程序的数据我想这样做是为了检查我的应用程序的首次运行体验如果您使用的是 eclipse 请转到应用程序的运行配置单击目标选项卡然后选中擦除用户数据字段我相信这会在每次运行 e
在 JavaFX 中的所有表格单元格上设置工具提示

我的应用程序包含一个TableView 根据每行中特定单元格的值通过设置自定义单元格工厂来更改行样式setCellFactory对于本专栏这很好用现在我想添加一个工具提示使用它没什么大不了的setTooltip 然而此工具提示应设
删除与正则表达式匹配的文件

在 Windows 上从与 Perl 中的某些正则表达式匹配的目录中删除所有文件的最短和最好的方法我的例子全部删除 txt目录中的文件但保留tmp txt 视窗 chdir dir or die unlink grep ne tmp
Pandas 将所有对象列转换为类别

我想要一个优雅的函数来将 pandas 数据框中的所有对象列转换为类别 df x df x astype category 执行类型转换df select dtypes include object 将子选择所有类别列但是这会导致其他列
具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上

这是我的没有功能分数的查询 from 200 size 25 query bool filter bool must nested query terms cotypes id 199

具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上

具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上 的相关文章

随机推荐

热门标签

具有函数得分的 ElasticSearch 查询运行速度慢了 10 倍以上的相关文章