MongoDB 文本索引的词干分析无法正常工作

2023-12-12

我正在尝试使用 MongoDB 的全文搜索功能并观察一些意外的行为。该问题与文本索引功能的“词干”方面有关。在线许多文章中都描述了全文搜索的方式，如果文档字段中有一个字符串“big Hunting dogs”，并且该字段是文本索引的一部分，那么您也应该能够搜索“hunt”或“hunting”如“狗”或“狗”。 MongoDB 应在索引和搜索时对文本进行标准化或词干化。因此，在我的示例中，我希望它将单词“dog”和“hunt”保存在索引中，并搜索这些单词的词干版本。如果我搜索“hunting”，MongoDB 应该搜索“hunt”。

嗯，这对我来说不是这样的。我在 Linux 上运行 MongoDB 2.4.8，并启用了全文搜索。如果我的记录值为“big Hunting dogs”，则仅搜索“big”就会产生结果，而搜索“hunt”或“dog”则不会产生任何结果。就好像未处于“规范化”形式的单词未存储在索引文本中（或以无法找到它们的方式存储）。使用 $regex 运算符进行搜索效果很好，也就是说，我可以通过搜索 /hunting/ 这样的字符串来查找相关字段，从而找到文档。

我尝试删除并重新创建全文索引 - 没有任何改变。我只能找到包含“正常”形式的单词的文档。搜索“狗”或“狩猎”（甚至“狗”或“狩猎”）等词不会产生任何结果。

我是否误解或误用了全文搜索操作，或者 MongoDB 中是否存在错误？

经过大量的实验和摸索之后，我发现了这种行为的原因。事实证明，相关集合中的文档具有“语言”属性。显然，该属性的存在和值使得这些文档不可搜索。（该值恰好是“ENG”。将其更改为“eng”可能会使该文档再次可搜索。但是，该字段具有完全不同的用途）。将字段重命名为“lang”后，我可以通过搜索“dog”或“dogs”找到包含单词“dogs”的文档。

我想知道这是否是 MongoDB 的预期行为——文档中语言属性的存在会影响文本搜索。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB 文本索引的词干分析无法正常工作的相关文章

实现快速 Javascript 搜索？

基本上我有一个带有文本框的页面和 ul 列在其下面这 ul 由用户的朋友列表填充用户开始在文本框中输入朋友的名字例如按 r 我想立即更新 ul 每次按键仅显示名字以 R 开头的朋友例如 Richard Redmond Raheem
Mongo C# 驱动程序更新嵌套数组中的特定元素

如何在 Mongo C 驱动程序中修改嵌套属性数组中的单个元素而不检索整个文档 public class Element public int Value get set public string Name get set publ
mysql LIKE 查询时间太长

SQL SELECT COUNT usr id as total results FROM users as usr LEFT JOIN profile as prof ON prof uid usr uid WHERE usr usern
（节点：20732）[DEP0018] DeprecationWarning：未处理的承诺拒绝已被弃用。未来在nodejs中

我正在尝试在我的应用程序中生成确认链接虽然它工作正常并且也生成链接但是当我访问该链接时它在 Chrome 控制台中显示 POST http localhost 3000 api auth confirmation 400 Bad Re
SQLite FTS4 使用特殊字符进行搜索

我有一个 Android 应用程序它使用 FTS4 虚拟表在 SQLite 数据库中搜索数据它工作正常但是当表中的数据包含特殊字符如或时 SQLite MATCH 函数不会给出任何结果我现在迷路了谢谢注意默认的分词器真的
Mongodb 数据建模/投票更新（向上和向下）

Mongo 中有一个关于投票数据模型更新查询的示例 http www mongodb org display DOCS MongoDB Data Modeling and Rails MongoDBDataModelingandRails
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
C# Mongo DeleteMany - 不使用类

我在 MongoDB 中有一个普通的不是 GridFS 集合我需要访问和删除一些文档我想需要在不使用类的情况下执行此操作昨天今天尝试了一些事情并在网上进行了很多搜索并尝试了很多事情无法弄清楚为什么 deletemany 对我
MongoDB：如果使用 $addToSet 或 $push，是否应该预先分配文档？

我一直在研究 MongoDB 我知道强烈建议在插入时完全构建预分配文档结构这样将来对该文档的更改不需要移动该文档磁盘周围这在使用 addToSet 或 push 时适用吗例如假设我有以下文档 id rsMH4GxtduZZfxQ
Mongodb shell mongo：通常只允许每个套接字地址（协议/网络地址/端口）使用一次。对于套接字：0.0.0.0:27017

前两天还好好的现在mongod不起作用甚至echo ps A grep mongo没有打印任何内容但它警告错误每个套接字地址只有一种用途怎么杀掉它我也尝试过不同的随机端口他们怎么可能也失败呢 D mongodb win32 x
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
最小验证在 Mongoose 中不起作用

我有一个架构其中余额字段的声明如下所示 balance type Number min 0 default 30 我将 0 设置为最小值这样余额就不会为负值但是当我通过更新查询减少余额值时余额结果是负值我的更新查询 User up
JAVA：如何搜索地图？

我有一个 Map 其键为字符串其值为集合包含整数假设我的钥匙看起来像苹果香蕉橙色等用户输入文本我将其保存为字符串变量如何在我的地图中搜索相同的密钥因此如果用户输入 apple 我如何将该字符串提供给方法并让该方法在我
Express中间件修改请求

我目前有一个正在运行的服务器前端使用nodejs mongo express 和 W2UI W2ui 请求来自包含所有参数的记录数组记录名称 foo 我想编写一个中间件在请求到达路由之前对其进行编辑和更改您可以创建自己的中间件来处
使用 Java 进行 MongoDB 查询。计算数组中的匹配项

我在 Mongo 中存储了类似于以下内容的数据 LIST NAME a VALUE z NAME b VALUE y NAME c VALUE x NAME d VALUE w NAME e VALUE v NAME f VALUE u N
护照本地猫鼬帐户注册的附加字段？

我将 Passport local mongoose 与 Node js Express js MongoDB 一起用于 Web 应用程序我想使用用户名字段密码字段公司名称字段和电话号码字段所有字段来注册用户作为字符串但是我只
限制号mongodb 输入中的行数

如何限制数量在kettle中使用的mongodb输入转换中检索到的行数我尝试在 mongodb 输入查询中使用以下查询但它们都不起作用查询限制 10 或 limit 10 请让我知道我哪里出错了谢谢迪普蒂有几个查询修改操作符
告诉我 SQL Server 全文搜索器疯了，不是我疯了

我有一些客户具有用户正在搜索的特定地址 123 通用方式数据库中有 5 行匹配 ResidentialAddress1 123 GENERIC WAY 123 GENERIC WAY 123 GENERIC WAY 123 GENERIC
MongoDB：在具有未知键的对象中查找给定字段值的文档

我正在建立一个关于论文论点的数据库它们与其他参数相关我将这些参数放置在带有动态键 https stackoverflow com questions 12393351 using a variable in mongodb updat
Node.js 和 Passport 对象没有 validPassword 方法

我正在使用 Node js Express Passport 创建一个简单的身份验证本地到目前为止我所达到的效果是当输入错误的用户名或密码时用户将被重定向到错误页面但是当用户输入正确的用户名和密码时我收到此错误 node mod

随机推荐

如何更改 CMakeLists.txt 查找 Boost 库的位置 Ubuntu

我使用的是 Boost 1 54 0 它位于 usr include 中我们放弃了这一点并安装了 Boost 1 57 0 它安装在 usr local include 中现在我使用 CMake 的 CLion 项目找不到 Boost
JavaScript 计算器不断将计算结果与输入的第一个数字连接起来进行下一次计算
在由切片和两个布尔数组索引的 numpy 数组中设置值

我有两个 numpy 数组 a np arange 100 100 reshape 100 100 b np random rand 100 100 我还有一个切片元组来提取数组的某个部分 slice slice 5 10 slice 5
Java：将对象添加到对象列表中

它非常简单但不知何故不起作用奇怪我有一个类类型列表我正在 for 循环中将对象添加到列表中在添加对象之前一切都正常但是当我尝试访问列表时只显示最后一个对象的值请参阅下面显示的输出这也是代码 List
如何获取复选框的 CheckedChanged 事件中的重复项？

我有一个CheckBox里面一个Repeater 像这样
关闭当前视图控制器中的先前模态视图控制器

我目前有 3 个 ViewController LoginViewController SignUpViewController and MainViewController 当用户打开应用程序时 LoginViewController将被
“滑动窗口”/元素分区

给定序列1 2 3 4 我想生成一个对的矩阵 1 2 2 3 3 4 用作另一个矩阵的索引实现这一目标最快的方法是什么你可以使用embed 反转输出上的列 embed 1 4 2 2 1 1 2 1 1 2 2 2 3 3 3 4
在字符类中使用 $ 锚点不起作用

我正在尝试编写一个正则表达式来匹配具有第一个 10 个字符大写字母数字的字符串然后是一个空格和一些其他文本或具有第一个 10 个字母数字字符的字符串似乎不起作用我写了这个 A Z0 9 10 s 这似乎适用于具有 10 个字符然后是
如何将单个表从 phpmyadmin 导出到逗号分隔的文本文件？

我需要将表从 phpmyadmin 导出到逗号分隔的文本文件我认为有一个代码但似乎找不到它我找到了一个但它不起作用我需要导出此表因为我需要对其进行组织和排序并添加另一列以便我可以将数据添加到此列请问我该怎么做在 PHPAd
iOS5：willSendRequest For Authentication Challenge 方法正在递归运行

我使用下面的代码通过远程服务器对用户进行身份验证如果我提供正确的用户名和密码则不会有问题因为身份验证正在进行并且我正在从服务器获取响应但是当我提供错误的凭据时会以递归方式调用此方法因此我无法打破它请帮助我如何打破这个问题
当程序员说“针对接口而不是对象进行编码”时，他们的意思是什么？

我已经开始了漫长而艰巨的学习和探索applyTDD 融入我的工作流程我的印象是 TDD 非常符合 IoC 原则在浏览了 SO 中的一些 TDD 标记问题后我发现针对接口而不是对象进行编程是一个好主意您能否提供简单的代码示例来说明这是
循环 Awesomium JSObject

我正在制作一个 C Windows 窗体应用程序其中包含 Awesomium 网络浏览器我正在尝试从表中获取一些行并将它们解析为数组 JSPart 在浏览器中运行良好这是我在 C 中使用的代码 JSObject villageRows
程序没有在 scanf("%c", &ch) 行停止，为什么？ [复制]

这个问题在这里已经有答案了程序不会在 scanf c ch 行停止为什么会发生这种情况有人可以向我解释一下吗 include
如何从 Google 表格中的范围填充 HTML 服务选择选项？

我正在尝试使用我正在使用的 Google 表格中供应商数据库选项卡的 A 列中包含的所有条目来填充我的 HTML 服务下拉选择选项列表但运行时它目前显示为空白有什么建议么应用程序脚本 function getVendors va
在电子邮件中共享意图时，Html.fromHtml 无法在正文中使用粗体文本

String mailContent b boldText b 我也在下面尝试过但没有成功 String mailContent strong boldText strong 电子邮件意图 Intent sendIntent new In
将 Newtonsoft.Json 与嵌套自定义类一起使用

我需要序列化一些自定义对象以存储信息但是我正在努力将这些对象从序列化的 JSON 字符串反序列化回其原始对象形式序列化的字符串看起来不错 MyStringArray stringInput1 stringInput2 MyCharAr
Aptana 3 jquery 代码辅助/提示

我已经使用 aptana 大约一周了最近几天才开始使用 jquery 但我很高兴获得任何代码帮助这将帮助我在学习时添加语法内容我已经搜索了几天但没有得到如何启用此功能的直接答案我读到它是受支持的并且应该通过创建新的 html 和
Android OutOfMemoryError：位图大小超出 VM 预算

我遇到了 OutOfMemoryError 的问题即在更改 Droid 移动设备的方向时位图大小超出了虚拟机预算但不是在任何其他移动设备中如 Android 普通版和 Android 小版我在 gridview 中显示 10 个图像
symfony 4 的路由顺序

我想要一个末尾带有通配符的网址site com username 尝试匹配 url 后site com photos and site com blog 我正在使用注释并有两个控制器我在这里找到了答案使用注释对路线进行排序但是版本 4
MongoDB 文本索引的词干分析无法正常工作

我正在尝试使用 MongoDB 的全文搜索功能并观察一些意外的行为该问题与文本索引功能的词干方面有关在线许多文章中都描述了全文搜索的方式如果文档字段中有一个字符串 big Hunting dogs 并且该字段是文本索引的一部分那

MongoDB 文本索引的词干分析无法正常工作

MongoDB 文本索引的词干分析无法正常工作 的相关文章

随机推荐

热门标签

MongoDB 文本索引的词干分析无法正常工作的相关文章