Solr 您的意思是（拼写检查组件）

2024-05-07

我在我的应用程序中使用 solr，并集成了拼写检查组件，但我遇到了一些问题：

第一的：当我输入一个用空格分隔的术语时，他们会给我每个术语的更正

Eg : “水” => “什么术语”但事实是watters

第二：当我输入一些带有错误术语的短语时。尽管其他术语是正确的，但它们将拼写应用于所有术语。

Eg : "差异性 in lankuage使用约定” =>“语言使用的差异转换".

真实的是“语言使用惯例的差异”

这是我的配置solrconfig.xml :

<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
            <str name="queryAnalyzerFieldType">textSpell</str>
            <lst name="spellchecker">
                <str name="name">default</str>
                <str name="field">spell</str>
                <str name="spellcheckIndexDir">spellchecker</str>
            </lst>
</searchComponent>

<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
            <lst name="defaults">
                <str name="spellcheck.onlyMorePopular">true</str>
                <str name="spellcheck.extendedResults">false</str>
                <str name="spellcheck.count">1</str>
            </lst>
            <arr name="last-components">
                <str>spellcheck</str>
            </arr>
</requestHandler>

架构.xml：

字段类型：

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
            <analyzer type="index">
                <tokenizer class="solr.StandardTokenizerFactory"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="1" splitOnCaseChange="1"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
                <filter class="solr.SnowballPorterFilterFactory" language="English"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.StandardTokenizerFactory"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
                <filter class="solr.SnowballPorterFilterFactory" language="English"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
            </analyzer>
            <analyzer type="multiterm" >
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
            </analyzer>
        </fieldType>


    <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
                <analyzer type="index">
                   <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                     <filter class="solr.LowerCaseFilterFactory"/>
                     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
                     <filter class="solr.StandardFilterFactory"/>
                     <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
                </analyzer>
                <analyzer type="query">
                     <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
                     <filter class="solr.LowerCaseFilterFactory"/>
                     <!--<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>-->
                     <filter class="solr.StandardFilterFactory"/>
                     <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
                </analyzer>
            </fieldType>

领域：

<field name="title" type="text" indexed="true" stored="true" termVectors="true"/>
<field name="spell" type="textSpell" indexed="true" stored="true" multiValued="true"/>

复制字段

<copyField source="title" dest="spell"/>

我很感激你的帮助

Cheers

对于你的第一个问题，你可以使用断字拼写检查器 https://issues.apache.org/jira/browse/SOLR-2993

至于你的第二个问题你可以设置 <str name="spellcheck.onlyMorePopular">true</str> to <str name="spellcheck.onlyMorePopular">false</str>看看这是否有预期的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Solr

autocorrect

spellchecking

Solr 您的意思是（拼写检查组件）的相关文章

Solr - 从数据库导入日期时间字段 -> 2 小时差异

我正在 Solr 中导入日期时间列 SQLServer 并且 solr 中的值始终比数据库中早 2 小时并且具有完整导入和增量导入我已经用正确的时间配置了jvm 在日志中它显示了正确的时间我想我必须在 data config xml
MySQL 和 Solr 中的分面搜索和类别

我希望能够创建一个类似于 ebay 或 newegg 的搜索页面您可以在其中选择类别和根据类别的不同方面有人能给我指出正确的方向吗我如何使用 Solr 中的产品存储和搜索此类方面和类别以及我将使用 MySQL 查看哪种类型的数据库模
使用多个字段对 solr 搜索结果进行排序 (solrj)

我需要根据两个因素对从 apache solr 返回的结果进行排序我们的系统中有三个实体由 solr 索引组项目和数据集在结果中我希望首先显示数据集然后是项目然后是组但我仍然希望它尊重每种类型的评分值因此例如结果将是得
Solr 索引与存储

我对太阳能场的索引和存储属性的行为有点困惑例如如果我在 Schema xml 中有以下内容
solr 中的文本字段排序

我正在使用 solr 3 4 并希望 solr 搜索结果在文本字段上排序如何实现像 int 自然排序一样对文本字段进行排序有没有办法在查询时将文本字段转换为int 我的排序字段是字符串类型我希望它在排序时表现得像 int 字段我无法
LUCENE：搜索与正则表达式匹配的术语

我需要搜索 lucene 索引中的任何术语匹配特定的正则表达式我知道我可以使用TermsComponent在solr中如果配置如下
更改 SOLR 默认连接

我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符在您的模式文件中添加或修
如何对字符串进行拼写检查？

有人知道 C 多语言拼写检查库吗我不需要实时拼写检查仅检查字符串 thanks 就其价值而言这是谷歌上的第一个点击 SpellCheck http msdn microsoft com en us library system win
如何使用 pysolr 对 solr 进行原子更新？

我找不到关于如何使用 pysolr 更新 solr 的合适文档截至 2014 年 11 月原子更新 https github com toastdriven pysolr commit c49be48d459448532b5ad0f505
Delphi 拼写检查器

您好我正在寻找一个与 Delphi 7 2010 一起使用的免费拼写检查器任何人都可以给我一个指向吗我想添加我们在 SynProject 编辑器中使用的 HunSpell 库它包含在该 GPL 工具的源代码中 http synops
MIME 类型/内容类型，用于在 IE 和 Firefox 中使用 Excel 打开 CSV 文件

我在 Excel 中识别并打开 CSV 输出时遇到问题在我的 Web 应用程序中我有一个 java servlet 它将搜索结果返回给用户搜索结果由 Apache Solr 服务器提供 GUI 前端有一个选项允许用户请求 CSV 格
ckan本地安装，solr JSP支持未配置500错误

我正在尝试使用 Ubuntu 14 04 LTS 在本地计算机上安装 CKAN 我按照从找到的源安装的说明进行操作here http docs ckan org en latest maintaining installing instal
SLF4J 日志记录到文件 vs. DB vs. Solr

我需要一些关于 SLF4J 日志记录的建议目前我们正在为 Java Web 应用程序使用 SLF4J 日志记录 log4j 绑定该应用程序使用简单的 ConsoleAppender 我们的下一步是研究可以保存日志的地方我们的应用程序
Solr：在带有空格的字符串上使用通配符

我的问题与这里讨论的问题基本相同带空格的 Solr 通配符查询 https stackoverflow com questions 10023133 solr wildcard query with whitespace 但这个问题没有得
Solrcloud Zookeper 设置：等待 4000ms 后未找到注册的领导者，集合：c1 切片：shard2

我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片领导者配置 solrcloud 我有一个外部动物园管理员设置我在启动 solr 时指向动物园管理员实例如下所示
如何根据特定字段对 solr 查询的前 100 个结果进行排序？

我想使用特定字段对 solr 的前 100 个文档进行排序但它对整个结果集进行排序然后显示结果以下是我的代码 query1 setQuery Natural Language query1 setStart 0 query1 setR
由于未定义符号，PECL solr 未加载：curl_easy_getinfo

我正在尝试加载 PECL solr 扩展我尝试使用 pecl install solr 并下载并使用 phpize configure make 来安装它在这两种情况下扩展安装时都没有错误但在 apache 重新启动后或在命令行上
使用 ConcurrentUpdateSolrServer 需要哪些 jar？

目前使用 solrServer new CommonsHttpSolrServer serverUrl 和这些罐子 apache solr core 3 6 0 apache solr solrj 3 6 0 commons codec 1
自定义存储库的 Spring Data Solr 优先级

我需要在 Spring Data Solr 自定义存储库中实现以下内容 X 或 Y 和 Z 我当前的代码如下 Criteria criteria new Criteria x is X VALUE criteria criteria or
Solr 错误 - 流主体被禁用

我正在从浏览器 URL 中删除文档我正在使用 Solr 7 4 0 我正在使用此查询来删除文档 http localhost 8983 solr test update stream body

随机推荐

Pandas dataframe ，使用 iloc 替换最后一行

我正在尝试使用 iloc 替换 Pandas 数据帧的最后一行但是我无法让它工作有很多解决方案但最简单最慢的是这里如何在 Python 中对 Pandas 数据帧上的行进行 FIFO 推送操作 https stackoverfl
如何使用 Python 从 Azure Functions 中的辅助线程重定向日志

我正在使用 Azure 函数运行启动多个线程的 Python 脚本出于性能原因一切都按预期工作但 Azure Functions 日志中仅显示来自 main 线程的信息日志我在 main 中启动的辅助线程中使用的所有日志都不会出
JavaFX 3D 面孔着色...再次

我研究了这个question https stackoverflow com questions 26831871 coloring individual triangles in a triangle mesh on javafx 但我还
如何使用pdfbox获取字体大小

有谁知道 TextPosition 中的 getFontSize 方法是否总是返回 1 我应该只使用 getFontSizeInPt 来获取字体的大小吗我遇到的问题是 getFontSizeInPt 有时会为相同大小的文本返回不同的值对
获取 Prometheus 中两个自定义时间戳之间的增量

我有一个名为的普罗米修斯指标device number 我想要的是显示现在与一天一周一个月等之前的价值差异这意味着减去具有两个不同时间戳的两个值环顾四周我没有找到任何关于如何执行此操作的有用文档我想做但不起作用的是 sum de
JFreeChart奇怪的渲染（无头RedHat）

我目前正在将一个应用程序从 Windows 环境迁移到 Redhat 环境该应用程序使用 JfreeChart 1 0 6 它是部署在运行 Open JDK6 的 Redhat 无头环境中的 tomcat 7 中的 Web 应用程序我得
使用 WordPress 中的钩子在帖子更新（自定义帖子类型）后获取更新值

我想获得更新后操作的最新更新值我已经使用了 save post post updated publish post挂钩但全部返回旧值但我同时需要当前更新值我试过下面的代码 add action post updated wpse634
Materialize CSS，显示自动完成芯片的图像

文档物化芯片 http materializecss com chips html展示您可以用图像制作芯片 div class chip img src images yuna jpg alt Contact Person Jane Doe
如何添加到 OrientDB 中的空间索引？

我正在使用工作室的 OrientDB 2 0 我使用文档中的代码成功创建了 Lucene 空间索引 CREATE class Place extends V CREATE property Place name string CREATE
更改列名称的字母大小写

我有大量数据集每个数据集都包含一长串列名在某些文件中列名称全部大写而在某些文件中仅列名称的第一个字母大写我需要附加数据集并认为匹配数据集中的列名称的最简单方法是将全大写名称转换为仅第一个字母大写的名称我希望找到一个通用的解决
如何从symfony2中的现有表生成实体？

我有带有一些字段的表 my table 我想在 MyBundle 中使用 my table 生成实体但我不想重新创建 MyBundle 中的所有实体我怎样才能做到这一点这是你可以做到的方法第一步要求Doctrine自省数据库并生成
npm install 冻结并显示 IdealTree:chatting: sill IdealTree buildDeps

当我安装任何东西时 npm 冻结了即使删除 package lock json 也没有任何变化这里有一个类似的问题 https stackoverflow com questions 50522376 npm install hangs
如何以编程方式获取 Android 项目（非设备）中支持的语言列表

在一些项目中我们可能会出现这种情况如何以编程方式获取此应用程序项目支持的语言列表结果我需要这样的字符串数组 en bg bs da de hr it nl pl pt sk sr tr 当然我可以通过键入它来对其进行硬编码但我认为
在 Bootstrap 导航栏后添加一些空间的最佳方法是什么？

以下代码始终在页面顶部显示导航栏我需要将第二个容器内容放置在导航栏的末尾而不是其下方目前第二个容器位于导航栏下方我可以在内容顶部添加一些空白但我不确定这是一个好方法知道如何解决吗 div class container div
将 CSS 类应用于 asp:Hyperlink 中的图像？

我使用 asp Hyperlink 根据 URL 中的参数动态呈现链接图像我需要能够将 CSS 类添加到渲染的 img 中但不知道如何做到这一点我知道我可以将 CssClass blah 添加到asp Hyperlink 但在渲染的H
CSS3 过渡卡住了

我们的新网站上正在进行很多转换有一个特别之前工作得很好但自从添加谷歌地图后某种过渡效果不会触发此外它还会禁用网站上的所有其他过渡效果直到触发另一个 javascript 函数我不知道为什么但这些就是事实该问题似乎仅限于 S
我的 QSqlQueryModel 不在列表视图中显示数据

我正在玩 QSqlQueryModel 但我现在完全陷入困境我一整天都在寻找解决方案但到目前为止还没有运气我所做的工作是它从我的 sqlite 数据库中提取数据但由于某种原因我无法在列表视图中显示它我的角色名似乎不存在对于我从数
Typescript 1.8 模块：从文件夹导入所有文件

我正在使用 Typescript 构建一个大型库其中包含 100 个独立的 ts 文件以前我用过导出模块XXX 重命名为导出命名空间 XXX稍后对于我的所有课程但正如书籍所说这不是推荐的方法我应该使用 import 代替所以我
ActiveSupport 如何计算月度总和？

我很高兴也很惊讶地发现 ActiveSupport 按照我想要的方式进行月度汇总无论相关月份中有多少天添加1 month对特定的Time将使您在该月的同一天着陆Time gt Time utc 2012 2 1 gt Wed Feb 0
Solr 您的意思是（拼写检查组件）

我在我的应用程序中使用 solr 并集成了拼写检查组件但我遇到了一些问题第一的当我输入一个用空格分隔的术语时他们会给我每个术语的更正 Eg 水 gt 什么术语但事实是watters 第二当我输入一些带有错误术语的短语时尽管其他

Solr 您的意思是（拼写检查组件）

Solr 您的意思是（拼写检查组件） 的相关文章

随机推荐

热门标签

Solr 您的意思是（拼写检查组件）的相关文章