Solr高亮问题

2023-12-26

大家好,我有一个问题,当我查询 Solr 时,它会匹配结果,但是当我在此查询的结果上启用突出显示时,突出显示不起作用。

我的查询是

+内容:“项目 503”

内容是文本类型,并且文本项 503 中的一个重要内容显示为“项 503(c)”,最后的左括号会产生问题吗?请帮忙

这是 SolrConfig.xml 中的突出显示部分

  <highlighting>
   <!-- Configure the standard fragmenter -->
   <!-- This could most likely be commented out in the "default" case -->
   <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true">
    <lst name="defaults">
     <int name="hl.fragsize">100</int>
    </lst>
   </fragmenter>

   <!-- A regular-expression-based fragmenter (f.i., for sentence extraction) -->
   <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter">
    <lst name="defaults">
      <!-- slightly smaller fragsizes work better because of slop -->
      <int name="hl.fragsize">70</int>
      <!-- allow 50% slop on fragment sizes -->
      <float name="hl.regex.slop">0.5</float>
      <!-- a basic sentence pattern -->
      <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str>
    </lst>
   </fragmenter>

   <!-- Configure the standard formatter -->
   <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">
    <lst name="defaults">
     <str name="hl.simple.pre"><![CDATA[<em>]]></str>
     <str name="hl.simple.post"><![CDATA[</em>]]></str>
    </lst>
   </formatter>
  </highlighting>

and here is fieldtype definition in schema.xml

  <fieldtype name="text" class="solr.TextField">
    <analyzer>
      <tokenizer class="solr.StandardTokenizerFactory" luceneMatchVersion="LUCENE_29"/>
      <filter class="solr.StandardFilterFactory"/>
     <!-- <filter class="solr.LowerCaseFilterFactory"/>
      <filter class="solr.StopFilterFactory" luceneMatchVersion="LUCENE_29"/>
      <filter class="solr.EnglishPorterFilterFactory"/>-->
    </analyzer>
  </fieldtype>

and here is field definition

<field name="Contents" type="text" indexed="true" stored="true" />

问候 阿山。


您是否也尝试过存储术语向量?如果您使用快速矢量荧光笔(我认为 Solr 可能默认使用),您将需要它们。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Solr高亮问题 的相关文章

  • Lucene:如何在单个字段下索引和搜索多个值

    如何在单个字段下索引和搜索多个值 例如说我有一个领域处理器这可能有i3 i5 i7 or i3 or i3 i5价值观 现在想象一下笔记本电脑的数据如下 data1 name laptop name price laptop price p
  • 加速 solr 索引

    Solr 索引花费的时间太长 我使用的mysql有超过3000万条记录 我正在使用两级子查询 请向我建议索引数据的最佳实践 以便我可以加快该过程 查看Solr性能因素 http wiki apache org solr SolrPerfor
  • solr 中的文本字段排序

    我正在使用 solr 3 4 并希望 solr 搜索结果在文本字段上排序 如何实现像 int 自然排序一样对文本字段进行排序 有没有办法在查询时将文本字段转换为int 我的排序字段是字符串类型 我希望它在排序时表现得像 int 字段 我无法
  • Solr 和方面搜索

    当您设置模式时 分面搜索是否内置 或者您是否必须做一些事情来设置它 它基本上可以在您设置为可排序的所有字段上开箱即用吗 那么您只需使用 fq 查询语法 它就会返回构面 xml 以及搜索结果 有没有一篇关于这方面的好文章对您第一次有帮助 是的
  • 更改 SOLR 默认连接

    我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行 是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符 在您的模式文件中添加 或修
  • 另一个日期时间问题

    我目前有一个这种格式的日期 2010 03 03 10 39 18 这是一个TIMESTAMPMySQL 中的字段 我需要为名为 Solr 的搜索引擎提供以下格式的日期 1995 12 31T23 59 59Z 以下是他们网站上有关日期的一
  • Lucene 的 StopFilter 中使用的默认停用词列表是什么?

    Lucene 有一个默认的 stopfilter http lucene apache org core 4 0 0 analyzers common org apache lucene analysis core StopFilter h
  • 如何使用 pysolr 对 solr 进行原子更新?

    我找不到关于如何使用 pysolr 更新 solr 的合适文档 截至 2014 年 11 月原子更新 https github com toastdriven pysolr commit c49be48d459448532b5ad0f505
  • ckan本地安装,solr JSP支持未配置500错误

    我正在尝试使用 Ubuntu 14 04 LTS 在本地计算机上安装 CKAN 我按照从找到的源安装的说明进行操作here http docs ckan org en latest maintaining installing instal
  • 需要在 java api 中的 Solr 搜索中搜索文本及其周围的几行

    我正在使用 solr 7 7 2 并且我使用 solrj 在 Solr 中编写了一个 Java 程序 该程序在一个巨大的文本文件中搜索单词 我使用以下代码来显示代表整个文本的搜索结果 SolrQuery params new SolrQue
  • SLF4J 日志记录到文件 vs. DB vs. Solr

    我需要一些关于 SLF4J 日志记录的建议 目前 我们正在为 Java Web 应用程序使用 SLF4J 日志记录 log4j 绑定 该应用程序使用简单的 ConsoleAppender 我们的下一步是研究可以保存日志的地方 我们的应用程序
  • Solr 中缺少强制 uniquekey 字段错误

    我的项目中有这个问题 我使用 Apache Poi 读取 xlsx excel 文件 并且想在 Solr 核心中对它们进行索引 我使用 SolrInputDocument 来索引读取文件 这是我的java代码 package org sol
  • Lucene,索引已经/外部标记化的标记并定义自己的分析过程

    在使用Lucene的过程中 我有点失望 我不明白或不明白我应该如何继续为任何 Lucene 分析器提供已经可直接索引的东西 或者我应该如何继续创建我自己的分析器 例如 如果我有一个List
  • Solrcloud Zookeper 设置:等待 4000ms 后未找到注册的领导者,集合:c1 切片:shard2

    我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片 领导者 配置 solrcloud 我有一个外部动物园管理员设置 我在启动 solr 时指向动物园管理员实例 如下所示
  • MultiFieldQueryParser 正在从首字母缩略词中删除点

    我再次发布这个问题 因为我的查询没有得到答复 我正在使用 Lucene 开发图书搜索 api 用户可以搜索标题或描述字段包含 C F A 的书籍 我正在使用 StandardAnalyzer 以及停用词列表 我使用 MultiFieldQu
  • 在 Solr 中实现术语关联挖掘的最简单方法是什么?

    关联挖矿似乎为检索提供了良好的结果相关术语在文本语料库中 有很多关于这个主题的著作 其中包括著名的LSA http en wikipedia org wiki Latent semantic analysis方法 挖掘关联最直接的方法是构建
  • 在elasticsearch中转义特殊字符

    我正在使用Elasticsearch python 客户端 https elasticsearch py readthedocs io en master 对我们托管的 elasticsearch 实例进行一些查询 我注意到一些字符需要转义
  • 用于标签搜索的数据存储解决方案

    我已经按照预先计算的分数订购了数百万件商品 每个项目都有许多布尔属性 假设总共有大约一万个可能的属性 每个项目有十几个 我希望能够请求实时 几毫秒 给定任意属性组合的前 n 个项目 您会推荐什么解决方案 我正在寻找可扩展性极强的东西 我们目
  • Lucene 标准分析器与 Snowball

    刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行 运行了一些测试查询 并注意到如果原始术语是单数 则复数查询不会返回结果 我知道雪球分析器增加了词干支持 这听起来不错 不过 我想知道 超过标准的雪球锣是否有任何
  • 在 MongoDB 和 Apache Solr 之间同步数据的简单方法

    我最近开始使用 MongoDB 和 Apache Solr 我使用 MongoDB 作为数据存储 并且希望 Apache Solr 为我的数据创建索引 以实现应用程序中的搜索功能 经过一些研究 我发现 基本上有两种方法可以在 MongoDB

随机推荐

  • Powershell脚本文件名增量

    在 Powershell 中 我想自动化更改一组文件的文件名的过程 并将类似文件的最新版本复制到该目录 删除最旧的 file3 bak gt none 增加备份目录中当前文件的文件名 file1 bak gt file2 bak file2
  • Python suds 显示以下问题“RuntimeError:超出最大递归深度”

    我正在调用一个 Documentum Web 服务 我从一个简单的代码开始 from suds client import Client UnresolvedImport from suds transport https import H
  • 在 Swift 4 中动态更改状态栏颜色

    我想更改状态栏颜色 lightContent and default动态地 因为我的背景可以在同一个 ViewController 中改变 我尝试为此创建一个如下所示的函数 func changeStatusBar useDefault B
  • 为什么内联列表项不换行?

    请参阅demo http jsfiddle net DdWJg 1 怎么来的li不换行到下一行吗 我不是在寻找解决方案 因为有几个解决方案并且它们有效 但我想知道为什么它不包装 在中找不到任何内容the spec http www w3 o
  • Visual C++ 智能感知比编译器“更智能”吗

    我有以下场景 我有一个基类 从中派生出一个类 一切看起来都很好 但是 每次我将鼠标光标悬停在基类的继承成员上时 智能感知都会显示它很好 EG BaseClass SomeMember 但是 当我尝试编译时 编译器显示各种错误 它们与智能感知
  • 如何以编程方式选择列表视图中的项目

    我有一个ArrayList
  • xtable 标题对齐方式与表格左对齐或居中(使用knitr)

    我想将 xtable 图形标题与表格左对齐 或者如果这不起作用 至少居中 因为我认为小表格居中而相应的标题左对齐看起来有点愚蠢 此外 左对齐表格和标题也不是最佳选择 应该是可以的using https stackoverflow com q
  • 使用带有 ajax 的 google 图表出现内存泄漏

    我对 javascript 相当陌生 并且在某些代码中找不到内存泄漏 这些代码每秒使用 ajax 数据更新 google 图表 我的代码 简化为一个小测试用例 function TimeLine id max this chart new
  • 无法重置Root密码:windows、MySQL8.0

    我忘记了 root 密码 我正在遵循官方网站 https dev mysql com doc mysql windows excerpt 8 0 en resetting permissions windows html重置我的密码 我已按
  • 在 RabbitMQ 中,哪个更昂贵,每个交换器有多个队列,还是多个交换器且每个交换器有更少的队列?

    因此 我们决定在向微服务架构的迁移中使用 RabbitMQ 作为消息 事件总线 但我们无法找到放置队列的最佳方式的明确答案 我们有两个选择 One main exchange which will be a Fanout exchange
  • 已安装 Poetry 但“poetry:未找到命令”

    最近我在诗歌方面遇到了一百万零一个问题 我昨天已经完全安装并工作了 但是重新启动我的机器后 我又遇到了问题 即使在重新启动后 是否有办法在我的终端中始终识别诗歌 系统规格 Windows 10 Visual Studio 代码 Bash W
  • Horizo​​ntalScrollView,自动滚动到结束并有动画

    我有一个horizo ntalScrollView 当我加载视图时 我需要进行自动滚动以以动画结束 我已经实现了这个方法来做到这一点 final HorizontalScrollView strip HorizontalScrollView
  • Selenium WebDriver 查找第 n 个元素

    我遇到了一个问题 无法解决它 我必须访问页面上的第 n 个图像 该图像位于 HTML 内的表格中 我需要单击图像以分别为每一行移动到下一个屏幕 我已经尝试了此处提供的各种解决方案 但由于我正在使用 findElement by 语法 因此我
  • 缩放 HTML5 视频并打破宽高比以填充整个网站

    我想使用 4 3 视频作为网站的背景 但是 将宽度和高度设置为 100 不起作用 因为宽高比保持不变 因此视频不会填充网站的整个宽度 这是我的 HTML 和 CSS 代码 HTML
  • 如何通过 Android KitKat 在外部 SD 卡上使用 O_DIRECT 或 O_SYNC

    我在一家生产包含硬件加密引擎的 SD 存储卡的公司工作 我们通过写入 读取特殊文件来与加密模块交互 从 KitKat 开始 O DIRECT外部 SD 卡似乎不支持该标志 没有O DIRECT or O SYNC支持 当我们从 SD 卡 通
  • RFID RC522 Raspberry PI 2 Windows 物联网

    我正在寻找一种在 Windows IOT 上的 Raspberry Pi 2 0 上使用 RFID RC522 的方法 当然不是官方兼容的 官方的 OM5577 演示板 在法国太贵了 我还没有找到任何经销商在没有大量运费的情况下出售它 总成
  • JS:获取元素的可见区域坐标

    我需要一个函数 可以计算当前在屏幕上可见的元素的可见区域 而无需隐藏部分overflow scroll position absolute etc 也就是这个函数的结果getVisiblePart el 将Visible Rect is x
  • 将 OpenCV 与 Tkinter 结合使用

    我正在编写一个程序 需要在 Tkinter 窗口中显示视频流 由于还有用于执行各种功能的按钮 因此我使用网格来组织所有内容 以下代码 修改自显示网络摄像头序列 TkInter https stackoverflow com question
  • 绘制按函数分组的多个图形并将其保存为 pdf

    我想创建一个包含 12 个图的 pdf 文件 有两个选项 每页一个图 每页四个图 Using plt savefig months pdf 仅保存最后一个图 MWE import pandas as pd index pd date ran
  • Solr高亮问题

    大家好 我有一个问题 当我查询 Solr 时 它会匹配结果 但是当我在此查询的结果上启用突出显示时 突出显示不起作用 我的查询是 内容 项目 503 内容是文本类型 并且文本项 503 中的一个重要内容显示为 项 503 c 最后的左括号会