Solr PatternReplaceCharFilterFactory 未替换为指定模式

2024-05-11

所以我对 Solr 很陌生，但我尝试使用 PatternReplaceCharFilterFactory 对将存储的电话号码字符串进行一些预处理。这是该字段的配置：

<fieldType name="phone_number" class="solr.TextField" >
  <analyzer>
  <charFilter class="solr.PatternReplaceCharFilterFactory"
              pattern="\(?(\d{3})?\)?[-. ]?(\d{3})[-. ]?(\d{4})"
              replaceWith="$1-$2-$3"/>
   <tokenizer class="solr.StandardTokenizerFactory"/>
  </analyzer>
</fieldType>

我已经测试了正则表达式，它与我期望的所有内容匹配（例如 555.444.1234、(555) 444-1234、5554441234、4441234、444-1234 等）。

现在我的理解是，正则表达式应该匹配传递给它的内容，并将其替换为指定的模式。因此，如果他们传递给我 555.123.4444，我希望它会导致 555-123-4444 传递给 StandardTokenizerFactory。从那里它将被分解为代币 555,123,4444。

鉴于我在这方面花费了多少时间，我确信我遗漏了一个小配置问题，但从可用的文档（我已经看到）中我不知道它是什么。

先感谢您。

好吧，经过一次“幸运”的谷歌搜索后我发现了这个链接Solr 过滤器：PatternReplaceCharFilter http://java.dzone.com/news/solr-filters在最底部，他们讨论了高级参数，我认为这更好地解释了过滤器的实际工作原理：

CharFilter 对单个字符进行操作，模式匹配需要内部缓冲区来读取更多字符。 MaxBlockChars 允许您指定缓冲区的大小。

我的问题是它读取的是单个字符而不是整个字符串。这与我看到的示例相反。所以解决方案是在我的 charFilter 上添加 MaxBlockChar 属性，瞧，它起作用了。 LucidImagination 的网站和 solr wiki（我遇到的）上都没有提到这个属性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Solr

Solr PatternReplaceCharFilterFactory 未替换为指定模式的相关文章

在 Solr DataImportHandler 中从 Oracle 日期获取正确时间

我正在尝试使用 Solr 的 DataImportHandler 从 Oracle DB 中索引一些文档除了将 Oracle Date 列正确读取到我的文档中之外一切工作正常我的 Solr 架构中的字段定义为
如何查询SOLR中的空字段？

我有一个很大的 solr 索引我注意到一些字段没有正确更新索引是动态的这导致某些字段具有空的 id 字段我已经尝试过这些查询但它们不起作用 id id NULL id null id id id TO 有没有办法查询空字段 Tha
如何使用 SolrJ 获取突出显示的片段？

我正在将我的应用程序从 Lucene 迁移到 Solr Solr 可以更好地处理突出显示但是如果我搜索关键字 city 我会期望得到如下响应 id fdc3833a 0e4f 4314 ba8c title Paris is a beau
Solr Custom RequestHandler - 注入查询参数

简短的问题我正在寻找一种方法 java 来拦截对 Solr 的查询并注入我的业务逻辑提供的一些额外的过滤参数我应该使用什么结构语境首先我要坦白一点对于 Solr 我是个菜鸟对我来说设置一个服务器定义一个模式编写一个功能性
如何使用 Apache SOLR 和 PHP 代码突出显示搜索结果

我使用 SOLR 和 Tomcat servlet 容器开发了搜索页面使用 PHP 代码我将搜索查询发布到 solrQuery 函数中并在此函数中定义了查询参数如下所示 query q trim urlencode q versio
如何从 Solr 查询中获取 tf 和 idf 分数？

以下 Solr 文档 https cwiki apache org confluence display solr Function Queries https cwiki apache org confluence display sol
SOLR 中的子字符串匹配

我似乎无法弄清楚如何使用 SOLR 查找子字符串匹配我已经根据前缀找出了匹配这样我就可以让火腿与汉堡包匹配我如何搜索汉堡来匹配汉堡包我试过burger但这引发了错误或不允许作为 WildcardQuery 中的第一个字符如
yii2 作曲家更新致命错误

当我更新我的作曲家以添加yii2 solr扩展我的项目时我遇到如下错误 The yiisoft yii2 composer plugin requires composer plugin api 1 0 0 this WILL break
如何使用 pysolr 对 solr 进行原子更新？

我找不到关于如何使用 pysolr 更新 solr 的合适文档截至 2014 年 11 月原子更新 https github com toastdriven pysolr commit c49be48d459448532b5ad0f505
如何在不使用 SPLITSHARD 的情况下动态向 SolrCloud 添加节点？

我已经设置了Solr云有 4 个碎片我向 SolrCloud 添加了 8 个节点 4 个领导者和 4 个副本每个节点运行在不同的机器上但后来我发现我的数据越来越多每天400万文件这样我的 4 个分片就不够用了因此我想动态地向该
如何使用 Solr 索引 pdf 内容？

我正在尝试使用 SolrJ 索引一些 pdf 文档如下所述http wiki apache org solr ContentStreamUpdateRequestExample http wiki apache org solr Cont
Solrcloud Zookeper 设置：等待 4000ms 后未找到注册的领导者，集合：c1 切片：shard2

我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片领导者配置 solrcloud 我有一个外部动物园管理员设置我在启动 solr 时指向动物园管理员实例如下所示
cursorMark是无状态的以及它如何解决深度分页

作为指定here https cwiki apache org confluence display solr Pagination of Results光标标记是无状态的但我不明白它是如何解决无状态的深度分页问题的 solr 是否按唯一
如何备份Solr数据库？

我想知道如何备份转储 Solr 数据库如果只是复制一些文件请指定哪些文件文件名位置等 Thanks We use Solr复制 http wiki apache org solr SolrReplication做我们的备份您可以
使用 ConcurrentUpdateSolrServer 需要哪些 jar？

目前使用 solrServer new CommonsHttpSolrServer serverUrl 和这些罐子 apache solr core 3 6 0 apache solr solrj 3 6 0 commons codec 1
Solr 突出显示是否还可以指示返回片段在原始字段内的位置或偏移量？

背景使用Solr 4 0 0 我已经对一组示例文档的文本建立了索引并启用了术语向量以便我可以使用快速向量突出显示
加速 SOLR 搜索

使用 SOLR Apache Lucene 3 6 时 SOLR 搜索响应非常慢我正在尝试的一些性能增强技术是 SOLR 分页 mergeFactor 当前在 solrConfig xml 中设置为 10 SOLR 方面查询 solrco
Solr协会

最近几天我们正在考虑使用 Solr 作为我们选择的搜索引擎我们需要的大多数功能都是开箱即用的或者可以轻松配置然而我们绝对需要的一项功能似乎在 Solr 中被很好地隐藏或缺失我将尝试用一个例子来解释我们有很多实际上是企业的文件
在云模式下设置 Apache Solr

我必须执行以下操作我必须在 2 个服务器节点上部署 Solr 在另一台服务器上部署 Zookeeper 将自定义配置上传到 Zookeeper 创建具有 2 个分片和 2 个副本的自定义集合 Solr 7 4 0 和 Zookeeper
如何减少solr内存使用？

我在我的应用程序中使用 solr 只有数百个文档内存占用80M左右如何减少 80M 并不多事实上它几乎是最低限度你不会比这个低很多影响内存使用的一些因素输入文档尺寸多线程文档更新缓存大小分面查询 Sorting 参考 ht

随机推荐

Mandrill 通过 REST API 作为单独的消息发送给多人

我正在尝试使用山魈发送邮件问题是当我将多个收件人添加到收件人参数时它会多次向收件人列表中的所有收件人发送同一封邮件我期望将相同的邮件单独发送给列表中的每个人我错过了什么吗 key app key template name
C# 中的抽象类和接口类有什么不同？

C 中的抽象类和接口类有什么不同 An 接口不是类它只是一个contract定义了public一个类的成员must实施抽象类只是一个类您从中可以cannot创建一个实例通常您会使用它来定义一个基类该基类定义了一些virtual方法
将包含多个事件的 ICS 文件保存到我的日历，而不是其他日历

当我将 Excel 电子表格转换为 CSV 文件时然后将 CSV 文件转换为 ICS 文件我可以打开其中包含单个事件的 ICS 文件并接受会议邀请然后将其添加到我的日历中使用此应用程序进行转换 http icsconverterw
线性代数如何在算法中使用？

我的几个同行都提到学习算法时线性代数非常重要我研究了各种算法并学习了一些线性代数课程但我没有看到其中的联系那么线性代数如何应用在算法中呢例如图的连接矩阵可以带来哪些有趣的事情三个具体例子线性代数是现代 3D 图形的基础
X 请求失败错误：BadAlloc（操作资源不足）

我注意到这个问题过去已经被问过很多次并且在网上冲浪时我发现了很多关于它的页面然而似乎提出的解决方案很少起作用就我而言问题并不涉及我编写的程序所以我会在这里再试一次我最近在我的笔记本电脑上安装了 Linux Mint 14 当操
如何知道一个点是否在复杂的 3D 形状内（.ply 文件）

我正在研究一个Java女巫项目真是要了我的命经过几天在不同论坛上的研究寻找我真正需要的东西我来寻求你的帮助我的数据 ply 文件包含由许多三角形组成的 3D 形状一个点 3D坐标我想知道这个点是否包含在复杂的 3D 形状内我
重构 google 的 NetworkBoundResource 类以使用 RxJava 而不是 LiveData

谷歌的android架构组件教程here https developer android com topic libraries architecture guide html有一部分解释了如何抽象通过网络获取数据的逻辑在其中他们使用
AWS LoadBalancer监听多个端口

我有一些应用程序在 aws 中作为微服务运行其中一些在端口 80 上运行一些在端口 3000 上运行我希望我的 ALB 侦听这两个端口上的流量然后我有一个ListenRules将流量引导至微服务我想实现如下所示的目标 Resour
emacs 临时文件的 .gitignore 正则表达式

我正在尝试 gitignore emacs 临时自动保存文件我在用着在我的 gitignore 中 But git add A在子文件夹中运行仍然给我 new file make collections py new file nor
如何列出 Git 1.7+ 中的所有远程分支？

我试过了git branch r 但这仅列出我在本地跟踪的远程分支如何找到我没有的列表命令是否列出对我来说并不重要all远程分支或仅那些未跟踪的分支 For the vast majority 1 of visitors here th
使用 match every contains 进行 json 数组项断言

我想在响应数组下的每个项目中添加包含训练的技能数组断言我怎样才能使用匹配每种格式来做到这一点 match each response contains password abc123 不使用 JsonPath 表达式我预计下面的示例
为什么 BinaryFormatter 可以序列化 Action<> 但 Json.net 不能

尝试序列化反序列化 Action 尝试我的 1天真 JsonConvert SerializeObject myAction JsonConvert Deserialize
将文本数据作为表单中的文件发布

是否可以从 html 表单中发布一些作为文件输入类型的字符串的 XML 数据情况是我有一个像这样的表格 form action target php method post enctype multipart form data gt
OpenCL 何时使用全局、私有、本地、常量地址空间

我正在尝试学习 OpenCL 但我很难决定使用哪些地址空间因为我只找到组装的资源声明这些地址空间是什么但没有声明它们为什么存在或何时使用它们资源至少太分散了所以带着这个问题我希望把所有这些信息汇总一下所有地址空间是什么它们为什么
jquery 中 DOM 元素的手动垃圾回收是否可以提高浏览器性能？

在性能范围内删除不再需要的元素是否有意义或者浏览器是否对代码中未进一步引用的 dom 元素执行自动垃圾收集 some element fadeOut 1000 function el el remove lt does this mak
如何知道我的 Xcode iPhone 项目是否使用 ARC？

我想知道我的 Xcode iPhone 项目是否正在使用 ARC 但我不记得在创建项目时是否勾选了该框我怎样才能得到这些信息选择您的项目然后构建设置寻找Objective C 自动引用计数 in the Apple LLVM 编译器
为单个列表注册事件处理程序

我有一个共享点事件处理程序我想为单个列表激活它而不是站点中的所有列表我该怎么办得到答案了我们需要运行这段代码也许在控制台应用程序中不过我仍然不知道如何在添加事件处理程序后将其删除 string siteUrl Console
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
通过列计数拆分时重复表头

我正在 Magento 中输出产品列表作为包装在表格中的简单列表由于此列表可能会很长 100 个以上产品因此我使用了来自这里的想法 https stackoverflow com questions 21001803 how to h
Solr PatternReplaceCharFilterFactory 未替换为指定模式

所以我对 Solr 很陌生但我尝试使用 PatternReplaceCharFilterFactory 对将存储的电话号码字符串进行一些预处理这是该字段的配置

Solr PatternReplaceCharFilterFactory 未替换为指定模式

Solr PatternReplaceCharFilterFactory 未替换为指定模式 的相关文章

随机推荐

热门标签

Solr PatternReplaceCharFilterFactory 未替换为指定模式的相关文章