Solr 内置了「分析画面」 https://cwiki.apache.org/confluence/display/solr/Analysis+Screen,这有助于调试特定字段类型的分词器和过滤器之间的相互作用:
ElasticSearch 有没有一个插件可以做类似的事情?具体来说,我想查看每个过滤器的输入/输出,而不仅仅是分析链的最终结果。我在这方面大量使用了谷歌,但没有找到任何东西。
https://www.found.no/play/#analysis https://www.found.no/play/#analysis恰好包含我想要的功能(向下滚动到“myAnalyzer”),但不幸的是它不是我可以在索引上运行的东西。但它表明这样的功能是可能的。
编辑:我知道有很多插件可以向我显示完整的过滤器链的输出,例如用户 @Bass 建议的 kopf:
这不是我想要的!我想查看每个过滤器的输出,而不仅仅是最终结果。
有一个独立的工具叫做elyzer https://github.com/o19s/elyzer/由 OpenSource Connections 的好人制作。该工具将向您显示分析过程中任何步骤(字符过滤器、标记生成器、标记过滤器)的标记状态,并且使用起来非常简单。
安装非常简单,通过pip install elyzer
然后您可以将它用作命令行工具,例如
$ elyzer --es "http://localhost:9200" --index tmdb --analyzer english_bigrams --text "Mary had a little lamb"
TOKENIZER: standard
{1:Mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: standard
{1:Mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: lowercase
{1:mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: porter_stem
{1:mari} {2:had} {3:a} {4:littl} {5:lamb}
TOKEN_FILTER: bigram_filter
{1:mari had} {2:had a} {3:a littl} {4:littl lamb}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)