我目前正在尝试为我的网站开发一个基本的全文搜索,我注意到某些单词(例如“regarding”)被列为 MySQL 全文搜索的停用词。现在这并没有太困扰我,因为搜索特定新闻项目的人不一定会使用“关于”一词进行搜索(但我当然不能代表所有人!)。然而,我希望这里有人能启发我关于建立停用词列表的基本原理。谢谢!
为了澄清:我将 MyIsam 用于我的全文表。停用词是 MySQL 不会索引的词(对于任何全文索引)。正如对此问题的评论中所述,有一个完整的停用词列表,没有任何解释。我只是想知道“他们”选择这个词背后是否有任何理由。
停用词只是英语中的常用词。在大多数情况下,如果您不为这些词建立索引,您的搜索结果将更加相关,并且您的索引将更小且更快。
如果更适合您的需求,您可以使用 ft_stopword_file 变量编辑停用词列表(或将其设置为 '' 以索引与 ft_min_word_len 一样长或更长的所有单词)。您还可以使用 ft_min_word_len 变量更改最小索引字长,该变量的存在原因相同。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)