我想从数据中删除停用词,但我不想阻止这些词,因为确切的词对我很重要。
我用了这个查询。
SELECT to_tsvector('english',colName)from tblName order by lower asc;
有什么方法可以在不阻止单词词干的情况下删除停用词吗?
thanks
创建您自己的文本搜索词典和配置:
CREATE TEXT SEARCH DICTIONARY simple_english
(TEMPLATE = pg_catalog.simple, STOPWORDS = english);
CREATE TEXT SEARCH CONFIGURATION simple_english
(copy = english);
ALTER TEXT SEARCH CONFIGURATION simple_english
ALTER MAPPING FOR asciihword, asciiword, hword, hword_asciipart, hword_part, word
WITH simple_english;
它的工作原理如下:
SELECT to_tsvector('simple_english', 'many an ox eats the houses');
┌─────────────────────────────────────┐
│ to_tsvector │
├─────────────────────────────────────┤
│ 'eats':4 'houses':5 'many':1 'ox':3 │
└─────────────────────────────────────┘
(1 row)
您可以设置参数default_text_search_config
to simple_english
使其成为您的默认文本搜索配置。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)