在 postgresql 中删除停用词而不进行词干化

2023-12-28

我想从数据中删除停用词,但我不想阻止这些词,因为确切的词对我很重要。 我用了这个查询。

SELECT to_tsvector('english',colName)from tblName order by lower asc;

有什么方法可以在不阻止单词词干的情况下删除停用词吗?

thanks


创建您自己的文本搜索词典和配置:

CREATE TEXT SEARCH DICTIONARY simple_english
   (TEMPLATE = pg_catalog.simple, STOPWORDS = english);

CREATE TEXT SEARCH CONFIGURATION simple_english
   (copy = english);
ALTER TEXT SEARCH CONFIGURATION simple_english
   ALTER MAPPING FOR asciihword, asciiword, hword, hword_asciipart, hword_part, word
   WITH simple_english;

它的工作原理如下:

SELECT to_tsvector('simple_english', 'many an ox eats the houses');
┌─────────────────────────────────────┐
│             to_tsvector             │
├─────────────────────────────────────┤
│ 'eats':4 'houses':5 'many':1 'ox':3 │
└─────────────────────────────────────┘
(1 row)

您可以设置参数default_text_search_config to simple_english使其成为您的默认文本搜索配置。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 postgresql 中删除停用词而不进行词干化 的相关文章

随机推荐

  • 为什么声纳需要二进制文件(sonar.binaries)

    为什么声纳需要二进制文件 sonar binaries 它如何使用二进制文件来完成它对二进制文件所做的事情 sonar binaries是一个已弃用的属性 您现在应该使用sonar java binaries 该属性由 java 分析使用
  • 如何使用 Laravel 在 PHP 中处理 paypal webhook 事件?

    我正在尝试将 Paypal 功能集成到我的网站中 我已经安装了 SDK 并且可以调用 Paypal API 我的主要任务是创建发票 然后在客户支付发票时更新数据库 我能够正确创建发票 它们显示在我的沙箱通知下 我还在 Paypal 上的 R
  • 在 Orchard MVC CMS 中更改数据库连接设置的位置

    我在 Orchard CMS 中建立了一个网站 在选择数据存储设置时 我选择了 使用现有的 SQL Server 或 SQL Express 数据库 代替 使用内置数据存储 SQL Server Compact 它对我来说效果很好 但我想知
  • 如何在 Laravel 5.3 注册上添加动态下拉列表栏?

    我想创建一个下拉列表 其中从数据库检索数据 即下拉级别 下拉级别的值取自表级别 我的注册控制器是这样的
  • org.openqa.selenium.NoSuchElementException:无法找到元素

    如果 saleIdValueIs 正确 此代码可以正常工作 但当 saleIdValueIs 数据不正确时 此代码无法正常工作 然后它显示一条错误消息 org openqa selenium NoSuchElementException 无
  • 插入 postgresQL

    有没有一种方法可以在没有自动递增ID的表中插入新记录 而无需专门输入ID 我只希望ID是lastId 1 INSERT INTO lists VALUES id KO SPH 5 新的ID 不要那样做 EVER 根本就别想这么做 This
  • Oracle 字符串替换

    我的 Oracle 数据库中有一个列 由于我无法控制的原因 该列包含一个 CSV 字符串 例如 项目a 项目b 项目c 项目d 我想运行 UPDATE 语句来删除项目 c 因此最终得到 项目a 项目b 项目d 我怎样才能实现这个目标 你可以
  • 通过多个套接字传输文件是否比仅使用一个套接字更快?

    在这个旧 从 2002 年开始 它说如果您将一个文件分成多个块 然后使用不同的套接字传输每个块 那么它的到达速度将比使用一个套接字将其作为一个整体传输要快得多 我还记得 很多年前 读过一些下载管理器也使用这种技术 这有多准确 鉴于具有大窗口
  • Rails - 如何更新控制器中的单个属性

    我是 Rails 新手 正在尝试完成一项简单的任务 我想在图像单击时切换布尔属性 完成 在我看来 我的链接如下所示 我添加了一条路线 如下所示 resources calendars do get toggle done on gt mem
  • 在 swift 中使用带有多个参数的闭包

    这个问题主要是基于这个 Link https stackoverflow com questions 24031084 closures return value previously completionblock 主要区别在于我也想将参
  • Objective-C NSString 对象中需要转义的字符

    想要知道整个字符集 其字符必须在 Objective C NSString 对象中转义才能正确识别 例如 必须转义为 as in NSString temporaryString That book is dubbed as the lit
  • 如何自定义 Visual Studio 解决方案资源管理器右键菜单选项?

    从我记事起 我就一直在使用 Visual Studio 多年来 每个新版本都出现了越来越多的选项添加到解决方案资源管理器的右键单击上下文菜单中的趋势 99 的时间我只使用其中 5 的上下文菜单选项 我想知道是否可以从上下文菜单中删除项目 例
  • Spring Batch 事务异常:在 JobRepository 中检测到现有事务

    我正在尝试这个并得到异常 java lang IllegalStateException 在 JobRepository 中检测到现有事务 请修复此问题并重试 例如 从客户端删除 Transactional 注释 有没有人遇到过这个问题 T
  • 带有 war 文件的 Spring 应用程序属性配置文件

    我正在尝试将我的项目打包在 war用于 tomcat 服务器部署 我需要有能力使用我的application properties OR application dev properties OR appliation qa propert
  • Jenkins Git fatal:无法访问“https://URL.git”:SSL 证书 p‌r‌o‌b‌l‌e‌m:自签名证书

    我们新安装了 Jenkins 和 Bitbucket 服务器 它们使用本机自签名证书运行 When I try to clone the repository with windows command prompt it is gettin
  • Ajax 就绪状态 3(Chrome / IE)

    我正在和一些人玩comet and mxhr技术 事实证明 Chrome 5 实际上会发射一个readystate 3 但是responseText总是empty there 直到今天我还以为只是InternetExplorers 我这里错
  • 高性能缓存

    以下代码应该缓存上次读取的内容 这LastValueCache是一个可以被许多线程访问的缓存 这就是我使用共享内存的原因 对我来说 有竞争条件是可以的 但我希望其他线程能够看到更改LastValueCache class Repositor
  • Java日历日期错误

    谁能帮我理解为什么我得到不同的月份值 SimpleDateFormat dateFormat new SimpleDateFormat dd MM yyyy System out println dateFormat format cal
  • 如何加快从mysql到neo4j的插入速度?

    我在 mysql 中有一个包含 60000 个项目的数据集 我正在尝试将其插入 Neo4j 中 插入正在进行 但需要很长时间 大约每 3 秒 10 15 次 有什么办法可以加快速度吗 还有什么方法可以让我在 Neo4j 中提供诸如唯一键之类
  • 在 postgresql 中删除停用词而不进行词干化

    我想从数据中删除停用词 但我不想阻止这些词 因为确切的词对我很重要 我用了这个查询 SELECT to tsvector english colName from tblName order by lower asc 有什么方法可以在不阻止