将单词添加到 WordNet 的本地副本

2024-03-09

我正在使用 WordNet,通过 Python 的 NLTK 访问来比较社交媒体中单词的同义词集。其中许多单词并不包含在 NLTK 连接的 WordNet 版本中。

当我说我words我指的是特定领域的术语,而不是缩写或表情符号。

我已经编制了这些单词的列表,并希望将该列表与 WordNet 合并。

搜索先前的努力发现了开发自动更新 WordNet 的方法的尝试。

我想象的步骤是:

  1. 克隆 WordNet 数据库
  2. 编写 WordNet 模块的扩展来查找本地副本
  3. 更新该本地副本。

这听起来有多合理?


我自己还没有更改过 WordNet,但我在使用 WordNet 方面获得了很好的经验多语言中央存储库 http://adimen.si.ehu.es/web/MCR,我相信你应该能够使用它来做你想做的事情。

它包含包括英语在内的多种语言的 WordNet 3.0 数据文件,这些文件通过所谓的语言间索引 (ILI) 相互关联。数据文件可以加载到 MySQL 或 PostgreSQL 数据库表中,从这一点来说,不仅使用 SQL 命令查询它应该相对容易,而且插入新项目、维护表之间的对应关系也应该相对容易。您当然也可以导出更改的数据库,例如如果使用 SQL 不足以满足您的目的,则将其转换为 CSV 文件。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将单词添加到 WordNet 的本地副本 的相关文章

随机推荐

  • 如何在 spring 中将图像转换为多部分文件

    我有一个图像文件并正在创建File具有该图像的对象 File file new File E Shared Data Images xyz jpg 上面的行正在创建一个file具有某种尺寸的物体 例如440272 我需要转换上面的image
  • 我使用 getifaddrs 得到错误的 IP 地址

    获取以太网指定IP地址的函数 char get ethernet ip const char ethernet char ip size t len struct ifaddrs ips int rc getifaddrs ips if r
  • 通过 mmap 文件进行 IPC:应该使用原子和/或易失性吗?

    我使用 mmap 文件在进程之间共享数据 代码是这样的 struct Shared int Data int file open file dat O RDWR Shared shared static cast
  • 在 Python 中利用蒙特卡洛预测收入

    我正在尝试在我的 Python 代码中实现蒙特卡罗模拟 这将帮助我确定实现与收入目标相关的各种阈值的几率 例如 我们每个财年达到 6 000 美元 7 000 美元或 8 000 美元的可能性有多大 我能够计算预期值 但还没有编写模拟代码
  • C中的浅拷贝和深拷贝

    我尝试用谷歌搜索这个 但结果只弹出面向对象的语言 根据我的理解 浅复制是复制结构的某些成员 所以可以说一个结构是 typedef struct node char ok int hi int yep struct node next nod
  • 如何避免在选项卡栏状态下堆叠导航历史记录

    选项卡 A 选项卡 B 选项卡 C 如下所示的状态 选项卡 a 选项卡 b 选项卡 c 我想关闭应用程序 就像在每个选项卡状态切换时没有导航历史记录一样 例如 我在选项卡 A 中 然后单击选项卡 B 然后从现在开始单击选项卡 C 如果用户按
  • 使用关联进行分页的 grails 中 Hibernate 查询的不同结果

    我有三个相互关联的班级 最初 我构建没有分页的查询 所有搜索结果都很好 但现在我需要分页并且不想打扰我的初始查询模式 有什么方法可以得到明显的结果 Class Department int id String name static has
  • 如何使用SwingWorker?

    朋友们 我正在开发一个java应用程序 这就是性能监控 在此基础上 我在一个类中获取值并在另一类中绘制图表 我想使用 Swingworker 交替执行这两堂课 ResultSet rs Connection conn null conn C
  • 如何让 Get-ADUser 在针对特定服务器时表现更好?

    我正在从域中的所有用户获取一系列属性 如果我不指定特定的域控制器 查询将在不到一秒的时间内返回有效结果 如果我指定目标控制器 即使在最近的域控制器上 结果也需要 18 秒才能返回 唯一的区别是我使用了目标服务器 Server serverN
  • 编号列表框

    我有一个已排序的列表框 需要显示每个项目的行号 在此演示中 我有一个带有 Name 字符串属性的 Person 类 列表框显示按姓名排序的人员列表 如何将行号添加到列表框的数据模板中 XAML
  • 使用 ASP.Net MVC 与 Web 表单相比的最大优势

    Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话 但却具有历史意义 目前不接受新的答案或互动 使用其中一种相对于另一种有哪些优点 主要优点ASP net MVC are 启用对呈现的 HT
  • 使用 StringTemplate 中的参数调用 Java 函数?

    StringTemplate 允许程序员通过 getter 不带参数的函数 获取数据 我想知道是否可以使用字符串模板中的参数调用Java函数 有一个解决方法是滥用字典 这是一个实现 函数 的示例 用于限制列表中的项目数量 github 上的
  • 产生关键词附加值?

    仍在尝试找到在实际情况下我会在哪里使用 yield 关键字 我看到这个主题的帖子 C 中的yield关键字有什么用 https stackoverflow com questions 39476 what is the yield keyw
  • MVC3:从 HtmlHelper 对象获取视图路径的最佳方法是什么?

    我有一个 html 扩展方法来检索与视图位于同一文件夹中的文件的 URL Example Views Home Index cshtml Views Home Index js Views Home Index css 这是最好的方法吗 我
  • 触发自定义验证指令后,AngularJS ng-model 值丢失

    我创建了一个自定义验证指令并在表单中使用它 可以正常触发 但是触发验证后 发现model值就丢了 说我有 ng model project key 并在验证后 project key范围内不再存在 我认为我对 AngularJS 的理解是错
  • JPA 实体关系:删除时级联

    我正在使用 spring JPA 和 Hibernate 我得到了以下实体 Entity Table name Supplier public class Supplier Id Column name Supplier ID nullab
  • C++ 代码注入使注入的应用程序崩溃

    我试图将一个简单的可执行文件注入到我制作的另一个可执行文件中 不幸的是 每当我将代码注入到可执行文件中时 它都会说 simpleinjected exe 已停止工作 然后它就会关闭 我在用着CreateRemoteThread来注入代码 这
  • 使用 firebase 函数检查数据是否存在

    我如何检查是否days使用 Firebase Cloud Function 存在节点 里面有伪代码index js if days exists do something outside of function body const fun
  • 使用 pageToken 检索所有播放列表条目 Youtube API V3

    所以我有一个函数可以从 ZEND Gdata API 检索所有播放列表条目 现在 我只是尝试添加 getNextFeed 但 V3 使用 pageToken 来显示下一个条目 我遇到的问题是如何检索代码中的 nextPage 并实现它 我知
  • 将单词添加到 WordNet 的本地副本

    我正在使用 WordNet 通过 Python 的 NLTK 访问来比较社交媒体中单词的同义词集 其中许多单词并不包含在 NLTK 连接的 WordNet 版本中 当我说我words我指的是特定领域的术语 而不是缩写或表情符号 我已经编制了