如何列出句子中表示动物的所有英语术语？

2024-03-02

例如，在句子“两匹马刚刚躺下，一群失去母亲的小鸭子鱼贯进入谷仓，有气无力地吱吱叫，左右徘徊，寻找不被踩踏的地方。”，有两种动物：马和鸭。

我正在寻找动物名称的词汇表，但找不到足够完整的内容。这WordNet http://wordnet.princeton.edu/数据库看起来很有希望，但可能有点矫枉过正，而且也不够广泛。

WordNet 是一个出色的工具，我认为您走在正确的道路上。您正在寻找的关系是下位词/上位词关系：名词horse作为的下位词animal，并且相反，animal是的上位词horse。 WordNet 确实提供了数据来评估两个名词是否存在这种关系。

说到 WordNet，您可能会发现所有动物noun.animal文件。这可能会使您的特定问题变得更简单。

去从duckling to duck，您将导航 WordNet姐妹术语关系，给出相关单词的集合。我不确定你是否会从中得到误报，但可能会有一些。Duck and duckling也被列在一个衍生相关的关系，但是lion and cub不是。这可能是一个有争议的问题，因为两者duckling and cub从某种意义上来说，是动物。

但是，您必须标记词性，并且仅考虑名词，否则当句子使用动词时您会得到误报骑马 and to duck（猛地向下）。词性 (POS) 标记本身就是一个完整的问题，您可能需要查看一些现有的库来实现这一点。大多数成功的方法都使用统计方法，但结果相当可靠，尽管可能不是 100% 正确。

此外，您将不可避免地从名词同名中得到其他类型的误报。例如，一个horse可能指的是一件体操器材，它显然不是动物。Duck也可以指一种织物。如果没有更深入的上下文，您将不可能解决这样的同音异义问题。但是，如果没有能够完全理解文本的全面通用智能，这个问题就无法完全解决。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何列出句子中表示动物的所有英语术语？的相关文章

C++ - 如何使用 C++ 读取 Unicode 字符（例如印地语脚本），或者是否有通过其他编程语言更好的方法？

我有一个像这样的印地语脚本文件 3 我必须编写一个程序为每个句子中的每个单词添加一个位置因此特定单词位置的每一行的编号应以括号中的 1 开头输出应该是这样的 3 1 2 3 4 5 6 7 8 9 上面这句话的意思是 3 India
lex ：如何覆盖 YY_BUF_SIZE

根据manual http westes github io flex manual The Default Memory Management html YY BUF SIZE is 16K我们需要重写它但是手册没有指定如何覆盖它我
如何获取与某个单词相关的相似单词？

我正在尝试解决一个 nlp 问题其中我有一个单词字典例如 list 1 phone android chair netflit charger macbook laptop sony 现在如果输入是 phone 我可以轻松地使用 in
browserify :- 未捕获类型错误：fs.readFileSync 不是函数

我试图在我的代码中使用natural js 在客户端使用它我使用browserify 但它给出了一个错误 Uncaught TypeError fs readFileSync is not a function at loadDictio
日期自然语言解析器（.NET）？

我希望能够让用户使用自然语言例如下周五每个工作日输入日期包括重复日期很像以下的例子http todoist com Help timeInsert http todoist com Help timeInsert I found
Keras 文本预处理 - 将 Tokenizer 对象保存到文件中以进行评分

我按照以下步骤大致使用 Keras 库训练了一个情感分类器模型使用 Tokenizer 对象类将文本语料库转换为序列使用 model fit 方法构建模型评估这个模型现在为了使用此模型进行评分我可以将模型保存到文件中并从文
使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数？

我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
word2vec gensim 多种语言

这个问题完全超出了我的想象我正在使用 gensim 训练 Word2Vec 模型我提供了多种语言的数据即英语和印地语当我试图找到最接近人的词时我得到的是 model wv most similar positive man O
使用 nltk 进行分块

如何从给定模式的句子中获取所有块示例 NP
使用我自己的训练示例训练 spaCy 现有的 POS 标记器

我正在尝试在我自己的词典上训练现有的词性标注器而不是从头开始我不想创建一个空模型在spaCy的文档中它说加载您想要统计的模型下一步是使用add label方法将标签映射添加到标记器但是当我尝试加载英文小模型并添加标签图时
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
生成易于记忆的随机标识符

与所有开发人员一样我们在日常工作中不断处理某种标识符大多数时候它与错误或支持票有关我们的软件在检测到错误后会创建一个包该包的名称由时间戳和版本号格式化这是创建合理唯一标识符以避免混淆包的一种廉价方法例子错误报告 20101
否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试例如给定一个句子这本书很好请提供任意数量的意思相反的替代句子例如这本书不好甚至这本书不好显然以高精度实现这一点可能超出了当前 NLP 的范围但我确信在这个主题上已经有了一些工作
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
无法在 JavaCC 中加载主类

我是人工智能学生我们使用 JavaCC 我是新来的我正在尝试简单的例子但出现了一些错误 1 我从它的网站下载了JavaCC 0 6 2 我把它解压到C盘 3 我将此代码写入扩展名为 jj 的文件中 PARSE BEGIN Test i
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
PHP 和 NLP：嵌套括号（解析器输出）到数组？

想要将带有嵌套括号的文本转换为嵌套数组以下是 NLP 解析器的输出示例 TOP S NP PRP I VP VBP love NP NP DT a JJ big NN bed PP IN of NP NNS roses 原文我喜欢一大床
举例解释bpe（字节对编码）？

有人可以帮忙解释一下背后的基本概念吗BPE模型除了这张纸 https arxiv org abs 1508 07909 目前还没有那么多解释到目前为止我所知道的是它通过将罕见和未知的单词编码为子词单元序列来实现开放词汇表上的 NMT
管道：多个流消费者

我编写了一个程序来计算语料库中 NGram 的频率我已经有一个函数它消耗一串令牌并生成一个订单的 NGram ngram Monad m gt Int gt Conduit t m t trigrams ngram 3 countFre

随机推荐

由于 SYS_OP_C2C 内部转换，Oracle SQL 执行计划发生变化

我想知道为什么这个查询的成本 select from address a left join name n on n adress id a id where a street 01 高于 select from address a lef
LongListSelector：项目点击？

我在 Windows Phone 8 上使用 LongListSelector 控件但无法找出处理项目点击的最佳方法我发现的几个示例依赖于 SelectionChanged 事件但是这个解决方案有问题因为如果我点击一个打开新页面的
使用 cx_freeze 和 pandas 在 dateutil/zoneinfo 上出现错误 3

当我尝试使用 cx freeze 编译 hello py 文件时 pandas 0 15 2 出现以下错误但 0 15 1 没有错误有人知道如何纠正它吗我已使用 include files 函数包含 dateutil zoneinfo
SVN 是否允许 svn auth 文件规则的路径中存在空白？

目前我们遇到了包含空白且属于 svn auth 文件中的规则一部分的目录的问题因此我们希望拥有基于路径的授权并拥有一个包含以下内容的文件 rw junk of me me rw 当我清除身份验证数据并签出存储库的根目录时me 我看到
使用 PHPUnit 测试数组是否包含值

我创建了这个对象数组 ad 1 new AdUnit array id gt 1 name gt Ad 1 description gt great ad code gt alpha widget id gt 123 ad 2 new Ad
如何计算 Neo4j 中的排名

我有两种类型的节点游戏玩家和一种关系已玩 PLAYED关系就是拥有一个属性点样本数据玩家 309274 获得10分玩家 309275 获得20分玩家 309276 获得30分玩家 309277 获得40分玩家 309278 获得
使用 long double 或仅使用 double 来计算 pi？

我正在使用冗长的公式计算 pi 我试图更熟悉浮点数等我有一个使用双精度数的工作程序我的代码的问题是如果我使用双精度数则 pi 只能精确到小数点后第七位我无法得到更准确的信息如果我使用 long double 则 pi 精确到小数
使用 System Groovy 脚本从 Jenkins 工作区读取文件

我有一个与此非常相似的问题使用 Groovy 脚本从 Jenkins 中的工作区读取文件 https stackoverflow com questions 22917491 reading file from workspace in
NumPy 广播：计算两个数组之间的平方差之和

我有以下代码在 Python 中这需要很长时间必须有一种方法可以将此计算转换为广播 def euclidean square a b squares np zeros a shape 0 b shape 0 for i in range
从oracle中选择记录

为了选择最后一条记录当我的数据库是 MySQL 时我使用了这个 result mysql query SELECT Id FROM test ORDER BY LENGTH Id Id ASC count mysql numrows r
如果存在则推送到 JavaScript 数组，如果不存在则先创建它

有没有办法让这条线始终工作而不抛出TypeError Cannot read property Whatever of undefined var MyArray MyArray StringVariableName StringVaria
如何使用 HTML Agility Pack 清理格式不良的 HTML

我正在尝试替换这个可怕的正则表达式集合该集合当前用于清理格式不良的 HTML 块并偶然发现了 C 的 HTML Agility Pack 它看起来非常强大但是我找不到如何使用该包的示例在我看来这将是其中包含的所需功能我确信我是
Orchard CMS：Javascript 文件返回 404 未找到，即使它存在

我的 Orchard 模块中的编辑器模板的 Razor 视图中有以下内容 Script Include assets js AtFoot 当页面呈现时我可以在底部看到这一行美丽的唯一的问题是当我访问该路径时出现 404 错误该脚
Angular Material Design 中的事件日历

我想使用 Angular Material Design 默认日期选择器日历作为事件日历喜欢 http prntscr com fpg1lw http prntscr com fpg1lw 如何在日历中列出我的活动我只想强调 Angul
Django 多对多关系不保存

Update 对于任何好奇的人我弄清楚了它是什么为什么以及如何解决它在我看来我有 fields html tags title text taken date image 我在我的模板中使用 form as p 显然一旦从表单中发
Swift 中的视图/层何时设置边界和框架？

我有这样的东西UIView子类 override var bounds CGRect didSet somelayer frame bounds 在相应的somelayer 我有这个 override var bounds CGRect d
如何解决启动 Chrome 时出现“获取默认适配器失败”错误并尝试使用 Selenium 使用 ChromeDriver 访问网页的问题

我已经更新了 Selenium 但即使加载网页错误仍然发生然而在某些情况下驱动程序启动但停滞不前这是否会导致问题如果是我该如何解决 11556 9032 0502 152954 314 ERROR device event l
如何在 git bash 中启用 vim 风格导航？

我已经厌倦了使用箭头键导航 git bash 并且我在某处读到可以在 git bash 中启用 vim 样式导航所以我只是想知道如何启用此功能您应该能够简单地输入 set o vi 这将激活 vi 风格的导航我刚刚在 Windows
重新部署后 HBase 协处理器未更新

我正在使用 HBase 1 1 2 并尝试重新部署自定义端点协处理器来修复 Java 代码中的错误我对协处理器代码进行了一些更改并通过以下步骤重新部署它重建协处理器 jar 将其复制到 HDFS 上的某个位置删除现有的协处理器 al
如何列出句子中表示动物的所有英语术语？

例如在句子两匹马刚刚躺下一群失去母亲的小鸭子鱼贯进入谷仓有气无力地吱吱叫左右徘徊寻找不被踩踏的地方有两种动物马和鸭我正在寻找动物名称的词汇表但找不到足够完整的内容这WordNet http wordnet prince

如何列出句子中表示动物的所有英语术语？

如何列出句子中表示动物的所有英语术语？ 的相关文章

随机推荐

热门标签

如何列出句子中表示动物的所有英语术语？的相关文章