名词可数性

2024-01-12

有没有关于确定名词可数性的资源?要么用某种方法来解决这个问题,要么用一本字典来记录一个名词是否可数或不可数?

我对这个名词是否可数不感兴趣,但更多的是它可能是可数的。例如,rice 可以变成rices,这意味着它可以是可数的,但在大多数情况下它不是可数的。


这是困难的一个。许多英语单词可以是两者(啤酒、时间、玻璃、语言等),具体取决于上下文/含义。

单独从单词或从普通词典中找出(不可)可数性是不可能或不切实际的。

您可以尝试通过查看该词的使用方式从大型文本语料库中找出它:

  • 是否有复数形式
  • 如果前面有不定冠词或者没有
  • 如果它与很多/很少、很多/很少、一块(?)等一起使用

但许多单词既可以用作名词,也可以用作形容词,这使事情变得复杂。例如在an air pump, air用作形容词和an指的是pump,不air.

同样,许多单词既可以充当名词也可以充当动词,并且具有相同的形式。例如,在she pressures him, pressures不是复数pressure.

此外,一些不可数名词在变得更加具体时可以在其前面加上不定冠词,例如knowledge vs a good practical knowledge.

您可以从分析的语料库中收集统计数据,并据此判断一个单词是否更有可能是可数或不可数。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

名词可数性 的相关文章

  • 日期自然语言解析器(.NET)?

    我希望能够让用户使用自然语言 例如 下周五 每个工作日 输入日期 包括重复日期 很像以下的例子http todoist com Help timeInsert http todoist com Help timeInsert I found
  • 使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数?

    我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕 我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
  • 如何使用 python 中的 spacy 库将句子转换为问题 [请参阅下面的我的代码进行更正]

    我需要使用 python 中的 spacy 将任何句子转换为问题 我下面的代码太长了 我需要做更多的工作才能将任何句子完成为问题格式 现在在这段代码中我根据以下条件制定条件是形式 需要形式 有形式 做形式通过检查过去时和现在时 输入 尼娜拉
  • 如何调整 NLTK 句子标记器

    我正在使用 NLTK 来分析一些经典文本 但我在按句子标记文本时遇到了麻烦 例如 这是我从以下内容中得到的片段莫比迪克 http www gutenberg org cache epub 2701 pg2701 txt import nlt
  • 如何计算两个文本文档之间的相似度?

    我正在考虑使用任何编程语言 尽管我更喜欢 Python 来从事 NLP 项目 我想获取两个文档并确定它们的相似程度 常见的方法是将文档转换为 TF IDF 向量 然后计算它们之间的余弦相似度 任何有关信息检索 IR 的教科书都涵盖了这一点
  • BERT - 池化输出与序列输出的第一个向量不同

    我在 Tensorflow 中使用 BERT 有一个细节我不太明白 根据文档 https tfhub dev google bert uncased L 12 H 768 A 12 1 https tfhub dev google bert
  • 使用我自己的训练示例训练 spaCy 现有的 POS 标记器

    我正在尝试在我自己的词典上训练现有的词性标注器 而不是从头开始 我不想创建一个 空模型 在spaCy的文档中 它说 加载您想要统计的模型 下一步是 使用add label方法将标签映射添加到标记器 但是 当我尝试加载英文小模型并添加标签图时
  • 生成易于记忆的随机标识符

    与所有开发人员一样 我们在日常工作中不断处理某种标识符 大多数时候 它与错误或支持票有关 我们的软件在检测到错误后 会创建一个包 该包的名称由时间戳和版本号格式化 这是创建合理唯一标识符以避免混淆包的一种廉价方法 例子 错误报告 20101
  • 否定句子的算法

    我想知道是否有人熟悉算法句子否定的任何尝试 例如 给定一个句子 这本书很好 请提供任意数量的意思相反的替代句子 例如 这本书不好 甚至 这本书不好 显然 以高精度实现这一点可能超出了当前 NLP 的范围 但我确信在这个主题上已经有了一些工作
  • 用于估计(一元)困惑度的 NLTK 包

    我正在尝试计算我所拥有的数据的困惑度 我正在使用的代码是 import sys sys path append usr local anaconda lib python2 7 site packages nltk from nltk co
  • python中的语音识别持续时间设置问题

    我有一个 Wav 格式的音频文件 我想转录 我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
  • SpaCy 模型“en_core_web_sm”的词汇量大小

    我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词 我也在同
  • 快速NLTK解析成语法树

    我正在尝试将数百个句子解析为语法树 我需要快速完成 问题是如果我使用 NLTK 那么我需要定义一个语法 而我不知道我只知道它会是英语 我尝试使用this https github com emilmont pyStatParser统计解析器
  • NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

    这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
  • 阻止斯坦福核心 NLP 服务器输出它收到的文本

    我正在运行一个斯坦福核心自然语言处理 http stanfordnlp github io CoreNLP server java mx4g cp edu stanford nlp pipeline StanfordCoreNLPServe
  • SpaCy 中的自定义句子边界检测

    我正在尝试在 spaCy 中编写一个自定义句子分段器 它将整个文档作为单个句子返回 我编写了一个自定义管道组件 它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
  • 斯坦福 CoreNLP:使用部分现有注释

    我们正在尝试利用现有的 代币化 句子分割 和命名实体标记 同时我们希望使用斯坦福 CoreNlp 额外为我们提供 词性标注 词形还原 和解析 目前 我们正在尝试以下方式 1 为 pos lemma parse 创建一个注释器 Propert
  • 验证 Transformer 中多头注意力的实现

    我已经实施了MultiAttention head in Transformers 周围有太多的实现 所以很混乱 有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
  • 用于词性标记的优秀 Java 库是什么? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 使用“自然”语言编写代码更好吗?

    我最近看到一种编程语言叫做超新星 http supernova sourceforge net 他们在网页上说 超新星编程语言是 现代脚本语言和 第一个提出了概念 用直接虚构进行编程 描述使用 纯人类语言的清晰子集 你可以编写如下代码 i

随机推荐

  • Angular 2 Promise/Observable 链两个事件?

    我想知道是否可观察到的 or promise可用于 Angular 2 中的以下用例 有两个异步上传任务 我想知道如何检测这两项任务都已完成 我的上传任务 实现于promise但它很容易改变为可观察到的如果需要的话 是这样的 myServi
  • 在 macOS 中通过命令行与 Siri 交互

    我在手机和手表上使用 Siri 随时随地创建提醒 当我在办公室时 我不想使用 Siri 打扰安静 因此我通常使用与 提醒 应用程序集成的 Alfred 工作流程 或者直接使用 提醒 应用程序 然而 两者都有一个相当笨拙的界面 如果我可以在命
  • Zbar SDK - 缺少所需的架构 x86_64

    我在最近的 Xcode 5 1 中构建应用程序时遇到了一个问题 编译失败 并出现 架构 x86 64 的未定义符号 错误 我使用有效架构构建我的项目 armv7 armv7s 和 arm64 切换到最新的环境 Xcode 后 我在相同的架构
  • 随机化一个 BigInteger

    I m looking to randomize a BigInteger The intent is to pick a number from 1 to 8180385048 Though from what I noticed the
  • 运行 gulp 任务时如何解决“在 MakeCallback 中使用域属性已被弃用”警告?

    我正在使用带有 gulp 的节点来运行一些构建任务 直到几天前 这一切都还顺利 现在 我假设在升级 更新后 不确定是哪一个 我相信这是节点从 14 4 更新到 14 5 我不断收到此警告 DEP0097 DeprecationWarning
  • 使用 webpack、Threejs 示例和 TypeScript?

    我在将 Threejs 示例 如 EffectComposer 或 Detector 中的内容与 webpack 和 typescript 一起使用时遇到了很多麻烦 先把相关的 d ts文件全部存在并通过安装tsd 我的问题是让 webpa
  • Oracle:“= ANY()”与“IN ()”

    我刚刚在 ORACLE SQL 中偶然发现了一些我很好奇的东西 不确定其他中是否也有 我在这里作为维基询问 因为很难尝试在谷歌中搜索符号 我刚刚发现 当根据一组值检查一个值时 您可以执行以下操作 WHERE x ANY a b c 与通常的
  • 使用 OData 连接服务在 Blazor 客户端应用程序中使用 OData

    创建了 netstandard2 1 blazor Web 程序集项目 将 Odata Connected Service V 0 10 0 添加到同一项目 生成 OData 代理类 从 Razor 页面的 Task OnInitializ
  • 读取 Amazon Kinesis Firehose 流写入 s3 的数据

    我正在将记录写入 Kinesis Firehose 流 该流最终由 Amazon Kinesis Firehose 写入 S3 文件 我的记录对象看起来像 ItemPurchase String personId String itemId
  • document.execCommand 复制命令不起作用或其他解决方案?

    我正在做的是以编程方式从网页中选择所有文本 然后复制它 选择所有适用于execCommand但复制则不然 这是我的代码 ajax url url val type GET success function res result html r
  • Selenium Web 驱动程序等待很长时间

    我可以长时间等待 Selenium Web Driver 吗 尽管我可以像下面这样设置隐式等待命令 但它不会等待我给出的时间 driver manage timeouts implicitlyWait 5 TimeUnit MINUTES
  • C++/Win32:如何等待挂起的删除完成

    Solved 可行的解决方案 履行机构的答复 https stackoverflow com questions 3764072 c win32 how to wait for a pending delete to complete 37
  • 在 Powershell Cmdlet 中使用 Entity Framework Core?

    是否可以构建一个包含实体框架 Core 或 EF6 的 PowerShell cmdlet 以访问 SQL Server 数据库 我多年来一直在用 C 编写 cmdlet 但在过去的 coupla 日子里 由于似乎是程序集版本冲突 我在尝试
  • 在 C++ 中调用 std::sort 时使用 std::greater 的语法

    推荐的方式 例如 按降序对向量进行排序 https stackoverflow com questions 9025084 sorting a vector in descending order 对容器进行反向排序似乎是 std sort
  • Python,规则网格上的邻居

    假设我有一组 2D 坐标 表示 2D 规则网格的单元中心 我想为网格中的每个单元格找到每个方向上两个最近的邻居 如果分配给每个单元格和索引定义如下 那么问题就非常简单 idx cell idx N idy 其中 N 是网格中单元格的总数 i
  • 用于测试的 Java 编写的嵌入式 Kerberos 服务器

    有谁知道任何嵌入式 Kerberos 服务器 KDC KAdmin 它们是用 Java 编写的 并且可以仅在 JVM 进程中运行 例如 Hadoop minicluster 或嵌入式 LDAP 服务器 我的目标是让人们运行需要 Kerber
  • 当涉及到 pluck 时,to_sql 不起作用

    当我到to sql在以下查询中它工作正常 2 1 8 017 gt Task joins recurrence group recurrences id to sql gt SELECT tasks FROM tasks INNER JOI
  • XSLT:递归映射

    我是 XSLT 转换的新手 并且陷入了这种递归映射的困境
  • 如何强制两个 Java 线程在同一处理器/核心上运行?

    我想要一个不包含关键部分或类似同步替代方案的解决方案 我正在寻找类似于 Windows 中的 Fiber 用户级线程 的东西 操作系统管理哪些线程在哪个核心上处理 您需要将线程分配给操作系统中的单个核心 例如 在 Windows 上 打开任
  • 名词可数性

    有没有关于确定名词可数性的资源 要么用某种方法来解决这个问题 要么用一本字典来记录一个名词是否可数或不可数 我对这个名词是否可数不感兴趣 但更多的是它可能是可数的 例如 rice 可以变成rices 这意味着它可以是可数的 但在大多数情况下