在 NLTK 解析器中使用整数/日期作为终端

2023-12-22

我正在尝试使用 NLTK 中的 Earley 解析器来解析句子，例如：

如果日期早于 12/21/2010，则序列号 = 10

为此，我尝试编写一个 CFG，但问题是我需要使用日期和整数的通用格式作为终端，而不是特定值。有没有什么方法可以将生产规则的右侧指定为正则表达式，从而允许这种处理？

就像是：

S -> '[0-9]+'

它将处理所有整数。

为此，您需要对日期进行标记，以便每个数字和斜杠都是一个单独的标记。

from nltk.parse.earleychart import EarleyChartParser
import nltk

grammar = nltk.parse_cfg("""
DATE -> MONTH SEP DAY SEP YEAR
SEP -> "/"
MONTH -> DIGIT | DIGIT DIGIT
DAY -> DIGIT | DIGIT DIGIT
YEAR -> DIGIT DIGIT DIGIT DIGIT
DIGIT -> '1' | '2' | '3' | '4' | '5' | '6' | '7' | '8' | '9' | '0'
""")

parser = EarleyChartParser(grammar)
print parser.parse(["1", "/", "1", "0", "/", "1", "9", "8", "7"])

输出是：

(DATE
  (MONTH (DIGIT 1))
  (SEP /)
  (DAY (DIGIT 1) (DIGIT 0))
  (SEP /)
  (YEAR (DIGIT 1) (DIGIT 9) (DIGIT 8) (DIGIT 7)))

这也提供了一定的灵活性，允许日期和月份为单位数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

Parsing

NLTK

earleyparser

在 NLTK 解析器中使用整数/日期作为终端的相关文章

行未从树视图复制

该行未在树视图中复制我在按行并复制并粘贴到未粘贴的任何地方后制作了弹出复制 The code popup tk Menu tree opportunity tearoff 0 def row copy item tree opportun
在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
如何使用Python将WebP图像转换为Gif？

我已经尝试过这个 from PIL import Image im Image open this webp im save that gif gif save all True 这给了我这个错误类型错误不支持的操作数类型 tuple
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
如何在 Python 中将彩色输出打印到终端？

是否有与 Perl 等效的 Python 语言 print color red print
htaccess 301 重定向 - 删除查询字符串 (QSA)

我一直在努力处理一些 htaccess 重定向我只是花了一些时间在堆栈上阅读和搜索但无法获得适合我的场景的答案我正在将旧客户端网站的 301 重定向到新客户端旧页面有参数查询我想从网址中删除它 menu php idCategor
获取列表中倒数第二个元素[重复]

这个问题在这里已经有答案了我可以通过以下方式获取列表的倒数第二个元素 gt gt gt lst a b c d e f gt gt gt print lst len lst 2 e 有没有比使用更好的方法print lst len lst
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
将输入发送到 python 子进程而不等待结果

我正在尝试为一段代码编写一些基本测试该代码通常通过 stdin 无休止地接受输入直到给出特定的退出命令我想检查程序是否在给出一些输入字符串时崩溃经过一段时间来考虑处理但似乎无法弄清楚如何发送数据而不是陷入等待我不知道的输出关心我
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

如何在 MySQL 中的 instr() 中使用区分大小写？

可能重复如何在 MySQL 的 instr 中应用通配符 https stackoverflow com questions 1905119 how to apply wildcard in instr in mysql 可能的重复链接显
按一列分组并显示另一列的所有结果

大家好我正在尝试解决这个问题但找不到解决方案我有 2 列正在尝试按第一列进行选择和分组并显示第二列中的所有记录我的桌子是 RegNo Name C117 Mariya Mathew C117 Baino Baby C117 Ma
SqlLocalDb 中的 Service Broker 或 SqlDependency？

Is SqlDependency支持于SqlLocalDb 如果是的话如何启用回答您主题中有关 Service Broker 的问题 Service Broker 在 LocalDB 中应该可以正常工作但只有本地队列可用远程队列在任一
CSS Reset 与 * 通配符

为什么我不能简单地重置 margin 0 padding 0 font size 100 代替 html body div span object iframe h1 h2 h3 h4 h5 h6 p blockquote pre abbr
Java 解压缩实用程序的性能不佳

我注意到与使用 WinZip 等本机工具相比 Java 中的解压缩工具非常慢有没有更高效的 Java 第三方库开源是首选 Edit 以下是使用 Java 内置解决方案与 7zip 的速度比较我在原来的解决方案中添加了缓冲输入输出流
C# 中的引用传递到底是如何工作的？

我想知道 C 中的引用传递是如何工作的如果我通过引用函数传递 WPF DataGrid 控件并慢慢让该函数将项目添加到其 DataGrid Items 集合中则 UI 中的 DataGrid 是否会随着每个新的 DataGrid It
在 navbar-fixed-top 之前添加标题图像

如何添加标题图像使其显示在导航栏固定顶部的顶部当用户向下滚动时导航栏会粘在顶部吗我尝试将其添加到容器中但它没有按预期工作到目前为止这是我的代码
如何更新具有特定列名的所有表

我正在尝试更新以 agg 和column name userid 等字符串开头的所有表但我在网上没有看到任何此类示例即使我能够找到选择具有特定列名称和表名称的所有表的选项我也需要执行相同的操作来更新这些表如下所示 update TA
T SQL 分组时选择最小和最大行

假设我有一个包含很多行的表如下所示 ID Range Range begining Profit 1 100 150 100 20 2 200 250 200 40 2 3 100 150 100 100 4 450 500 450 90
使用 boost::numpy::ndarray 时出现分段错误

当我试图通过时我发现了一个奇怪的段错误boost numpy ndarray作为一个论点 include
从 lxml 获取内部文本

lxml html fromstring 坚持将所有内容包装在标签中 p默认从这个标签树来看 p this is b the b good stuff p p 我想提取字符串 this is b the b good stuff 我该怎么
在 Javascript (Meteor) 中将字符串转换为 Mongo ObjectID

我有一个 Meteor 应用程序最初我使用 id在我的模板中命名列表项时我的集合中每条记录的字段当得到 id字段我将其转换为字符串以在模板中使用现在我想更新 Mongo 中的这些记录并传递 id回到一个Meteor method
获取本地文件的内容而不上传[重复]

这个问题在这里已经有答案了我正在编写一个离线网络应用程序允许用户选择本地文件修改它然后也在本地保存副本是否可以在没有任何服务器的情况下我可以上传文件并返回其base64 但它不是离线的应用程序只需要在 Google Chrom
使用 Nginx 在单个域上运行多个 React 应用程序

谁能推荐一个最佳实践 nginx 配置来在单个域上运行多个 React 应用程序这些应用程序将从不同的根目录提供服务因此 app1 和 app2 在 www domain com 上运行并获得服务 www domain com app1
如何查看查询执行成功与否？

我正在使用 codeigniter 2 0 2 这是来自它的用户指南 data array title gt title name gt name date gt date this gt db gt where id id this gt
SQL 中的循环行

我正在寻找类似的输出最近日期评论第二个最近日期评论 Example Book Comments BookA 27 03 13 comment1 21 03 13 comment2 21 03 13 uhuuuu and so o
基于数量的价格计算器[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在尝试创建一个简单的脚本来添加到我的 html 网站我需要它根据用户输入的数量计算价格例如 1 1000 的值将乘以 1 50 并
Flex 4 组显示效果/隐藏效果

我有一个组我想在显示和隐藏时执行擦除效果
Drupal 7 在“首次加载”时太慢

我希望有人能帮助我解决这个 Drupal 7 问题我注意到当我第一次输入网站地址时加载时间非常慢开始加载文件和显示内容大约需要 20 平均秒好像有一些延迟然而在那段时间之后速度非常快一切都很好页面加载后我们可以快
在 NLTK 解析器中使用整数/日期作为终端

我正在尝试使用 NLTK 中的 Earley 解析器来解析句子例如如果日期早于 12 21 2010 则序列号 10 为此我尝试编写一个 CFG 但问题是我需要使用日期和整数的通用格式作为终端而不是特定值有没有什么方法可以将生产规

在 NLTK 解析器中使用整数/日期作为终端

在 NLTK 解析器中使用整数/日期作为终端 的相关文章

随机推荐

热门标签

在 NLTK 解析器中使用整数/日期作为终端的相关文章