如何使用 NLTK 从归纳语法生成句子？

2024-01-03

我有一个（大）解析句子列表（使用斯坦福解析器解析），例如，句子“现在你可以娱乐了”有以下树：

(ROOT
  (S
    (ADVP (RB Now))
    (, ,)
    (NP (PRP you))
    (VP (MD can)
      (VP (VB be)
        (VP (VBN entertained))))
    (. .)))

我正在使用一组句子树来使用 nltk 归纳语法：

import nltk

# ... for each sentence tree t, add its production to allProductions
allProductions += t.productions()

# Induce the grammar
S = nltk.Nonterminal('S')
grammar = nltk.induce_pcfg(S, allProductions)

现在我想用grammar生成新的随机句子。我的希望是，由于语法是从一组特定的输入示例中学习的，因此生成的句子在语义上将相似。我可以在 nltk 中执行此操作吗？

如果我不能使用 nltk 来执行此操作，是否存在任何其他工具可以接受（可能重新格式化）grammar并生成句子？

在NLTK 2.0中你可以使用nltk.parse.generate生成all可能的给定语法的句子 http://nltk.org/_modules/nltk/parse/generate.html.

此代码定义了一个函数，该函数应根据 (P)CFG 中的产生式规则生成单个句子。

# This example uses choice to choose from possible expansions
from random import choice
# This function is based on _generate_all() in nltk.parse.generate
# It therefore assumes the same import environment otherwise.
def generate_sample(grammar, items=["S"]):
    frags = []
    if len(items) == 1:
        if isinstance(items[0], Nonterminal):
            for prod in grammar.productions(lhs=items[0]):
                frags.append(generate_sample(grammar, prod.rhs()))
        else:
            frags.append(items[0])
    else:
        # This is where we need to make our changes
        chosen_expansion = choice(items)
        frags.append(generate_sample,chosen_expansion)
    return frags

为了利用 PCFG 中的权重，您显然需要使用比choice()，它隐含地假设当前节点的所有扩展都是等概率的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NLP

NLTK

如何使用 NLTK 从归纳语法生成句子？的相关文章

tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
在 Python 中绘制分类数据的三个维度

我的数据包含三个我试图可视化的分类变量城市五个之一职业四种之一血型四种之一到目前为止我已经成功地以一种我认为易于使用的方式对数据进行了分组 import numpy as np pandas as pd Make data
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
Flask 中的 import 和 extends 有什么区别？

我正在阅读 Flask Web 开发在例4 3中 extends base html import bootstrap wtf html as wtf 我想知道 extends 和 import 有什么区别我认为它们在用法上很相似在什
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a

随机推荐

如何在构建时获取 SBT 暂存目录？

如何在构建时获取 SBT 暂存目录我想做一个远程存储库的棘手克隆并且stagingDirectorySBT 似乎很合适如何获取 Build scala 内的目录 SBT源代码 http www scala sbt org 0 13 1
使用 semver（语义版本控制）时，当 Y 更改时，补丁版本 Z (x.y.Z) 是否应返回到 0？

From 语义版本控制 http semver org 如果仅向后则补丁版本 Z x y Z x gt 0 必须递增引入了兼容的错误修复错误修复被定义为修复不正确行为的内部更改假设我有一个版本的程序0 1 12 如果我必须增加 Y
rmarkdown 到 pdf 中生成未知警告

我已经很高兴从 RMarkdown 文件生成 PDF 文件有一段时间了最近当创建PDF文件时出现了一个我不明白的新警告它出现only在 PDF 文件中即 Rmd 文件中没有显示相同消息的输出错误是 Warning in is n
在 Subversion 上提交代码（第一次）

我是 Subversion 的新手我必须提交有关颠覆的代码这是我第一次这样做所以我的导师告诉我使用 SSH 将用户名放在他的服务器上我通过以下代码做到了这一点 amit
如何使用 VBA 通过 HTTP_POST 与 Excel 发送文件？

这里问的问题是如何使用 VBA 从 Excel 向服务器发送 HTTP POST 请求 https stackoverflow com questions 158633 how can i send an http post reques
在 Android 中查询 Google Play 音乐数据库

我正在尝试查询 Google Play 音乐应用程序创建的播放列表但无法执行此操作我使用本地存储的内容创建了一个播放列表我用下面的代码来查询 Cursor c managedQuery MediaStore Audio Playli
AngularJS 从控制器打开模态

我是 angularjs 的新手正在编写一个应用程序其中包含网格的模板 inventory html 用打开它在网格底部有一个验证按钮它调用 validate 来验证选定的网格行在此之前我需要一个模式弹出并以用户名作为输入然后
实体框架：“底层提供程序在打开时失败”

当我尝试插入记录时出现此错误底层提供程序在打开时失败此错误仅发生在 IIS 上而不会发生在 VWD 2008 的 Web 服务器上在事件查看器中我收到此应用程序错误由于启动用户实例进程失败无法生成 SQL Server 的用户
如何将自定义字体添加到 iPhone 应用程序？

我必须做什么才能获取具有自定义字体的 UIFont 对象我记得 Info plist 文件中也发生了一些事情支持哪些字体文件格式要将自定义字体添加到您的应用程序您可以将它们添加到 XCode 项目然后修改application
“Delivered-To”标头是否是查找转发邮件收件人地址的正确位置？

example com 上有一个邮件处理脚本可以处理发送到以下地址的电子邮件电子邮件受保护 cdn cgi l email protection 邮件服务器具有 example com 的包罗万象的功能并将电子邮件处理到适当的帐户中
如何在 Azure Active Directory 中获取用户的“分配角色”？

我将 Azure AD 与注册的应用程序一起使用并使用 Microsoft Graph API 来查询 AD 下面的代码告诉用户被分配到哪些组 var memberof await graphClient Users xxx Member
模型将集合属性与部分视图绑定

假设我有一个这样的模型 public class Foo public List
Android 方向改变动画

当我将屏幕方向从纵向更改为横向时我必须给出动画效果反之亦然我该怎么做呢任何帮助将不胜感激谢谢在 Activity 的 onCreate 方法中使用 overridePendingTransition int EnterAnim
尝试在 NotepadV1 示例练习中加载资源时出现“找不到资源”异常

我是 Android 新手但不是 Java 我遵循示例练习 NotepadV1 但在虚拟设备上执行时出现奇怪的错误 Hello World 在同一虚拟设备上运行良好运行程序时出现找不到资源异常使用的 ID 是正确的 Eclipse
如何在android中将所有联系人信息导出为VCF文件

使用此代码我可以导出我设置的任何值但除此之外我想保存图像生日关系 assistnat 注释标签网站如何设置这个值来生成vcf文件 Person p getPerson File vcfFile new File this get
打破数组循环函数（map、forEach 等）的循环

我怎样才能打破类似于break语句来自数组的隐式循环 The Array prototype map Array prototype forEach等函数意味着对数组元素的循环我想尽早有条件地打破这个循环这个人为的例子 const
具有两个优先级值的优先级队列

众所周知插入优先级队列的元素具有确定其优先级的值例如如果我有五个元素A B C D E具有优先级我们称之为优先级值priorityI A 10 B 5 C 1 D 3 E 2 但是我如何编写一个可以定义两个优先级值的优先级队列我的
当类存在时ClassNotFoundException？

我对此有点困惑 Android 正在抛出一个ClassNotFoundException即使有这样的班级 04 20 09 07 50 179 E AndroidRuntime 525 FATAL EXCEPTION main 04 20
PHP 浮点模数不起作用

我编写了一个函数以便在必要时向数字添加逗号和零但我陷入了模数函数的困境根据我的PHP float 877 5 1 0 true 不应该877 5 1 0 5 它提醒你你需要的是什么fmod http www php net manua
如何使用 NLTK 从归纳语法生成句子？

我有一个大解析句子列表使用斯坦福解析器解析例如句子现在你可以娱乐了有以下树 ROOT S ADVP RB Now NP PRP you VP MD can VP VB be VP VBN entertained 我正在使用一组

如何使用 NLTK 从归纳语法生成句子？

如何使用 NLTK 从归纳语法生成句子？ 的相关文章

随机推荐

热门标签

如何使用 NLTK 从归纳语法生成句子？的相关文章