字母尺度和随机文本上的马尔可夫链

2024-05-10

我想使用 .txt 文件中的一本书中的字母频率生成随机文本，以便每个新字符 (string.lowercase + ' ') 取决于前一个。

如何使用马尔可夫链来做到这一点？或者使用每个字母都有条件频率的 27 个数组更简单？

我想使用来自的字母频率生成随机文本 txt 文件中的书籍

考虑使用收藏.柜台 http://docs.python.org/library/collections.html#counter-objects一次循环文本文件两个字母时建立频率。

如何使用马尔可夫链来做到这一点？还是用27个数组更简单每个字母的条件频率？

这两个语句是等价的。马尔可夫链是what你正在做的。具有条件频率的 27 个阵列是how你正在做。

以下是一些基于字典的代码，可以帮助您入门：

from collections import defaultdict, Counter
from itertools import ifilter
from random import choice, randrange

def pairwise(iterable):
    it = iter(iterable)
    last = next(it)
    for curr in it:
        yield last, curr
        last = curr

valid = set('abcdefghijklmnopqrstuvwxyz ')

def valid_pair((last, curr)):
    return last in valid and curr in valid

def make_markov(text):
    markov = defaultdict(Counter)
    lowercased = (c.lower() for c in text)
    for p, q in ifilter(valid_pair, pairwise(lowercased)):
        markov[p][q] += 1
    return markov

def genrandom(model, n):
    curr = choice(list(model))
    for i in xrange(n):
        yield curr
        if curr not in model:   # handle case where there is no known successor
            curr = choice(list(model))
        d = model[curr]
        target = randrange(sum(d.values()))
        cumulative = 0
        for curr, cnt in d.items():
            cumulative += cnt
            if cumulative > target:
                break

model = make_markov('The qui_.ck brown fox')
print ''.join(genrandom(model, 20))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

markovchains

字母尺度和随机文本上的马尔可夫链的相关文章

numba 函数何时编译？

我正在研究这个例子 http numba pydata org numba doc 0 15 1 examples html multi threading http numba pydata org numba doc 0 15 1 ex
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户

随机推荐

为什么 [].push([]) 返回 1？ [复制]

这个问题在这里已经有答案了为什么这会返回 1 push outputs 1 push 返回数组的新长度 one push two returns 2 array length is 2 one two push something ret
将活动工作表作为电子邮件附件从 Google 工作表发送

我有一个谷歌表单可以捕获电子表格中的响应目前每次做出新响应时它都会创建一个新工作表我现在尝试将邮寄活动工作表脚本添加到创建新工作表的现有脚本中但是我收到错误请求失败https docs google com spreads
什么是 C++11 扩展 [-Wc++11-extensions]

我需要一些帮助来了解此错误发生的位置警告非静态数据成员的类内初始化是 C 11 扩展 Wc 11 extensions 这是它来自的代码部分 typedef struct Hand bool straight false bool fl
/WEB-INF 中的 JSP 返回“HTTP 状态 404 请求的资源不可用”

我创建了一个 JSP 文件 sample jsp This is jsp program 我把它放在这里samplejsp项目 samplejsp WebContent WEB INF sample jsp 我通过以下网址打开了它 http
Java泛型类型

当我有一个界面时 public interface Foo
RemoveEventListener 在 Firefox 版本 58 中不起作用

但它在 Chrome 中有效这是我的 UI EventBus 代码原型 addEventListener方法是一样的只不过remove换成了add UI EventBus removeEventListener function ob
在javascript中我们如何识别一个对象是Hash还是Array？

我的 JSON 调用的输出可以是数组或哈希我如何区分这两者现代浏览器支持Array isArray obj method See MDN https developer mozilla org en US docs Web JavaSc
scrapy python 请求未定义

我在这里找到了答案 code for site in sites Link site xpath a href extract CompleteLink urlparse urljoin response url Link yield Re
转换 Java -> Grails ... 如何加载这些属性？

我正在将 Java Web 应用程序转换为 Grails 1 2 1 在我的 Java 应用程序中我有一个从 properties 文件加载属性的单例我已经看到我可以将其加载到 Config groovy conf 文件中如果我的属性
关闭应用程序后如何调试

我正在尝试重现问题这需要在特定位置关闭并重新打开我的应用程序这是我的问题 1 如何查看我的日志使用NSLog命令当我的 iPhone 未连接到 XCode 时 2 是否可以将iPhone模拟器的特定位置例如市中心设置为默认位置
是否可以在 Apple M1 计算机上安装 Weblogic 12.2.1.4？

我一直在寻找有关这方面的信息但没有找到任何信息我认为 Oracle 站点上没有可用于在 Apple M1 设备上安装 Weblogic 12 2 1 X 的版本但也许可以使用 Rosetta 2 来完成此操作有人尝试过吗我不能因
如何访问 gem5 线程统计信息？

我希望在我的一些工作中使用 gem5 并且对其功能有一个非常普遍的问题我的问题是使用 gem5 我可以获得有关单个线程的行为系统资源使用情况的统计信息无论是 SE 还是 FS 模式例如如果我的应用程序中运行 2 个线程我是否可
为什么将未使用的返回值转换为 void？

int fn void whatever void fn 是否有任何理由将未使用的返回值强制转换为 void 或者我认为这完全是浪费时间 David s answer https stackoverflow com questions 68
Tkinter 绑定 Mac OS“command+q”

当我按 Command q 时我试图停止根窗口退出但这是不可能的其他快捷键在我的 Mac 操作系统上有效即使在 Windows Linux 中 Alt F4 绑定也可以捕获但在 Mac 操作系统中对我来说是不可能的有任何想
Python“self”关键字[重复]

这个问题在这里已经有答案了我是 Python 新手通常使用 C 最近几天开始使用它在类中是否需要在对该类的数据成员和方法的任何调用前添加前缀因此如果我在该类中调用方法或从该类获取值我需要使用self method or sel
监控 Java 应用程序上的锁争用

我正在尝试创建一个小基准在 Groovy 中以显示几个同步方法上的高线程争用当监控自愿上下文切换时应该会出现高争用在 Linux 中这可以通过 pidstat 来实现程序如下 class Res private int n s
如何在RcppParallel中调用用户定义的函数？

受到文章的启发http gallery rcpp org articles parallel distance matrix http gallery rcpp org articles parallel distance matrix 我
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
将响应式网格布局转换为 Plotly Dash

我是一个非常活跃的 Dash 用户我开始发现 Dash 使用中存在很多限制并且我意识到有关如何将组件转换为 Dash 的信息内容绝对有限并且示例过时且非常简单并且我对 Javascript 或 React 几乎没有任何了解我完全
字母尺度和随机文本上的马尔可夫链

我想使用 txt 文件中的一本书中的字母频率生成随机文本以便每个新字符 string lowercase 取决于前一个如何使用马尔可夫链来做到这一点或者使用每个字母都有条件频率的 27 个数组更简单我想使用来自的字母频率生成随机文本

字母尺度和随机文本上的马尔可夫链

字母尺度和随机文本上的马尔可夫链 的相关文章

随机推荐

热门标签

字母尺度和随机文本上的马尔可夫链的相关文章