在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器

2024-02-16

是否可以从 Python 端在 TensorFlow CTC 实现中自定义 Beam Scorer？我在 CTCBeamSearchDecoder C++ 类构造函数的评论中看到了这种可能性，但想知道如何为 Python 用户提供此功能？

我们遇到的具体问题是将语言模型插入基于 CTC 的语音解码器。语言模型可以是预训练的 TensorFlow 子图，能够输出波束分数调整的概率。但我们需要一种方法将其注入光束刻划器中。

目前，Python 还没有 API 可以将语言模型与自定义评分器结合使用。欢迎贡献，但在 Python API 中实现这一点存在一些困难，因为它需要在解码器操作内的独立会话中运行 TF LM 子图，而这些不能很好地融合在一起。

最简单的方法是在 C++ 中，需要扩展 BaseBeamScorer 类以及 BeamState（类似于测试中看到的），并在通常进入的张量流图的输出之上进一步运行 CTCBeamSearchDecoder::Decode ctc_beam_search_decoder 操作。

通过这样做，您的 BeamScorer 实现可以利用您手头的任何语言模型，并且只需在将波束从一种状态扩展到另一种状态时返回适当的分数即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

languagemodel

在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器的相关文章

在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
TensorFlow - 为什么这个 softmax 回归没有学到任何东西？

我的目标是用 TensorFlow 做大事但我正在尝试从小事做起我有一些小的灰度方块有一点噪音我想根据它们的颜色对它们进行分类例如 3 个类别黑色灰色白色我编写了一个小 Python 类来生成正方形和 1 hot 向量并
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
使用 TensorFlow 2.1 的 Cloud TPU v3 Pod 的 TPUClusterResolver 出现错误

我正在尝试在带有 TensorFlow 2 1 的 Google Cloud Compute Engine VM 上使用我的抢占式 Cloud TPU v3 256 但它似乎无法正常工作TPUClusterResolver抛出一个Coul
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
在 TensorFlow 中，tf.identity 有何用途？

我见过tf identity在一些地方使用过例如官方 CIFAR 10 教程和 stackoverflow 上的批量规范化实现但我不明白为什么有必要它是用来做什么的谁能给出一两个用例吗一种建议的答案是它可以用于 CPU 和 GPU
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
Tensorflow中通过字符串选择不同的模式

我正在尝试构建一个 VAE 网络我希望模型在不同的模式下做不同的事情我有三种模式训练相同和不同以及一个名为 interpolation mode 的函数它根据模式执行不同的操作我的代码如下所示 import tensorf
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y

随机推荐

如何使用正则表达式搜索带括号的字符串？

我有一个 txt 文件其中包含以下字符串 A 123 B 456 Ab 123 我想搜索Ab 123 在txt文件中我尝试过的 re search r Ab 123 string 有 12 个具有特殊含义的字符您可以使用以下命令转义到
与 preg_match_all 匹配

我得到这个正则表达式 val 123 4 56 regex preg match all regex val matches 谁能告诉我为什么这只匹配最后一个数字 56 而不是每组数字这是上面的正则表达式运行后 matches 包含的内容
使用不带 InvokePattern 或 clickablePoint 的 UI Automation在单击按钮时调用

我尝试将点击消息发送到或调用另一个应用程序中的按钮我使用 UISpy exe 并可以找到我需要的元素但它没有 id 没有 clickablePoint 也没有 Invoke 模式我尝试了以下代码 var processStartI
一种为对象数据库建立索引的方法

我正在使用对象数据库 ZODB 来存储许多对象之间的复杂关系但遇到了性能问题因此我开始构建索引以加快对象检索和插入速度这是我的故事希望对您有所帮助最初当我向数据库添加对象时我会将其插入专用于该对象类型的分支中为了防止多个对
没有 JDK 的 JRE 6 (Windows) 上的堆转储

有没有办法在没有安装 JDK 的远程计算机上创建堆转储我无法更改安装设置并且它在 Windows 上运行所以我可以随时访问命令行工具问题是远程计算机上的 Java 应用程序冻结没有内存不足异常因此 XX HeapDumpOnO
JAXB 解组忽略命名空间将元素属性变成 null

我正在尝试使用 JAXB 将 xml 文件解组为对象但遇到了一些困难实际项目的 xml 文件中有几千行因此我以较小的规模重现了错误如下所示 XML 文件
防止“xmlValue”剥离
标签

我遇到了一个问题其中xmlValue剥离 br 我需要保留的标签或转换为其他角色然后我可以strsplit on 这是一个例子 gt f lt htmlParse getForm http sites target com site
WaitForMultipleObjects 会修改*多个*对象的状态吗？ [复制]

这个问题在这里已经有答案了使用时WaitForMultipleObjects bWaitAll FALSE http msdn microsoft com en us library windows desktop ms687025 28
为什么 1ul << 64 返回 1 而不是 0？ [复制]

这个问题在这里已经有答案了考虑下面的代码 Simply loop over until 64 is hit unsigned long x 0 for int i 0 i lt 64 i if i 64 x 1ul lt lt i pri
给定一个整数数组，使用数组中的数字找到最大的数字，使其能被 3 整除

例如数组 4 3 0 1 5 假设所有数字都 gt 0 数组中的每个元素也对应一个数字即数组中的每个元素都在 0 到 9 之间在上面的数组中最大的数字是 5430 使用数组中的数字 5 4 3 和 0 我的方法为了能被 3 整除
通过沿最后一个轴对每个第 n 个元素进行采样来构造数组

Let a是一些不一定是一维 NumPy 数组n m沿其最后一个轴的元素我希望沿着它的最后一个轴分割这个数组以便我将每个n 第一个元素从0直到为止n 明确地让a有形状 k n m 然后我想构造形状数组 n k m np arra
如何在发送前更改响应

是否可以拦截向客户端发送的响应并在最终发送修改后的响应我想从基本身份验证响应中删除 WWW Authenticate 标头或者在错误的身份验证情况下将错误代码从 401 更改为 403 附我也有同样的问题 http www java
将更改分发到多个分支的 Git 工作流程

我有一个 Git 存储库其中有两个严重分歧的分支 A 和 B A是开源软件的上游分支 B 是我们对其所做的所有更改从 A 的早期提交作为起点我们想要的是如上A B 拥有我们希望上游开发人员可以使用的所有更改 C 包含仅适用于我们对软
SurfaceView 上的 Android 相机纵向显示

我尝试了几种方法来尝试让相机预览以纵向方式显示在SurfaceView 什么都没起作用我正在使用 2 0 1 的 Droid 进行测试我试过 1 通过以下方式强制布局为纵向 this setRequestedOrientation Ac
使用 OkHttp 分析 http 请求

如何使用 OkHttp 跟踪详细的请求时间我想得到连接时间发送时间接收时间我尝试使用拦截器机制但它只提供总请求时间 class LoggingInterceptor implements Interceptor Override
localhost 和 127.0.0.1 不一样吗？

我有一个在两个进程之间传递数据的套接字应用程序它在多台计算机上运行良好并且两个进程在同一台计算机上运行我办公室的一个人访问了一个政府办公室他们对她的笔记本电脑进行了一些未知的更改以便她可以访问他们的网络当她离开后该应用程序不再
是否可以替换 Android 中默认的“强制关闭”对话框？

我希望我的 Android 应用程序的用户可以选择通过电子邮件向我发送导致我的应用程序崩溃的任何未捕获异常的堆栈跟踪最初我以为我只需将应用程序的每个入口点包装在 try catch 块中但即使在我的小应用程序中也有太多这样的入口点
由于 VACUUM 查询，Amazon Redshift 磁盘使用率为 100%

阅读 Amazon Redshift 文档后我在某个 400GB 表上运行了 VACUUM 该表以前从未被清理过以尝试提高查询性能不幸的是 VACUUM 导致表增长到 1 7TB 并使 Redshift 的磁盘使用率达到 100 然后
Rails：不同控制器的形式

我正在开发一个带有登陆页面的 Rails 应用程序在登陆页面上用户可以注册该应用程序对于登录有一个带有额外控制器的额外视图它看起来像这样 views landinpage index html gt sign up form vi
在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器

是否可以从 Python 端在 TensorFlow CTC 实现中自定义 Beam Scorer 我在 CTCBeamSearchDecoder C 类构造函数的评论中看到了这种可能性但想知道如何为 Python 用户提供此功能我们遇

在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器

在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器 的相关文章

随机推荐

热门标签

在 TensorFlow CTC（语言模型）中使用自定义 Beam 评分器的相关文章