如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？

2024-03-12

从单词图像及其转录的列表中，我尝试创建和读取稀疏序列标签（例如tf.nn.ctc_loss）用一个tf.train.slice_input_producer，避免

将预打包的训练数据序列化到磁盘中TFRecord format
的明显局限性tf.py_func,
任何不必要或过早的填充，以及
将整个数据集读取到 RAM。

主要问题似乎是将字符串转换为标签序列（aSparseTensor）需要tf.nn.ctc_loss.

例如，字符集在（有序）范围内[A-Z]，我想转换文本标签字符串"BAD"到序列标签类别列表[1,0,3].

我想要读取的每个示例图像都包含文本作为文件名的一部分，因此可以直接提取并直接在 python 中进行转换。（如果有办法在 TensorFlow 计算中做到这一点，我还没有找到。）

之前的几个问题都扫过这些问题，但是一直没能整合成功。例如，

Tensorflow读取带有标签的图像 https://stackoverflow.com/questions/34340489/tensorflow-read-images-with-labels显示了一个带有离散、分类标签的简单框架，我是从这个模型开始的。
如何使用 TensorFlow 加载稀疏数据？ https://stackoverflow.com/questions/36917807/how-to-load-sparse-data-with-tensorflow很好地解释了加载稀疏数据的方法，但假设预包装tf.train.Examples.

有没有办法整合这些方法？

另一个例子（SO问题＃38012743）显示了我如何延迟从字符串到列表的转换，直到将文件名出队进行解码之后，但它依赖于tf.py_func，其中有警告。（我应该担心他们吗？）

我认识到“SparseTensors 不能很好地处理队列”（根据 tf 文档），因此在批处理之前可能需要对结果（序列化？）进行一些巫术，甚至在计算发生的地方进行返工；我对此持开放态度。

按照 MarvMind 的大纲，这里是一个基本框架，其中包含我想要的计算（迭代包含示例文件名的行，提取每个标签字符串并转换为序列），但我尚未成功确定“Tensorflow”方式来执行此操作。

感谢您的正确“调整”，一个更适合我的目标的策略，或者一个指示tf.py_func不会破坏训练效率或下游的其他东西（例如，加载经过训练的模型以供将来使用）。

编辑（+7 小时）我找到了缺失的操作来修补问题。虽然仍然需要验证它与下游 CTC_Loss 的连接，但我已经检查了下面编辑的版本是否正确批处理并读取图像和稀疏张量。

out_charset="ABCDEFGHIJKLMNOPQRSTUVWXYZ"

def input_pipeline(data_filename):
    filenames,seq_labels = _get_image_filenames_labels(data_filename)
    data_queue = tf.train.slice_input_producer([filenames, seq_labels])
    image,label = _read_data_format(data_queue)
    image,label = tf.train.batch([image,label],batch_size=2,dynamic_pad=True)
    label = tf.deserialize_many_sparse(label,tf.int32)
    return image,label

def _get_image_filenames_labels(data_filename):
    filenames = []
    labels = []
    with open(data_filename)) as f:
        for line in f:
            # Carve out the ground truth string and file path from 
            # lines formatted like:
            # ./241/7/158_NETWORK_51375.jpg 51375
            filename = line.split(' ',1)[0][2:] # split off "./" and number
            # Extract label string embedded within image filename
            # between underscores, e.g. NETWORK
            text = os.path.basename(filename).split('_',2)[1]
            # Transform string text to sequence of indices using charset, e.g.,
            # NETWORK -> [13, 4, 19, 22, 14, 17, 10]
            indices = [[i] for i in range(0,len(text))]
            values = [out_charset.index(c) for c in list(text)]
            shape = [len(text)]
            label = tf.SparseTensorValue(indices,values,shape)
            label = tf.convert_to_tensor_or_sparse_tensor(label)
            label = tf.serialize_sparse(label) # needed for batching
            # Add data to lists for conversion
            filenames.append(filename)
            labels.append(label)
    filenames = tf.convert_to_tensor(filenames)
    labels = tf.convert_to_tensor_or_sparse_tensor(labels)
    return filenames, labels

def _read_data_format(data_queue):
    label = data_queue[1]
    raw_image = tf.read_file(data_queue[0])
    image = tf.image.decode_jpeg(raw_image,channels=1)
    return image,label

关键的想法似乎是创造一个SparseTensorValue从想要的数据中，将其传递tf.convert_to_tensor_or_sparse_tensor然后（如果你想批量处理数据）将其序列化tf.serialize_sparse。批处理后，您可以使用以下命令恢复值tf.deserialize_many_sparse.

这是概要。创建稀疏值，转换为张量，然后序列化：

indices = [[i] for i in range(0,len(text))]
values = [out_charset.index(c) for c in list(text)]
shape = [len(text)]
label = tf.SparseTensorValue(indices,values,shape)
label = tf.convert_to_tensor_or_sparse_tensor(label)
label = tf.serialize_sparse(label) # needed for batching

然后，您可以进行批处理和反序列化：

image,label = tf.train.batch([image,label],dynamic_pad=True)
label = tf.deserialize_many_sparse(label,tf.int32)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

recurrentneuralnetwork

如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？的相关文章

如何在 Debian 上的 virtualenv 中安装 numpy？

注参见这另一篇文章 https stackoverflow com questions 6442754 how to install h5py numpylibhdf5 as non root on a debian linux syst
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File

随机推荐

从数据库模式创建 Web 表单

我想知道是否有任何应用程序最好是免费软件可以进行数据库配置并且尽可能轻松地创建用于轻松插入数据的 Web 表单我发现很难准确表达我所追求的是什么也许我可以谈谈我需要什么我有一个配置数据库至少通常包含有关我们系统中服务器的真相
如何在 jQuery 中解析 JSON 数组？

EDIT我检查了 jQuery 文档并使用 ajax 和指定的 json 数据类型返回一个评估的 javascript 对象因此 eval 不是这里的答案无论如何我知道这一点因为我能够解析单个 JSON 对象但不能解析数组问题
Capybara 问题：@request 必须是 ActionDispatch::Request

我在让 Capybara 与 Rails 一起使用时遇到问题只是测试那个所谓有趣的测试东西好的在所附的代码中有几个等效的测试第一个是用Rails 自带的shoulda context Test Unit 制作的第二个测试也是使用水
bitbucket - 无法确定主机“bitbucket.org”的真实性

我在尝试推送到我的 bitbucket 存储库时遇到了这个问题不确定为什么指纹不匹配 It asks me if I want to continue but I can t type anything in the dialog aft
未为类型“DBNull”和类型“Integer”定义运算符“=”

过去几个小时我一直在挣扎但仍然无法解决这个问题我遇到的问题是当有人被承认数据库更新给他们 BedID 时当我尝试释放他们时我似乎无法将 BedID 在数据库中设置为 Nothing 这是一个问题因为我需要能够接纳和解雇尽可能多
将 csv 数据集导入到 R 但值变成因子

我对 R 非常陌生在访问我导入的数据集时遇到问题我正在使用 RStudio 并在导入 csv 文件时使用导入数据集功能并将该行从控制台窗口粘贴到源窗口代码如下 setwd c kalle R stuckey lt read csv
未调用 DOMContentLoaded 或加载事件处理程序的异步加载脚本？

我有一个脚本DOMContentLoaded事件处理程序 document addEventListener DOMContentLoaded function console log Hi 我正在异步加载然而事件处理程序从未被调用过
Java中的正则表达式问题

我正在尝试为以下内容创建一个正则表达式replaceAllJava 中的方法测试字符串是abXYabcXYZ模式是abc 我想将除图案之外的任何符号替换为例如字符串abXYabcXYZ和图案 abc 应该返回 abc 但就我而言它会返
透明表单，其中包含可见的可点击控件

我正在尝试在 win8 和 winforms 中制作一个鼠标透明表单其中包含可单击的控件我可以使用此代码使表单鼠标透明 int initialStyle GetWindowLong this Handle 20 SetWindowLon
具有彩色高度的 3D 瀑布图

我正在尝试使用 Python 和 Matplotlib 以 3D 方式可视化一个数据集该数据集由 x z 数据的时间序列沿 y 组成我想创建一个像下面这样的图这是用 Python 制作的 http austringer net wp
将逗号分隔的字符串作为列表传递

假设我有一个字符串例如 x 1 y cat z NULL 我想获取代码创建的列表list x 1 z cat z NULL 这是我的第一次尝试我知道这是horrible parse text lt function x parse te
如何在 Java 中设置 LookAndFeel 文件？

我需要在 JDK 1 6 中设置 LookAndFeel 文件我有两个文件餐巾拉夫 swingset2 jar 餐巾纸罐子我该如何设置并使用它我想要 GTK 外观或 Qt 外观它们可用吗本页介绍了如何使用外观和感觉 http j
Clang 在折叠表达式中找不到模板二元运算符

这是我连接元组的二元运算符 template
HTML5 视频无法在 IE 11 中运行

我有一个视频存档可以在除 IE 11 之外的所有版本中使用在 IE 11 中加载时我收到错误错误不支持的视频类型或无效文件路径下面是我正在使用的 HTML
如何使用 JSR94 通过 Drools 加载基于 Excel 的决策表？

网上有很多关于如何加载 Drools DRL 规则集的示例但是我似乎找不到任何有关如何使用 JSR94 API 加载 Excel 格式的决策表的说明或示例有谁知道如何做到这一点如果是的话您能提供一个简单的代码示例吗下面是我正在使
如何在android上为jenkins生成JUnit测试报告

我正在尝试使用 Jenkins 中的发布 JUnit 测试结果报告但无法让它适用于我的 android 测试项目我在 Jenkins 中的 android 测试项目的设置基于此指南 https wiki jenkins ci org
如何在 Mac OS X 10.7.3 上安装 JDK7 (Java 7)？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 在 Mac OS X 10 7 3
vue.js 代码、模板和 css 位于单独的文件中

我想将我的 vue 组件拆分为包含 css scss 模板和代码的单独文件到目前为止我得到的解决方案是 js代码 import Vue from vue import template from template vue import s
Ansible，如何在单个文件中加入多个数组？

使用它作为我的样板 https github com modcloth ansible role modcloth sumologic collector https github com modcloth ansible role mod
如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？

从单词图像及其转录的列表中我尝试创建和读取稀疏序列标签例如tf nn ctc loss 用一个tf train slice input producer 避免将预打包的训练数据序列化到磁盘中TFRecord format 的明显局限性

如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？

如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？ 的相关文章

随机推荐

热门标签

如何在 Tensorflow 中生成/读取 CTC 损失的稀疏序列标签？的相关文章