如何在 Tensorflow 的图形管道中解码 Unicode 字符串

2024-03-18

我创建了一个 tfRecord 文件来存储数据。我必须存储印地语文本，因此我使用 string.encode('utf-8') 将其保存在字节中。

但是，我在读取数据时陷入困境。我正在张量流数据集 API 的帮助下读取数据。我知道我可以使用 string.decode('utf-8') 对其进行解码，但这不是我想要的。我想要一些解决方案，通过它我可以将字节字符串解码回图形内的 Unicode 字符串。

我努力了as_text https://www.tensorflow.org/api_docs/python/tf/compat/as_text, 解码原始数据 https://www.tensorflow.org/api_docs/python/tf/io/decode_raw但他们给出了错误。

我的解析（映射）函数：

def _parse_function(tfrecord_serialized):
    features={'float': tf.FixedLenSequenceFeature([], 
    tf.float32,allow_missing=True),
         'byte': tf.FixedLenFeature([], tf.string),
          'int': tf.FixedLenSequenceFeature([], 
    tf.int64,allow_missing=True)}
    parsed_features = tf.parse_single_example(tfrecord_serialized, 
    features)
    return parsed_features['float'],parsed_features['byte'], parsed_features['int']`

我正在阅读我的 tfRecord 文件，如下所示。

    filenames = ["data.tfrecord"] ## List of filename,Multiple filename can be provided together.
    dataset = tf.data.TFRecordDataset(filenames)
    dataset = dataset.map(_parse_function)
    iterator = dataset.make_initializable_iterator()`

    t1,t2,t3 = iterator.get_next()
    sess = tf.Session()
    sess.run(iterator.initializer)
    a,b,c = sess.run([t1,t2,t3])
    print(a,b,c)
    b.decode('utf-8')`

在 b.decode 上，我得到的输出非常好，出于明显的原因，我希望在图表中执行此操作，从 tf 返回到 python 然后再返回通常不是一个好主意。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

TFRecord

如何在 Tensorflow 的图形管道中解码 Unicode 字符串的相关文章

softmax_cross_entropy_with_logits和loss.log_loss有什么区别？

之间的主要区别是什么tf nn softmax cross entropy with logits and tf losses log loss 两种方法都接受 1 hot 标签和 logits 来计算分类任务的交叉熵损失这些方法在理论上
python setup.py Egg_info 失败，错误代码 1

我正在运行 Ubuntu 17 04 全新安装并且已经安装了 pip 但是当我尝试安装任何东西时我得到以下信息命令 python setup py Egg info 失败错误代码为 1 tmp pip build kBfUEp k
Pandas：删除具有纳米值索引的行

给定以下 pandas DataFrame 其中一些索引是NaN 如何删除第三行和第八行因为它们的索引是NaN Thanks import pandas as pd import numpy as np data list abcdefg
用于多输入图像的 VGG16 网络

我正在尝试将 VGG16 网络用于多个输入图像使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc 大约 50 这就是为什么我想使用 VGG16 这样的既定模型进行尝试这是我尝试过的 imports from keras a
Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

当我使用 xgboost 训练我的数据时2 cates classification problem 我想使用提前停止来获得最佳模型但我对在预测中使用哪一个模型感到困惑因为提前停止将返回 3 个不同的选择例如我应该使用 preds
如何根据本地目录中的requirements.txt 文件使用pip 安装软件包？

问题是这样的我有一个要求 txt文件看起来像 BeautifulSoup 3 2 0 Django 1 3 Fabric 1 2 0 Jinja2 2 5 5 PyYAML 3 09 Pygments 1 4 SQLAlchemy 0 7
python 函数中的任意数量的参数

我想学习如何在 python 函数中传递任意数量的参数所以我以递归方式编写了一个简单的 sum 函数如下所示 def mySum args if len args 1 return args 0 else return args 1 m
使用 BeautifulSoup 在 python 中抓取多个页面

我已经设法编写代码来从第一页中抓取数据现在我不得不在这段代码中编写一个循环来抓取接下来的 n 页下面是代码如果有人可以指导帮助我编写从剩余页面中抓取数据的代码我将不胜感激 Thanks from bs4 import Beauti
为什么playsound函数无法在python中播放我的mp3文件

所以基本上我试图创建一个音乐播放程序可以在您要求时播放音乐我只是想让歌曲播放部分实际工作所以我编写了一个超级简单的代码来测试它 import playsound playsound sample mp3 This was done i
dask groupby 不合并分区

我有一组数据我想要对其进行一些简单的 groupby count 操作但我似乎无法使用 dask 来完成此操作我很可能不理解 dask 中执行 groupby reduce 的方式特别是当索引位于分组键中时所以我将用玩具数据来说明
在 Python 中通过 TCP 套接字发送文件

我已经成功地将文件内容图像复制到新文件然而当我通过 TCP 套接字尝试同样的事情时我遇到了问题服务器循环未退出客户端循环在到达 EOF 时退出但服务器无法识别 EOF 这是代码 Server import socket Im
如何显示 Jupyter 笔记本的版本并在 Jupyter 笔记本中运行单元？我收到错误：错误的解释器

我已经安装了 Anaconda 并使用 conda 环境和 conda 命令来安装软件当我输入 jupyter notebook version 我收到以下错误 zsh Users cr517 local bin jupyter bad
尝试导入 cv2(opencv-python) 包时出错

我正在尝试使用 cv2 opencv python 包访问我的网络摄像头当我尝试导入它时出现此错误 Traceback most recent call last File server py line 6 in
无需重新计算即可获取字典键哈希

有没有办法从字典中提取现有的密钥哈希而无需再次重新计算它们暴露它们并因此通过哈希而不是密钥访问字典会有什么风险我认为 Python 的字典对象没有任何公共 API 可以让您查看存储其对象的哈希值您无法在 Python 代码中直接通过
如何仅从源代码构建 TensorFlow lite 而不是所有 TensorFlow？

我正在尝试使用 Edgetpu USB 加速器与 Intel ATOM 单板计算机和 C API 进行实时推理 Edgetpu 的 C API 基于 TensorFlow lite C API 我需要包含来自tensorflow lite目
如何获得 GTK 中的默认颜色？

Context 在 GTK 3 中人们可以设置自己的主题甚至默认主题 Adwaita 也提供两种变体浅色和深色当我编写自己的小部件用Python 时我需要获取这些颜色以避免在黑色上绘制黑色或在白色上绘制白色 Question 如
如何在 Jupyter 笔记本的 HTML 输出中获取垂直滚动条

当使用具有 500 行的 Excel 在 Jupyter Notebooks 中运行以下代码时 import pandas as pd pd set option display min rows 50 pd set option disp
识别输入的数据类型

我正在尝试打印用户输入的数据类型并生成如下表 ABCDEFGH String 1 09 float 0 int true bool etc 我正在使用 Python 3 2 3 并且我知道我可以使用type 获取数据的类型但在Python
如何从初始化参数中正确设置 Python 类属性

作为一名 Python 程序员我经常声明类似的类 class Foo def init self attr1 attr2 attr3 attr4 attr5 attr6 attr7 attr8 attr9 self attr1 attr1
Tensorflow Inception 多 GPU 训练损失未求和？

我正在尝试检查多个 GPU 在一台机器上的 Tensorflow 初始代码我很困惑因为据我所知我们从不同的塔又名 GPU 中得到了多次损失但是loss评估的变量似乎只是最后一个塔的变量而不是所有塔的损失之和 for step

随机推荐

Gui 工具包，我应该使用哪个？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在编写一个相当大且复杂的数据分析程序我认为是时候为该程序构建一个 GUI 了所以我的问题是我应该使用哪个 GUI 工具包我对编码和构建 G
Phonegap 1.7中的Childbrowser插件只能第一次打开

Phonegap 1 7 中的 Childbrowser 插件只能在第一次打开我正在使用 Phonegap 1 7 和 Childbrowser 仅在子浏览器第一次工作时当我关闭 Childbrowser 按下完成按钮后当我尝试打开
如何仅删除父表中由子表中的外键引用的行

我想从父表中删除行元组但它抛出错误消息因为它的子表中有外键引用但是就我而言我想仅删除父表中的记录并保留子表中的数据有可能实现这一目标吗我知道的用法ON DELETE CASCADE https stackoverflow c
ExtJS“日期字段”验证覆盖

我需要一个具有一些自定义行为的日期列特别是我需要能够在同一字段中输入日期或年龄年龄保持呈现为年龄日期保持呈现为日期例如输入 23 将使 23 在字段中保留为有效值或者输入 22 1 88 将使 22 1 88 保留为有效值所以
在第一行有 rowspan 的情况下，在表格的第一行设置 css 样式

我有很多表想要在表的第一行设置 css 样式前提是第一行有行跨度 table tbody tr td width 110 Name td td width 110 Size td td width 110 Status td tr tr
Vega-Lite 中的平行坐标？

是否可以创建平行坐标维加精简版 https vega github io vega lite 我正在寻找一个简单但功能强大的 JavaScript 绘图库并且需要支持平行坐标 I have googled https www google
如何使用 PHP 将 RSS XML 提要转换为数组

我希望标题代表全部如何使用 PHP 将 RSS XML 提要转换为数组如何才能做到这一点例如我正在使用以下网址这导致了 XML 模式我需要使用 PHP 将其转换为数组格式任何帮助将不胜感激和感激提前致谢一步步 How to
如何在没有 web.xml 的情况下将 App Engine 项目更新到 Java 11？

我有一个应用程序引擎项目 Here https github com KevinWorkman GoogleCloudExamples tree master hello world是一个示例存储库但它只包含几个文件 pom xml
viewWillAppear 子视图

我有 UIScrollView 与多个 UIVIew 子视图我想更新每个 UIView 显示在 UIScrollView 的可见部分中时显示的数据触发的回调是什么我尝试了 viewWillAppear 但似乎没有被调用谢谢你必须自
XQuery 中的 element() 与 node()

有人可以告诉我两者之间的确切区别吗node and element XQuery 中的类型该文档指出element 是一个元素节点而node 是任何节点所以如果我理解正确的话element 是一个子集node 问题是我有一个像这样的
如何覆盖 Qwik 中的默认 404 屏幕？

我正在测试 Builder IO 中的 Qwik Javascript 框架但找不到任何文档可以指导我自定义 404 页面的方向我正在使用 Qwik 的 qwik city 插件核实这是关于如何渲染404页面的 https qwik
查找到另一组任意点的范围内的所有点

我有两组点A and B 我想找到所有点B是在一定范围内的r to A 其中一点b in B据说在范围内r to A如果至少有一个点a in A其欧几里得距离b等于或小于r 两组点中的每一个都是连贯的点集它们是根据两个不重叠对象的体素
无法获得多视图控制来更改视图

我有一个多视图控件有两个视图 View1 是默认视图 View2 是新视图当最终用户单击按钮时我想将视图更改为 View2 无论如何我似乎都无法实现这一目标 ASP NET 代码
python/pycharm项目在调试模式下产生分段错误，但在运行模式下不会产生分段错误

奇怪的是在调试模式下如果脚本在通常会发生段错误没有断点的地方停止通过断点然后恢复则不会发生段错误很奇怪吧本项目使用pycharm和pygame 操作系统是 windows 10 该项目包含跨 8 个模块的约 1500 行代
如何在 Qt 应用程序中使用样式表更改 QPushButton 图标大小

是否可以使用样式表设置和更改 QPushButton 上的图标大小我需要这个基于 qt 的模板客户可以使用样式表对其进行样式化在样式表中使用以下代码 qproperty iconSize 24px
如何将 SQL 大容量复制与 Dapper .Net 结合使用？

我正在使用 Dapper net 在 SQL 表中进行批量插入操作我正在考虑使用 SQKBulk Copy 与 Dapper Net 但没有任何经验如何将 SqlbulkCopy 与 Dapper Net 一起使用非常感谢你的帮助使用
Windows 7 和 Windows Server 2008 R2 之间的差异

Windows 7 或 Windows Server 2008 R2 中包含某些功能和 API 但另一个则不包含在哪里可以找到差异的具体列表如果程序要兼容两者有什么需要特别避免的吗当然这个问题可以推广到任何版本的 Windows
Sapper/Svelte 可以有条件地导入组件吗？

在 Sapper 中我仅在客户端渲染时才尝试导入组件使用onMount 有没有类似React的东西Suspense and React lazy 或者还有其他方法吗你当然可以这样做是的
Cordova 应用程序 - 构建工具错误 - Gradle

我有一个科尔多瓦应用程序重装系统后无法编译我遇到了错误 Error No installed build tools found Please install the Android build tools version 19 1 0
如何在 Tensorflow 的图形管道中解码 Unicode 字符串

我创建了一个 tfRecord 文件来存储数据我必须存储印地语文本因此我使用 string encode utf 8 将其保存在字节中但是我在读取数据时陷入困境我正在张量流数据集 API 的帮助下读取数据我知道我可以使用 str

如何在 Tensorflow 的图形管道中解码 Unicode 字符串

如何在 Tensorflow 的图形管道中解码 Unicode 字符串 的相关文章

随机推荐

热门标签

如何在 Tensorflow 的图形管道中解码 Unicode 字符串的相关文章