Tensorflow：从 TFRecords 文件中提取图像和标签

2024-05-04

我有一个 TFRecords 文件，其中包含图像及其标签、名称、大小等。我的目标是将标签和图像提取为 numpy 数组。

我执行以下操作来加载文件：

def extract_fn(data_record):
    features = {
        # Extract features using the keys set during creation
        "image/class/label":    tf.FixedLenFeature([], tf.int64),
        "image/encoded":        tf.VarLenFeature(tf.string),
    }
    sample = tf.parse_single_example(data_record, features)
    #sample = tf.cast(sample["image/encoded"], tf.float32)
    return sample

filename = "path\train-00-of-10"
dataset = tf.data.TFRecordDataset(filename)
dataset = dataset.map(extract_fn)
iterator = dataset.make_one_shot_iterator()
next_element = iterator.get_next()

with tf.Session() as sess:
    while True:
        data_record = sess.run(next_element)
        print(data_record)

图像保存为字符串。我怎样才能将图像转换为float32？我试过sample = tf.cast(sample["image/encoded"], tf.float32)这是行不通的。我想data_record是一个列表，其中包含作为 numpy 数组的图像和作为np.int32数字。我怎样才能做到这一点？

现在data_record看起来像这样：

{'image/encoded': SparseTensorValue(indices=array([[0]]), values=array([b'\xff\xd8\ ... 8G\xff\xd9'], dtype=object), dense_shape=array([1])), 'image/class/label': 394}

我不知道如何处理它。我将不胜感激任何帮助

EDIT

如果我打印sample and sample['image/encoded'] in extract_fn()我得到以下信息：

print(sample) = {'image/encoded': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fe41ec15978>, 'image/class/label': <tf.Tensor 'ParseSingleExample/ParseSingleExample:3' shape=() dtype=int64>}

print(sample['image/encoded'] = SparseTensor(indices=Tensor("ParseSingleExample/ParseSingleExample:0", shape=(?, 1), dtype=int64), values=Tensor("ParseSingleExample/ParseSingleExample:1", shape=(?,), dtype=string), dense_shape=Tensor("ParseSingleExample/ParseSingleExample:2", shape=(1,), dtype=int64))

看起来图像是一个稀疏张量并且tf.image.decode_image抛出错误。将图像提取为图像的正确方法是什么tf.float32 tensor?

我相信您存储编码为 JPEG 或 PNG 或其他格式的图像。所以，在阅读的时候，你必须解码它们：

def extract_fn(data_record):
    features = {
        # Extract features using the keys set during creation
        "image/class/label":    tf.FixedLenFeature([], tf.int64),
        "image/encoded":        tf.VarLenFeature(tf.string),
    }
    sample = tf.parse_single_example(data_record, features)
    image = tf.image.decode_image(sample['image/encoded'], dtype=tf.float32) 
    label = sample['image/class/label']
    return image, label

...

with tf.Session() as sess:
    while True:
        image, label = sess.run(next_element)
        image = image.reshape(IMAGE_SHAPE)

Update:看来您的数据是稀疏张量中的单个单元格值。尝试将其转换回密集并在解码前后进行检查：

def extract_fn(data_record):
    features = {
        # Extract features using the keys set during creation
        "image/class/label":    tf.FixedLenFeature([], tf.int64),
        "image/encoded":        tf.VarLenFeature(tf.string),
    }
    sample = tf.parse_single_example(data_record, features)
    label = sample['image/class/label']
    dense = tf.sparse_tensor_to_dense(sample['image/encoded'])

    # Comment it if you got an error and inspect just dense:
    image = tf.image.decode_image(dense, dtype=tf.float32) 

    return dense, image, label

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow：从 TFRecords 文件中提取图像和标签的相关文章

Django - 未找到“”的反向。 '' 不是有效的视图函数或模式名称

我正在研究我的课程项目但现在我完全陷入困境我正在创建一个网站通过 PayPal 销售产品但 PayPal 退货取消页面未正确呈现我已经按照课程中的示例检查了代码一百次但显然我遗漏了一些东西当我转到产品单击立即购买登录 P
使用列中的日期范围扩展 pandas 数据框

我有一个 pandas 数据框其日期和字符串与此类似 Start End Note Item 2016 10 22 2016 11 05 Z A 2017 02 11 2017 02 25 W B 我需要将其扩展转换为以下内容在之间填
表单输入框不显示

我正在尝试使用 Django 显示一个简单的表单输入文本框我正在亚马逊 AWS 上部署该网站在不同的服务器 pythonanywhere 上运行良好但在 AWS 上存在主要问题具体来说输入框没有被显示我使用的模板如下首页 ht
为什么 takewhile() 会跳过第一行？

我有一个这样的文件 1 2 3 TAB 1 2 3 TAB 我想将 TAB 之间的行作为块读取 import itertools def block generator file with open file as lines for li
python：如何检查一行是否为空行

试图弄清楚如何编写一个 if 循环来检查一行是否为空该文件有许多字符串其中之一是一个空行用于与其他语句分隔开不是我认为是一个回车符后面跟着另一个回车符 new statement asdasdasd asdasdasdasd ne
回归模型 statsmodel python

这更多是一个统计问题因为代码运行良好但我正在学习 python 中的回归建模我在下面使用 statsmodel 编写了一些代码来创建一个简单的线性回归模型 import statsmodels api as sm import num
Redis 队列工作程序在 utcparse 中崩溃

我正在尝试按照以下教程获得基本的 rq 工作 https blog miguelgrinberg com post the flask mega tutorial part xxii background jobs https blog m
调整pandas read_sql_query NULL值处理？

当我做 from sqlalchemy import create engine import pandas as pd engine create engine sqlite conn engine connect conn execut
PyQt5 - 无法使用 QVideoWidget 播放视频

from PyQt5 QtWidgets import from PyQt5 QtMultimedia import from PyQt5 QtMultimediaWidgets import from PyQt5 QtCore impor
python-messaging 无法处理 HTTP 请求

我正在使用下面的代码尝试使用 python messaging 发送彩信https github com pmarti python messaging blob master doc tutorial mms rst https gith
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
如何检测斑点并将其裁剪成 png 文件？

我一直在开发一个网络应用程序我陷入了一个有问题的问题我会尝试解释我想要做什么在这里您看到第一个大图像其中有绿色形状我想要做的是将这些形状裁剪成不同的 png 文件并使它们的背景透明就像大图像下面的示例裁剪图像一样第一张图像将
在视图之间共享并在 AppConfig 中初始化的变量

我想要一个在应用程序启动时初始化的变量并且可以从视图访问该变量 my app my config py class WebConfig AppConfig name verbose name def ready self print lo
Chrome 已关闭，并出现错误 ERROR:network_change_notifier_win.cc(141)] WSALookupServiceBegin 失败，原因为：0

我的笔记本电脑操作系统是 windows 10 我使用 selenium webdriver 和 Python 当我通过脚本打开chrome浏览器时加载网页后chrome就关闭了下面是我的python代码和错误 from seleniu
将 scipy 稀疏矩阵的几行采样到另一个中

如何对 scipy 稀疏矩阵的某些行进行采样并从这些采样的行中形成一个新的 scipy 稀疏矩阵例如如果我有一个 10 行的 scipy 稀疏矩阵 A 并且我想创建一个新的 scipy 稀疏矩阵 B 其中 A 的第 1 3 4 行该
如何从 Django 中的链接设置预定义的表单值？

我的项目是这样布局的 1 page has many categories 2 category belongs to page has many items 3 item belongs to category 当我进入一个页面时我想修
使用 Python 3.x 基本获取 URL 的 HTML 正文

我是Python新手我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑除此之外我不确定数据在发送到 urlopen 之前何时需要编码我一直在尝试使用
python webdriver_manager chrome 自定义配置文件

如何使 webdriver manager chrome 使用自定义 chrome 用户配置文件我知道对于 selenium webdriver 我可以这样指定 options Options options add argument f

随机推荐

如何在Linux中打开端口[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我已经安装了 Web 应用程序该应用程序在 RHEL centOS 上的端口 8080 上运行我只能通过命令行访问该机器我尝试从我的
角度 ng-messages 仅在 $touched 为 true 时显示

我并没有做任何太特别的事情我有一个输入需要在每次击键时进行验证如果验证失败则显示错误不要等待模糊事件来触发 touched 我以为这是默认情况但显然不是我正在使用有角度的材料和有角度的消息我这样做是为了大写锁定检测标记
如何播放直播FLV流？

我正在从 PC 中的网络摄像头捕获视频并即时将其转换为 FLV 使用 ffmpeg 因此我的 FLV 文件不断增长现在我想以直播的形式播放它我正在尝试 VLC 但它播放文件的时间不超过初始化时从文件读取的持续时间我可以使用什么播放
R data.table %like% 带有逻辑 AND

我正在尝试构建一个闪亮的搜索引擎应用程序我根据搜索关键字返回 data table DT lt data table field c A B C A C D A D A B A D B C F B D K DT field like A
如何将node.js管道传输到redis？

我有很多数据要插入 SET INCR 到redis DB 所以我正在寻找pipeline http redis io topics pipelining 质量插入 http redis io topics mass insert通过node
在不运行控制台命令的情况下清理缓存的最佳方法是什么？

在我的项目的管理面板中我编写了更改要使用的数据库名称的功能我把新的数据库名称写在parameters ini 之后必须清理缓存才能加载新配置在不运行控制台命令的情况下清理缓存的最佳方法是什么或者是否有另一种最佳实践如何更改当前数据库
模糊不起作用 - Angular 2

我试图在角度 2 中设置一个蓝色事件如下所示 div class form group 组件 ts import Component ViewChild ElementRef Output EventEmitter from angula
尝试划分数据时出现除零错误

这是我的代码 SELECT CASHIER ID AS SERVER CONVERT VARCHAR 10 DATETIME 111 AS DATE SUM GRAND TOTAL AS TOTAL SALES SUM NUM PEOPLE
如何通过单击按钮从反应状态挂钩数组中删除对象

我正在尝试制作一个按钮根据传递的索引从数组即状态中删除一个对象我已经尝试了很多但我的方法都不起作用所以这是代码希望我可以找人帮忙 state const items setItems useState name quantit
即使在顶点着色器中使用，glGetUniformLocation()也会返回-1

我正在尝试用法线渲染一个简单的立方体我使用以下代码来初始化着色器 void initShader const char vertexShaderPath const char fragmentShaderPath cout lt lt I
如何使用反射确定属性类型？

如何测试类型的属性以查看它是否是指定类型编辑我的目标是检查程序集以查看该程序集中的任何类型是否包含 MyType 或从 MyType 继承的属性这是我走过的路 AssemblyName n new AssemblyName n Co
我怎样才能找到圆的所有点？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 给定半径和圆心坐标如何找到圆的所有
是否可以保证枚举的 ToString 的值？

我当前使用的数据库有一个 varchar 字段在我的代码中我想将潜在值映射到枚举例如 public enum UserStatus Anonymous Enrolled SuperUser 在该列的数据库级别它有一个限制其值必须是
Python列表切片效率

在下面的代码中 def listSum alist Get sum of numbers in a list recursively sum 0 if len alist 1 return alist 0 else return alist
如何使用 ng-pattern 验证 angularJs 中的电子邮件 ID

我正在尝试使用 ng pattern 指令验证 angularJs 中的电子邮件 id 字段但我是 AngularJs 的新手我需要在用户输入错误的电子邮件 ID 后立即显示错误消息我下面的代码正在尝试解决帮助我使用 ng patt
如何对德语文本进行词形还原？

我有一篇德语文本我想对其应用词形还原如果不可能进行词形还原那么我也可以接受词干提取 Data 这是我的德语文本 mails Hallo Ich spielte am fr hen Morgen und ging dann zu ein
在自引用表中查询父项和子项

我有一个Comments如下表所示在MySQL content created at id parent id second comment 2014 06 03T10 08 44 0000 37 1 third comment 2014
按降序对数字进行排序

我有 20 个文本框每个都包含一个特定的数字我希望 textbox1 到 textboxN 的数字按降序排列如果任何文本框的值为零那么我想保留该文本框不变需要 vb net 中的示例代码用于按降序对元素进行排序 dim arra
Pandas 滚动 std 会产生不一致的结果并且与 value.std 不同

使用 pandas v1 0 1 和 numpy 1 18 1 我想计算时间序列上不同窗口大小的滚动平均值和标准差在我正在处理的数据中某些后续点的值可以是恒定的这样根据窗口大小滚动平均值可能等于窗口中的所有值并且相应的 std
Tensorflow：从 TFRecords 文件中提取图像和标签

我有一个 TFRecords 文件其中包含图像及其标签名称大小等我的目标是将标签和图像提取为 numpy 数组我执行以下操作来加载文件 def extract fn data record features Extract fea

Tensorflow：从 TFRecords 文件中提取图像和标签

Tensorflow：从 TFRecords 文件中提取图像和标签 的相关文章

随机推荐

热门标签

Tensorflow：从 TFRecords 文件中提取图像和标签的相关文章