深度学习小白之路-tensorflow中如何读取自己的数据集

2023-05-16

前言

自己在学习深度学习的时候，书上给的练习的小项目是mnist数字手写体识别，CIFAR-10分类等，这些数据集都是有封装好的数据读取函数，可以从tensorflow直接调用，但是当我们第一次想要用自己的数据去跑代码的时候发现有些无从下手，所以我下面简单写一下二维数据集的读取，怎么样去嵌入到你下载的基于tensorflow的代码中去。

1. tensorflow的数据格式

tensorflow中的数据格式为tensor，关于tensor可自行百度；
其中数据流的格式为
[batch_size, depth, Height, Weight, channel]或者
[batch_size, Height, Weight, channel]，
输入数据的格式由占位符确定 tf.placeholder (tf.float32,[…])

调试代码的时候强烈建议使用jupyter notebook

2. 使用opencv读取自己的数据集

一般地，我们利用opencv读取自己的数据比较方便

cv2.imread()输出是[Depth, Height, Weight]或者[Height, Weight]
数据格式为numpy，为了和tensor的数据格式对应，在读取函数里
我们将其在axis=-1上扩展维度（channel），而Batch_size这个轴可以先定义一个数组，然后把每次读取的图像写到里面，具体见下面的代码。

import cv2,os
import numpy as np

def img_reader(file_path, batch_size, out_shape):
	#先定义一个临时的缓冲数组
	temp_buffer = np.zeros([batch_size, out_shape[0], out_shape[1], 1])
	file_name = os.listdir(file_path)
	np.random.shuffle(file_name)
	for i in range(batch_size):
		img = cv2.imread(file_path + file_name[i])
		img = cv2.resize(img, out_shape)
		img = np.expand_dims(img,axis=-1)
		temp_buffer[i] = img
		return temp_buffer / 255 #归一化，根据自己情况写

这是函数的输出就是[batch_size, Height, Weight, channel]
这个channel的作用是在网络训练中会有很多不同的通道，再根据你有多少个卷积核，可以计算变量的个数，具体可以看：
卷积神经网络的几个小细节

这样，就可以在网络中feed_dir中送数据了

sess.run(train_op, feed_dir:{x: img_reader(...)})

图像剪切

这里再说一个特殊的情况，如果你的数据是[596, 496]的，但是你想切掉一些没有用的，把它变成[496, 496]，那么你可以使用WIN10的图片编辑，找到你要保留的像素区间，剪切；

img = cv2.imread(file_path + file_name[i])
img = img[0:496, :]
cv2.imwrite(save_path + file_name[i])
#如果高度的上下切除50个像素
img = cv2.imread(file_path + file_name[i])
img = img[50:447, :]

批量处理的话就是

file_name = os.listdir(file_path)
for i in range(len(file_name)):
	img = cv2.imread(file_path + file_name[i])
	img = img[0:496, :]
	cv2.imwrite(save_path + file_name[i])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

深度学习小白之路

中如何读取自己的数据集

深度学习小白之路-tensorflow中如何读取自己的数据集的相关文章

如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
使用大数据集在 Google Colab TPU 上训练 seq2seq 模型 - Keras

我正在尝试使用 Google Colab TPU 上的 Keras 训练用于机器翻译的序列到序列模型我有一个可以加载到内存中的数据集但我必须对其进行预处理才能将其提供给模型特别是我需要将目标单词转换为一个热向量并且在许多示例中我
为 TFliteconverter 创建代表性数据集的正确方法是什么？

我正在尝试推断tinyYOLO V2 with INT8权重和激活我可以使用 TFliteConverter 将权重转换为 INT8 为了INT8激活我必须提供代表性数据集来估计缩放因子我创建此类数据集的方法似乎是错误的正确的程序是
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tensorflow-GPU安装导入错误：DLL加载失败：找不到指定的模块

好吧我知道这可能已经回答了问题但我已经尝试了 stackoverflow 上建议的几乎所有技巧来安装 tensorflow gpu 并在官方文档上建议但没有运气我遇到了同样的错误首先我尝试过this https towardsda
Tensorflow 对 Python3.11 的支持

我在 Windows10 PC 上安装了 Python3 11 0 尝试使用以下命令安装张量流 pip install tensorflow 给出错误访问tensorflow网站后我意识到它仅支持3 7 3 10 我应该降级 pytho

随机推荐

判断两条线段是否相交（三种算法）

转载于 xff1a http blog csdn net rickliuxiao article details 6259322 算法1 xff1a cpp view plain copy alg 1 struct Point double
朱、刘算法：求最小树形图权值个人理解+个人详解【最小树形图模板】

什么是最小树形图 xff1f 相信大家如果会过来看这篇文章 xff0c 想必也应该对最小生成树有所了解的 xff0c 最小生成树求的是无向图的一颗生成树的最小权值我们的最小树形图就是来解决一个有向图的一颗生成树的最小权值 xff0c 对于
Floyd最小环算法

问题描述 xff1a 给你一张无向图 xff0c 定义环为从i出发到达j然后从j返回i并且所有点都只经过一次 xff08 最少为3个点 xff09 xff0c 求所有环当中经过路径最小的环算法描述 xff1a 首先容易想到的是暴力来枚举环
O(1)快速乘

求两个数相乘超过long long取摸的快速运算O 1 inline long long multi long long x long long y long long mod long long tmp 61 x y long long
Android开发简单的2048游戏

作为一名android渣渣第一次用android写了个简单的小游戏还是模仿网上的视频写的 xff0c xff0c 哎 xff0c xff0c 视频教程链接写在前面 xff1a 这里我用的IDE是eclipse xff0c 所以对与 And
如何使用github上的开源项目

以提交的一次开源代码为例 xff0c 教会你步入开源的世界 1 首先登陆到https github com平台上注册一个自己的账号 xff0c 这个过程就不演示了 2 xff0c 然后在左上部分输入一个开源项目的名字选择的是jvalida
填坑记1-nrf52840出现error flash download failed -cortex-M4错误的解决办法-清风电子开发板

填坑类型 xff1a nrf52840出现error flash download failed cortex M4错误使用板子 xff1a 清风电子开发板问题描述 keil4出错 xff0c keil5不出错意思是其他keil5工程
BLE-2の蓝牙4.0协议栈のLL层 Scaning 和 initiating状态的区别

PDU类型 3 4 Scanning状态 3 4 1 scanWindow和scanInterval Scanning状态扫描接收广播数据的状态 xff0c 该状态的扫描行为是由scanWindow和scanInterval两个参数决定的
蓝牙八卦：蓝牙、Wi-Fi、ZigBee几种无线技术的对比

蓝牙 Wi Fi ZigBee几种无线技术的对比 1 概述2 ZigBee引领物联网设备大步向前3 WiFi后浪拍前浪4 蓝牙全新升级 xff0c 深入日常应用这阶段在学习BLE xff08 低功耗蓝牙 xff09 xff0c 于是乎就想
BT-2の蓝牙技术原理のBT协议の蓝牙核心协议の无线射频和基带

蓝牙技术原理 BT协议蓝牙核心协议无线射频和基带 0 脑图1 蓝牙射频1 1 射频信道1 2 射频规范 2 链路控制器和基带2 1 物理链路2 2 分组2 3 蓝牙编址2 4 数据加噪2 5 蓝牙时钟2 6 逻辑信道2 7 信道控制2
Keil5修改背景黑色仿VS

直接修改配置文件global prop 可以在UV4下的安装目录直接搜索找到 xff1a 先备份一下原文件 xff0c 然后直接替为我配置好的文件文件链接注本博客方法转载与百度贴吧某高人 xff0c 在此谢谢 xff1a 此处链接
git常用命令整理

git remote v 查看当前分支所属的远程仓库地址 git pull 拉取最新的版本如果提示需要合并 xff0c 按esc 再输入 wq git status查看状态是否有冲突 xff0c 就执行合并 git checkout ma
BT-10の蓝牙技术原理のBT协议-应用框架の蓝牙音视频应用框架-AVRCP

BT协议应用框架蓝牙音视频应用框架蓝牙音视频遥控应用框架 AVRCP一 xff0c 设备角色二 xff0c 应用模型三 xff0c AVRCP遥控操作四 xff0c AV C 指令与响应五 xff0c AVRCP所支持的设备指令六 x
[Linux驱动之路] 驱动设计的思想_面向对象_分层_分离—程序扩展

韦东山老师的Linux驱动设计基础课程的p128 5 101 驱动设计的思想面向对象分层分离这课在开发板上实作练习 xff0c 可控制imx6ull pro板子的LED开关基于韦老师代码的基础上 xff0c 更改如下代码 xff1a
Android硬件服务访问(2)：HAL中添加接口支持访问硬件

Android硬件服务访问2 HAL中添加接口支持访问硬件一编写HAL C 二编译进Android system镜像中 Bug解决完整代码 led hal h led hal c 如何在硬件抽象层中增加硬件模块来和内核驱动程序交互
Android硬件服务访问(3)：编写JNI方法提供Java访问硬件服务接口

Android硬件服务访问3 编写JNI方法提供Java访问硬件服务接口一编写JNI Cpp文件二修改Onload cpp 三编译推荐博客在这一篇文章中我们将介绍如何为Android硬件抽象层接口编写JNI方法以便使得上层
Android硬件服务访问(4)：在Application Frameworks层增加硬件访问服务

Android硬件服务访问4 在Application Frameworks层增加硬件访问服务一添加ILEDService接口推荐文章在Android系统中硬件服务一般是运行在一个独立的进程中为各种应用程序提供服务因此调用这些
Android硬件服务访问(5)：编写Java应用程序

Android硬件服务访问5 编写Java应用程序一 MainActivity java 完整代码推荐博客一 MainActivity java 看下MainActivity java中对LED硬件访问以下不是完整代码 span c
图像空域图和频谱图的对应关系

图像空域图和频谱图的对应关系傅立叶变换的原理方向性体现频率的体现频谱图中的像素点的亮度空域图和频域图的对应综合 xff08 指纹图像 xff09 Matlab代码傅立叶变换的原理关于傅立叶变换这里推荐一篇比较有名的博客 xff1a h
深度学习小白之路-tensorflow中如何读取自己的数据集

前言自己在学习深度学习的时候 xff0c 书上给的练习的小项目是mnist数字手写体识别 xff0c CIFAR 10分类等 xff0c 这些数据集都是有封装好的数据读取函数 xff0c 可以从tensorflow直接调用 xff0c 但

热门标签