如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？

2024-02-03

到目前为止，我找到的每个张量流教程都是通过首先将训练/验证/测试图像加载到内存中然后处理它们来实现的。有人有关于将图像和标签流式传输到张量流的指南或建议吗？我有很多图像存储在不同的服务器上，我想将这些图像流式传输到张量流中，而不是将图像直接保存在我的计算机上。

谢谢你！

张量流确实有Queues https://www.tensorflow.org/versions/r0.9/how_tos/threading_and_queues/index.html#threading-and-queues，它支持流式传输，因此您不必将完整数据加载到内存中。但是，是的，默认情况下它们仅支持从同一服务器上的文件读取。您遇到的真正问题是，您想从其他服务器加载内存数据。我可以想到以下方法来做到这一点：

使用 REST 服务公开您的图像。用 python 编写自己的排队机制并读取此数据（使用 Urllib 或其他东西）并将其输入到 Tensorflow占位符 https://www.tensorflow.org/versions/r0.8/tutorials/mnist/pros/index.html#placeholders.
您也可以使用 Tensorflow 队列，而不是使用 python 队列（如上所述）（请参阅此answer https://stackoverflow.com/questions/34594198/how-to-prefetch-data-using-a-custom-python-function-in-tensorflow/34596212#34596212），虽然稍微复杂一些。优点是，与普通的 python 多线程队列相比，tensorflow 队列可以使用多个内核，从而提供更好的性能。
使用网络挂载来欺骗您的操作系统，使其相信数据位于同一台计算机上。

另外，请记住，使用这种分布式设置时，您总是会产生网络开销（图像从服务器 1 传输到服务器 2 所花费的时间），这会大大减慢您的训练速度。为了解决这个问题，您必须构建一个具有获取-执行重叠的多线程排队机制，这是一项艰巨的工作。在我看来，一个更简单的选择是将数据复制到训练机器中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？的相关文章

用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
如果选中复选框则显示 div

我正在尝试构建类似 WordPress 选项的东西用于在创建文章时切换字段可见性我所构建的依赖于 click函数使用相应的字段名称切换父项我想知道如果选中该复选框执行此操作的最佳方法是什么因为如果您选中一个框并重新加载页面因为它
是否可以使用 Dapper 流式传输大型 SQL Server 数据库结果集？

我需要从数据库返回大约 500K 行请不要问为什么然后我需要将这些结果保存为 XML 更紧急并将该文件通过 ftp 传输到某个神奇的地方我还需要转换结果集中的每一行现在这就是我正在做的事情 TOP 100结果使用 Dappe
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
如何检查用户是否按下了某个键？

在java中我有一个程序需要连续检查用户是否按下了某个键所以在伪代码中就像 if isPressing w do somthing 在java中你不检查是否按下了某个键而是检查listen to KeyEvents 实现您的目标的
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
C - 直接从键盘缓冲区读取

这是C语言中的一个问题如何直接读取键盘缓冲区中的数据我想直接访问数据并将其存储在变量中变量应该是什么数据类型我需要它用于我们研究所目前正在开发的操作系统它被称为 ICS OS 我不太清楚具体细节它在 x86 32 位机器上运行
如何从 C++ 中的文件中读取双精度值

如何从 C 中的文件中读取 double 值对于整数我知道您可以使用 getline 然后使用 atoi 但我没有找到双倍函数的数组什么可用于读取双精度数或将 char 数组转换为双精度数您可以使用流提取 std ifstream
Ray：如何在一个 GPU 上运行多个 Actor？

我只有一个 GPU 我想在该 GPU 上运行许多 Actor 这是我使用的方法ray 下列的https ray readthedocs io en latest actors html https ray readthedocs io en

随机推荐

使用 Google App Engine 的分页技术

我想使用 GAE Java 的光标功能为我的网站实现分页然而只有一个向前的光标自 App Engine SDK 1 4 0 起未实现向后光标因此为了实现上一页功能建议我将光标分页存储在 memchache 中但我的问题是当
从下拉列表中获取选定对象时出现问题

我在从列表中获取选定对象时遇到问题我通过以下方式将用户集合绑定到下拉列表 ddlContractors DataSource service GetAllUsers ddlContractors DataTextField Name dd
解包许多返回值时的行长度和格式的 Python 样式

假设该函数some descriptively named function返回 4 tuple4 个返回参数我想打电话some descriptively named function 遵守 80 个字符的行长度限制并将所有 4 个输
当调用 pprint 时，pyspark 中转换后的 DStream 会出现错误

我正在通过 PySpark 探索 Spark Streaming 当我尝试使用时遇到错误transform功能与take 我可以成功使用sortBy反对这DStream via transform and pprint结果 author c
创建 SQLite 数据库时运行时异常[重复]

这个问题在这里已经有答案了谁能告诉我出了什么问题以前它对于一张表书籍工作得很好但现在我正在创建一个包含 3 个表的新数据库但它没有执行这是助手类 public class DatabaseHelper extends SQLi
检查点 keras 模型：TypeError：无法 pickle _thread.lock 对象

似乎该错误过去曾在不同的上下文中发生过here https github com tensorflow tensorflow issues 11157 但我不会直接转储模型我正在使用 ModelCheckpoint 回调知道可能出了什么
如何将 IEnumerable 转换为 C# 中的自定义类型？

我正在使用扩展方法 OrderBy 和 ThenBy 在多个字段上对自定义集合进行排序这种排序不会影响集合而是返回 IEnumberable 我无法将 IEnumerable 结果转换为我的自定义集合是否有办法更改我的集合的顺序或将
如何在IIS上创建隐藏网站

我需要在 IIS 6 0 上隐藏网站我的目标是配置某些用户不显示并且不管理某些网站例如用户1 组管理员用户仅显示和配置网站1用户2 组其他组用户仅显示和配置网站2 如何在IIS上创建隐藏网站如果您所说的隐藏网站是指控制访
詹金斯声纳工作被匿名者中止。奇怪的工作构建行为

我一直面临整合詹金斯和声纳的非常奇怪的问题我有一个 Maven 项目我通过 Maven 命令行构建并运行 SonarQube 分析导入 Sonar 服务器预定义变量当我第一次运行 Jenkins 作业时它may be绿色的下一个
检查计算的输出是否为整数

检查计算的输出是否为整数的方法是什么我尝试这样做 if i 3 is Int print Whole Number 但它似乎是在检查变量的类型而不是输出是什么编辑显然如果变量是整数它会自动舍入操作的输出所以我必须这样做 if
如何修复导入错误：没有名为加密的模块？

我想通过 certbot 自动续订证书但无法正常工作出现错误 ImportError 没有名为 cryptography 的模块 certbot auto dry run 错误无法获取 opt eff org certbot venv
使用mongodb聚合对多个字段进行不同计数

我正在尝试通过一个 MongoDB 聚合查询来计算多个字段的不同值这是我的数据 car type suv color red num doors 4 car type hatchback color blue num doors 4 ca
.Net AJAX 中是否有内置方法可以手动将对象序列化为 JSON 字符串？

我发现了ScriptingJsonSerializationSection http msdn microsoft com en us library system web configuration scriptingjsonserial
Safari 如何知道何时提示用户保存密码？

这与浏览器如何知道何时提示用户保存密码 https stackoverflow com questions 2398763 how does browser know when to prompt user to save password
如何连接到内存中的共享缓存数据库？

我正在通过 ADO NET 提供程序尝试 SQLite 3 7 13 的内存中共享缓存功能以下连接字符串有效但会生成非共享缓存数据库 Data Source memory 当我尝试其中任何一个时 Data Source memory c
Mac 应用商店帮助工具沙箱

我的应用程序由两个可执行文件组成主应用程序可执行文件用于处理一些文件的小型控制台应用程序此可执行文件位于资源文件夹中不需要 root 权限问题是我不知道如何将此应用程序提交到应用程序商店我收到苹果的以下回复签名无效路径 ap
Filestream 只读取文件的前 4 个字符

嘿我正在尝试使用文件流读取 150mb 文件但每次执行此操作时我得到的都是 zl而不是整个流请注意其中有一些特殊字符有人知道可能是什么问题吗这是我的代码 using FileStream fs File OpenRead pa
无法让 blueimp/jQuery.fileupload 插件工作

我正在尝试使用这个 jQuery 插件进行跨域图像上传jQuery fileupload https github com blueimp jQuery File Upload wiki Basic plugin 我认为该插件使用了 req
VisualStateManager.GoToState 在 OnNavieratedTo 方法中返回 false

它不工作在OnNavigatedTo但它在之后起作用OnNavigatedTo完成 protected override void OnNavigatedTo Windows UI Xaml Navigation NavigationEve
如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？

到目前为止我找到的每个张量流教程都是通过首先将训练验证测试图像加载到内存中然后处理它们来实现的有人有关于将图像和标签流式传输到张量流的指南或建议吗我有很多图像存储在不同的服务器上我想将这些图像流式传输到张量流中而不是将图像直接

如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？

如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？ 的相关文章

随机推荐

热门标签

如何将数据直接流式传输到张量流中，而不是读取光盘上的文件？的相关文章