TF 数据 API：如何有效地从图像中采样小块

2024-04-23

考虑创建从高分辨率图像目录中采样随机小图像块的数据集的问题。 Tensorflow 数据集 API 提供了一种非常简单的方法来实现此目的，即构建图像名称的数据集，对它们进行排序，将其映射到加载的图像，然后映射到随机裁剪的补丁。

然而，这种幼稚的实现效率非常低，因为将加载并裁剪单独的高分辨率图像以生成每个补丁。理想情况下，图像可以加载一次并重复使用以生成许多补丁。

前面讨论的一种简单方法是从图像生成多个补丁并将它们展平。然而，这会带来数据偏差太大的不幸影响。我们希望每个训练批次都来自不同的图像。

理想情况下，我想要的是一个“随机缓存过滤器”转换，它采用底层数据集并将其 N 个元素缓存到内存中。它的迭代器将从缓存中返回一个随机元素。此外，它还会以预定义的频率将缓存中的随机元素替换为基础数据集中的新元素。该过滤器将允许更快的数据访问，但代价是更少的随机化和更高的内存消耗。

有这样的功能可用吗？

如果不是，是否应该将其实现为新的数据集转换或只是一个新的迭代器？看来一个新的迭代器就足够了。关于如何创建新的数据集迭代器（最好是用 C++）的任何指示？

你应该能够使用tf.data.Dataset.shuffle https://www.tensorflow.org/api_docs/python/tf/data/Dataset#shuffle实现你想要的。以下是目标的快速摘要：

加载非常大的图像，从图像中生成较小的随机裁剪并将它们批处理在一起
加载图像后，通过从大图像创建多个补丁来提高管道效率
添加足够的随机播放，使得一批补丁是多样化的（所有补丁都来自不同的图像）
不要在缓存中加载太多大图像

您可以使用以下方法实现所有这些tf.dataAPI 通过执行以下步骤：

打乱大图像的文件名
阅读大图
从此图像生成多个补丁
再次用足够大的缓冲区大小重新打乱所有这些补丁（请参阅这个答案 https://stackoverflow.com/a/48096625/5098368缓冲区大小）。调整缓冲区大小是良好洗牌和缓存补丁大小之间的权衡
批处理它们
预取一批

这是相关代码：

filenames = ...  # filenames containing the big images
num_samples = len(filenames)

# Parameters
num_patches = 100               # number of patches to extract from each image
patch_size = 32                 # size of the patches
buffer_size = 50 * num_patches  # shuffle patches from 50 different big images
num_parallel_calls = 4          # number of threads
batch_size = 10                 # size of the batch

get_patches_fn = lambda image: get_patches(image, num_patches=num_patches, patch_size=patch_size)

# Create a Dataset serving batches of random patches in our images
dataset = (tf.data.Dataset.from_tensor_slices(filenames)
    .shuffle(buffer_size=num_samples)  # step 1: all the  filenames into the buffer ensures good shuffling
    .map(parse_fn, num_parallel_calls=num_parallel_calls)  # step 2
    .map(get_patches_fn, num_parallel_calls=num_parallel_calls)  # step 3
    .apply(tf.contrib.data.unbatch())  # unbatch the patches we just produced
    .shuffle(buffer_size=buffer_size)  # step 4
    .batch(batch_size)  # step 5
    .prefetch(1)  # step 6: make sure you always have one batch ready to serve
)

iterator = dataset.make_one_shot_iterator()
patches = iterator.get_next()  # shape [None, patch_size, patch_size, 3]


sess = tf.Session()
res = sess.run(patches)

功能parse_fn and get_patches定义如下：

def parse_fn(filename):
    """Decode the jpeg image from the filename and convert to [0, 1]."""
    image_string = tf.read_file(filename)

    # Don't use tf.image.decode_image, or the output shape will be undefined
    image_decoded = tf.image.decode_jpeg(image_string, channels=3)

    # This will convert to float values in [0, 1]
    image = tf.image.convert_image_dtype(image_decoded, tf.float32)

    return image


def get_patches(image, num_patches=100, patch_size=16):
    """Get `num_patches` random crops from the image"""
    patches = []
    for i in range(num_patches):
        patch = tf.image.random_crop(image, [patch_size, patch_size, 3])
        patches.append(patch)

    patches = tf.stack(patches)
    assert patches.get_shape().dims == [num_patches, patch_size, patch_size, 3]

    return patches

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowdatasets

TF 数据 API：如何有效地从图像中采样小块的相关文章

没有名为“_pywrap_tensorflow_internal”的模块

在尝试验证tensorflow gpu的安装时在尝试执行 import tensorflow as tf 时出现ImportError 我在 Windows 7 上使用 Quadro K620 Tensorflow 是使用 pip 安装的
将预训练模型从 tfhub 转换为 tflite

我正在尝试转换openimages v4 ssd mobilenet v2 https tfhub dev google openimages v4 ssd mobilenet v2 1到 tflite 使用 pip3 install te
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
重命名 TensorFlow 中保存模型的变量范围

是否可以在张量流中重命名给定模型的变量范围例如我根据教程创建了 MNIST 数字的逻辑回归模型 with tf variable scope my first scope NUM IMAGE PIXELS 784 NUM CLASS B
Keras 模型中的 Softmax 采样

我考虑过的一些方法继承自 Model 类在tensorflow keras中采样softmax https stackoverflow com questions 52732145 sampled softmax in tensorflo
如何在 Tensorflow 中计算 Spearman 相关性

Problem 我需要计算 Pearson 和 Spearman 相关性并将其用作张量流中的指标对于皮尔逊来说这是微不足道的 tf contrib metrics streaming pearson correlation y pre
TensorFlow：训练时参数不更新

我正在使用 TensorFlow 实现分类模型我面临的问题是当我运行训练步骤时我的权重和误差没有更新结果我的网络不断返回相同的结果我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
使用 CustomCallback() 类在训练时实现冻结层

我正在尝试在 TensorFlow 中训练自定义 CNN 模型我想以某种方式在训练仍在运行时冻结特定时期模型的某些层我已经实现了冻结层但我必须在某些时期训练模型然后在我想要冻结的特定层中将可训练属性更改为 False 然后编译模型
加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
使用 keras.utils.Sequence 多处理和数据库 - 何时连接？

我正在使用 Keras 和 Tensorflow 后端训练神经网络数据集不适合 RAM 因此我将其存储在 Mongo 数据库中并使用子类检索批次keras utils Sequence 一切正常如果我跑的话model fit gene
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
随机梯度下降可以与 TensorFlow 一起使用吗？

我设计了一个全连接 MLP 具有 2 个隐藏层和 1 个输出层如果我使用批量或小批量梯度下降我会得到一个很好的学习曲线 But a straight line while performing Stochastic Gradient D
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳

随机推荐

如何获取通知下拉背景颜色，并在启用夜间模式时确定最佳文本颜色？

最近我的用户向我发送了以下屏幕截图当时启用了 Android 9 0 Pie 与 Android 操作系统夜间模式正如您所看到的股票名称不可见因为股票名称采用了黑色在正常的白色主题中它应该如下所示这是我用来突出显示文本颜色的
架构问题：GWT 还是 Vaadin 创建桌面应用程序？

我们计划创建一个提要阅读器 as a Windows 桌面和 iPad 应用程序正如我们希望能够显示网站 AND 运行我们自己的 JavaScript在此应用程序中我们考虑将应用程序作为 HTML CSS JavaScript 交付
我应该将 FLV 文件放在哪里才能在本地 Red5 服务器上进行流式传输？

我安装了最新的 Red5 服务器但我不确定将 flv 文件放在哪里来进行流式传输没有像我在网上找到的一些教程那样的 streams 或 ofla 目录我应该将 flv 文件放在哪里来进行流式传输 Red5 附带了一些演示但默认情况下
对 FINTEK F81866A 芯片组上的 GPIO 引脚进行编程

我有一个德承DE 1000 http www cincoze com goods info php id 10工业 PC 具有芬泰克 F81866A http www fintek com tw index php i o controll
避免 Mac 应用程序在未处理的异常后崩溃

我想防止我的应用程序在引发未处理的异常后关闭我正在使用 Xamarin 和 MonoMac 执行此操作但我认为我可以将 Objective C 答案转换为 C 当异常发生并且没有在任何地方捕获时我注册未处理异常的事件 AppDomai
从任务栏最大化 java 进程

如果我的任务栏中有一个最小化的进程有什么方法可以从java中最大化它吗我知道该过程的名称但这可能吗您最好的选择可能是使用 Windows API 我用过Java 本机访问 https github com java native a
来自 Chrome 扩展后台脚本的 AngularJS

鉴于 Angular 与视图绑定并在主扩展视图中引导我认为简单的答案是不不可能但想确认一下因为我在任何地方都找不到明确的答案我的用例是扩展程序将从 API 轮询更新内容并在找到时更新扩展程序的徽章我希望能够从扩展的 Ang
是否可以通过 QNetworkAccessManager 检测可恢复链接

假设我想暂停下载然后重新开始我们能否事先知道链接是否可恢复我的意思是这些信息可以通过标题获得如果您想知道在开始下载之前您可以发送 HEAD 请求并检查标头中是否存在 Accept Ranges bytes 字段 QNetworkA
在pyspark lambda映射函数中使用keras模型

我想使用该模型来预测 PySpark 中的映射 lambda 函数的分数 def inference user embed item embed feats user embed item embed dnn model load mode
.NET 4 上的 EF4.3.1 - CLR 类型到 EDM 类型的映射不明确，因为多个 CLR 类型与 EDM 类型匹配

Update 主题已更新现在可以在 NET 4 下的 EF 4 3 1 上重现并在 Windows 8 下安装 VS2012 您知道为什么现在会开始发生这种情况吗题主说的确实都是我们刚刚从 EF 4 3 代码优先升级到在 NET 4
Nexus 5 (Kitkat 4.4) 不会授权我的 Windows 8 计算机

我正在尝试使用 Eclipse 和我的 Nexus 5 进行一些 Android 应用程序开发但是第一次从 Eclipse 加载 MyFirstApp 后我似乎无法获得正确的授权当我从命令提示符运行 adb devices 时我最
SpaCy 的相似度是如何计算的？

初学者 NLP 问题在这里 similarity 方法如何运作哇 spaCy 太棒了它的tfidf模型可以更容易预处理但w2v只有一行代码 token vector 惊人的 In his spaCy 上的 10 行教程 https g
错误：在“int”之前应有“=”、“,”、“;”、“asm”或“__attribute__”

在 LINUX 中编译 C 程序时我得到了以下信息错误 stream h 1123 error expected asm or attribute before int stream h 1124 error expected asm
在远程服务器上运行 beanstalkd Worker

我的堆栈设置包括以下内容 Machine1 主服务器运行 laravel Machine2 Laravel 代码库的 MySql 服务器 Machine3 Beanstalkd工人我已经设置了 SupervisordMachine1并添
通过依赖类型使用非类型模板参数的单类型模板参数类模板的部分特化

All standard references below refers to N4659 March 2017 post Kona working draft C 17 DIS https timsong cpp github io cp
CouchDb 单个文档的大小限制是多少

我对文档存储复杂的数据结构有疑问该数据结构可能会有所不同文档需要完整存储和检索需要提供文档搜索字段我开始在 MongoBb 中存储文档但那里的文档大小限制为 16 MB 这对我来说不够 CouchDb 允许的单个文档的最大大小是多
重复凹凸贴图

我正在尝试使用 Three js r55 将凹凸贴图应用到平面上以创建一个模糊的感觉表面这是我的代码 var mapHeight THREE ImageUtils loadTexture images felt png mapHeigh
使用 cfdiv 绑定时禁用间质性图形

有没有办法阻止 cfdiv 刷新时出现正在加载图形我想防止加载图形然后加载新 html 时出现闪烁通过在标题底部添加这些行它会覆盖正在加载 html 并且似乎可以防止 IE 和 FireFox 中的闪烁效果虽然这似乎可以解决问
更高效的数据库访问

我是数据库和 linq 的新手所以我的问题可能被认为是微不足道的我目前在每个类中启动所有数据库请求 DataClassesDataContext db new DataClassesDataContext 然后我继续在该方法中发出我需
TF 数据 API：如何有效地从图像中采样小块

考虑创建从高分辨率图像目录中采样随机小图像块的数据集的问题 Tensorflow 数据集 API 提供了一种非常简单的方法来实现此目的即构建图像名称的数据集对它们进行排序将其映射到加载的图像然后映射到随机裁剪的补丁然而这种幼稚的

TF 数据 API：如何有效地从图像中采样小块

TF 数据 API：如何有效地从图像中采样小块 的相关文章

随机推荐

热门标签

TF 数据 API：如何有效地从图像中采样小块的相关文章