当图像大小不同时，如何格式化图像数据以进行训练/预测？

2024-03-25

我正在尝试训练对图像进行分类的模型。我遇到的问题是，它们的尺寸不同。我应该如何格式化我的图像/或模型架构？

你没有说你在说什么架构。既然你说你想对图像进行分类，我假设它是一个部分卷积、部分完全连接的网络，如 AlexNet、GoogLeNet 等。一般来说，你的问题的答案取决于你正在使用的网络类型。

例如，如果您的网络仅包含卷积单元 - 也就是说，不包含完全连接的层 - 它can对输入图像的大小不变。这样的网络could处理输入图像并依次返回另一个图像（“一路卷积”）；您必须确保输出符合您的预期，因为当然，您必须以某种方式确定损失。

如果您使用的是完全连接的单元，那么您就会遇到麻烦：在这里，您的网络必须使用固定数量的学习权重，因此不同的输入将需要不同数量的权重 - 这是不可能的。

如果这是您的问题，您可以执行以下操作：

不要在意挤压图像。无论如何，网络可能会学会理解内容；无论如何，规模和视角对内容有什么意义吗？
将图像居中裁剪为特定尺寸。如果您担心丢失数据，请进行多次裁剪并使用它们来增强您的输入数据，以便原始图像将被分割成N正确尺寸的不同图像。
用纯色将图像填充到平方大小，然后调整大小。
将其结合起来。

填充选项可能会给网络的预测带来额外的误差源，因为网络可能（阅读：可能会）偏向于包含此类填充边框的图像。如果您需要一些想法，请查看Images https://www.tensorflow.org/api_docs/python/tf/imageTensorFlow 文档的部分，有类似的部分resize_image_with_crop_or_pad这带走了更大的工作。

至于不关心挤压，here's https://github.com/tensorflow/models/blob/f98c5ded31d7da0c2d127c28b2c16f0307a368f0/slim/preprocessing/inception_preprocessing.py#L206-L216著名的 Inception 网络的一段预处理流程：

# This resizing operation may distort the images because the aspect
# ratio is not respected. We select a resize method in a round robin
# fashion based on the thread number.
# Note that ResizeMethod contains 4 enumerated resizing methods.

# We select only 1 case for fast_mode bilinear.
num_resize_cases = 1 if fast_mode else 4
distorted_image = apply_with_random_selector(
    distorted_image,
    lambda x, method: tf.image.resize_images(x, [height, width], method=method),
    num_cases=num_resize_cases)

他们完全意识到这一点并且无论如何都会这样做。

根据您想要或需要走多远，实际上有一篇论文here https://arxiv.org/abs/1406.4729 called 用于视觉识别的深度卷积网络中的空间金字塔池它通过以非常特殊的方式处理任意大小的输入。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

deeplearning

当图像大小不同时，如何格式化图像数据以进行训练/预测？的相关文章

如何设计深度卷积神经网络？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案据我了解所有 CNN 都非常相似它们都有一个卷积层后面是池化层和 relu 层有些具有专门的层例如 FlowNet 和 Segn
使用 MXnet 时如何保存模型

我正在使用 MXnet 训练 CNN 在 R 中并且可以使用以下代码训练模型不会出现任何错误 model lt mx model FeedForward create symbol network X train iter ctx mx
如何在 Tensorflow 2.0 中使用 K.get_session 或如何迁移它？

def init self kwargs self dict update self defaults set up default values self dict update kwargs and update with user o
使用贝叶斯优化的深度学习结构的超参数优化

我为原始信号分类任务构建了 CLDNN 卷积 LSTM 深度神经网络结构每个训练周期运行约 90 秒超参数似乎很难优化我一直在研究优化超参数的各种方法例如随机或网格搜索并发现了贝叶斯优化虽然我还没有完全理解优化算法但我认为它
如何在 CAFFE 的新网络中重复使用同一网络两次

我有一个预训练的网络我们称之为N 我想在新网络中使用两次有人知道如何复制吗然后我想为每个副本分配不同的学习率例如 N1是第一个副本N N2是第二个副本N 新网络可能如下所示 N1 gt joint ip N2 gt layer 我知
AttributeError：使用 CRF 时“Tensor”对象没有属性“_keras_history”

我知道关于这个问题有很多问题我已经阅读了其中的一些问题但没有一个对我有用 I am trying to build a model with the following architecture 代码如下 token inputs In
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
ValueError：Layerequential_20 需要 1 个输入，但它收到了 2 个输入张量

我正在尝试使用 Tensorflow 中的 KMNIST 数据集和我正在使用的教科书中的一些示例代码构建一个简单的自动编码器但当我尝试拟合模型时我不断收到错误错误说ValueError Layer sequential 20 expe
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
Caffe：如果内存中只能容纳一小部分，我该怎么办？

我正在尝试训练一个非常大的模型因此我只能将非常小的批量大小放入 GPU 内存中处理小批量的结果非常噪声梯度估计 https stackoverflow com a 33717093 1714410 我该怎么做才能避免这个问题您可以更
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
使用 keras 和多个序列进行时间序列预测

我明白了有状态 LSTM 预测示例 https github com fchollet keras blob master examples stateful lstm py在 Keras 中的单个序列上该示例有一个包含 50k 个观察值
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
我可以使用自动编码器进行聚类吗？

在下面的代码中他们使用自动编码器作为监督聚类或分类因为它们具有数据标签 http amunategui github io anomaly detection h2o http amunategui github io anomaly
结合两个 CNN

我想在 Keras 中将两个 CNN 合并为一个我的意思是我希望神经网络拍摄两张图像并在单独的 CNN 中处理每一张图像然后将它们连接在一起进入扁平化层并使用全连接层来做最后的工作我做了什么 Start With First Bran
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S

随机推荐

有没有更聪明的方法从位数组中提取？

我有可以被视为位数组的内存区域它们相当于 unsigned char arr 256 但最好将其视为 bit arr 2048 我正在访问其中的单独位 define GETBIT x in in x 8 1 lt lt 7 x 8 但
在qml中的qtcharts上拖动一个点

我正在尝试在 qtcharts 上拖动 LineSeries 上的一个点这是我的代码 import QtQuick 2 0 import QtCharts 2 0 Item anchors fill parent ChartView ti
我们可以将嵌套映射作为其他映射中的键吗？

我刚刚开始用 Java 实现数据结构想知道我们是否可以遇到这样的情况 Map
NET TCP/HTTP WCF 托管在 IIS 中

我是 WCF 和 IIS 的新手但一直在阅读有关如何在 IIS 中托管 WCF 应用程序的文章我们有一个系统正在尝试部署到 IIS 该系统需要 HTTP 和 NET TCP 端点我已经按照随机教程中看到的方式配置了所有内容但仍然无法
chrome 资源 css 查看器中这个奇怪的字符是什么？

这个小混蛋让我很头疼它不会出现在 css 文件的末尾而是保留在括号之后之后的任何事情都会停止运行我想知道为什么很多代码没有运行我决定移动代码它从何而来为什么在我复制它是如何到达那里之前我不想删除它谢谢这就是当您使用一个
T4MVC 如何排除单个文件

有没有办法从 T4MVC 中排除某些控制器或单个文件 None
在matlab中绘制颜色编码图

我需要使用 dat 文件绘制颜色编码的二维图文件中的数据排列为 48 000000 0 000184 0 400000 48 500000 0 000185 0 400000 49 000000 0 000186 0 400000 49
Python中获取网络地址和网络掩码

在我的 Python 脚本中我需要检索运行脚本的计算机的 IP 地址及其网络地址和网络字节至于IP地址我在存档中找到了解决方案 import socket s socket socket socket AF INET socket S
如何在 yii2 basic 中使用日期选择器？

我想使用 yii2 datepicker 但我在实现它时遇到了麻烦它不显示日期选择器我不知道我的代码中缺少什么我对这个yii还是个新手 div class row div class col lg 6 div class myproj
Firestore：使用 Flutter 添加或删除现有数组中的元素[重复]

这个问题在这里已经有答案了是否可以向存储在 Firestore 文档中的现有数组添加或删除元素而不是获取数组在本地添加元素并将其发送回存储希望是的您可以结合使用 update 方法来附加或删除元素FieldValue arrayU
在 Django 中的多个应用程序中使用相同的静态文件

我的Django项目分为几个应用程序静态文件存储在每个应用程序中如下所示 Project foo static css style css views py models py urls py bar static css style
std::map 中 std::string 的 Valgrind 内存泄漏

这是 Valgrind 的输出 6519 at 0x4C25885 operator new unsigned long vg replace malloc c 319 6519 by 0x4EE65D8 std string Rep S
删除 ASP.NET MVC 4 到应用程序根目录的路径中的尾部斜杠

在我的 ASP NET MVC 4 应用程序中RouteConfig文件中我注册了以下默认路由 routes MapRoute Default controller action id new controller home action
设置 jQuery.data() 是否会触发事件？

我想知道是否致电 domElement data key newValue 会触发一个我可以处理的事件吗我尝试过绑定change但设置数据时不会触发此操作我认为这个问题可能会问类似的问题但具有约束力changeData也没用 jQue
在 AndroidJunit 测试项目中运行 UiAutomatorTestcase

我实际上正在尝试在 Android Junit Test 项目中实现一个简单的测试套件该项目使用以下类 UiObject 用户界面选择器 UiAutomator测试用例单击并打开 Android 设备上的 Messaging 应用程序
java中多线程环境下的静态方法行为

class Clstest public static String testStaticMethod String inFileStr section 0 section 1 do something with inFileStr sec
允许向 ChoiceType 字段添加新值

I use Form Component并有一个选择类型字段 http symfony com doc current reference forms types choice html在呈现到选择字段的表单上在客户端我使用选择2插件 h
亚马逊 S3 URL 编码

如果我有一个文件名 a d1 tttt sq jpg 当它上传到 Amazon S3 时它会转换为这样 a d1 22 tttt 22 sq jpg 因此双引号被 URL 编码并且文件名本身被更改必须使用编码的 URL 来获取文件 a
如何杀死一个pid不断变化的进程？

我知道我可以使用这个技巧if fork exit 0 改变当前进程的pid 因此下面的程序的 pid 变化很快如何杀死这样的进程有没有比执行大量更好的方法killall procname直到一个人能够奔跑kill 在分叉之前我知道这
当图像大小不同时，如何格式化图像数据以进行训练/预测？

我正在尝试训练对图像进行分类的模型我遇到的问题是它们的尺寸不同我应该如何格式化我的图像或模型架构你没有说你在说什么架构既然你说你想对图像进行分类我假设它是一个部分卷积部分完全连接的网络如 AlexNet GoogLeNet

当图像大小不同时，如何格式化图像数据以进行训练/预测？

当图像大小不同时，如何格式化图像数据以进行训练/预测？ 的相关文章

随机推荐

热门标签

当图像大小不同时，如何格式化图像数据以进行训练/预测？的相关文章