CNN - 图像调整大小 VS 填充（是否保持纵横比？）

2024-01-20

虽然人们在训练 CNN 时通常倾向于简单地将任何图像调整为正方形（例如，resnet 采用 224x224 正方形图像），但这对我来说看起来很难看，尤其是当长宽比不在 1 左右时。

（事实上，这可能会改变基本事实，例如，专家可能给扭曲图像的标签可能与原始图像不同）。

所以现在我将图像大小调整为 224x160 ，保持原始比例，然后用 0 填充图像（通过将其粘贴到全黑 224x224 图像中的随机位置）。

我的方法对我来说似乎并不新颖，但我找不到任何有关我的方法与“通常”方法的信息。时髦！

那么，哪种方法更好呢？为什么？（如果答案取决于数据，请分享您对其中一种方法何时优于另一种方法的想法。）

根据杰里米·霍华德 http://www.fast.ai，填充一大块图像（64x160 像素）将产生以下效果：CNN 必须知道图像的黑色部分不相关，并且无助于区分类别（在分类设置中），如黑色部分中的像素与属于给定类别的像素之间没有相关性。由于您没有对其进行硬编码，因此 CNN 将必须通过梯度下降来学习它，这可能需要一些时间。因此，如果您有大量图像和计算能力，则可以执行此操作，但如果您对其中任何一个图像的预算有限，则调整大小应该效果更好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CNN - 图像调整大小 VS 填充（是否保持纵横比？）的相关文章

将索引数组转换为 NumPy 中的 one-hot 编码数组

给定一个一维索引数组 a array 1 0 3 我想将其一次性编码为二维数组 b array 0 1 0 0 1 0 0 0 0 0 0 1 创建归零数组b有足够的列即a max 1 然后对于每一行i 设置a i 第列至1 gt
Tkinter：无法识别图像文件中的数据[重复]

这个问题在这里已经有答案了我有以下问题我使用外部应用程序生成 GIF 文件对我来说 GIF 看起来不错我可以毫无问题地打开它们然而使用 photo PhotoImage file screenshot file self pre
JS - 如何将图像对象变成灰度并显示它

基本上当单击按钮时它会告诉移动设备转到相机一旦相机拍照它就会给我图像数据它被称为数据 URL 吗这是我处理它的代码 var imagesrc data image jpeg base64 imageData var myimag
批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
在 Swift 中将 gif 保存到 iOS 照片库

我正在尝试保存位于已使用 Regift 代码创建的临时文件中的 GIF 图像 Regift https github com matthewpalmer Regift https github com matthewpalmer Regif
在TImageViewer中，如何获取用户点击图片的位置？

在TImageViewer控件中用户可以缩放或平移图片我的问题是当用户点击图片时如何获取用户在图片上的点击位置尤其是用户可以对图片进行放大缩小或平移之后如何获取对应的图片点击位置呢 As shown below How to
Matlab颜色检测

我试图一致地检测同一场景的图像之间的某种颜色这个想法是根据颜色配置文件识别一组对象因此例如如果给我一个带有绿色球的场景并且我选择绿色作为我的调色板的一部分我想要一个具有反映它检测到球的矩阵的函数任何人都可以为这个项目推荐一些
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
直方图均衡结果

I am trying to code histogram equalization by my self but the results are different from the built in function in matlab
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
setImageCompressionQuality 与 setCompressionQuality 之间有什么区别 - Imagick

我在Imagick中找到了两种设置图像压缩质量的方法 A 设置图像压缩质量 B 设置压缩质量所以我想知道哪一个是最好的以及为什么在以下条件下我读到了setCompressionQuality方法仅适用于新图像我正在尝试压缩文件 jpe
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Oracle Blob 在 PHP 页面中作为 img src

我有一个网站当前使用文件服务器上的图像这些图像显示在页面上用户可以根据需要拖放每个图像这是使用 jQuery 完成的图像包含在列表中每张图片都非常标准 img src network path image png height 8
左对齐图像和居中文本在 div 内的同一级别？

HTML br div class UpperTitle img src align left CableSolve Web Dashboard Version 0 1 1 div br CSS UpperTitle text align
在Android内存中存储gif图像

我对安卓还很陌生我想将图像保存到内存中然后从内存中检索图像并将其加载到图像视图中我已使用以下代码成功将图像存储在内存中 void saveImage String fileName img cnt jpg File file new
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video

随机推荐

Prolog：将 2 个列表与其中 1 个未实例化的列表相乘？

我正在尝试编写一个规则可以返回两个列表相同长度中每个元素的乘积之和这是我现在所拥有的 sum 0 sum Result H1 T1 H2 T2 sum Remaining T1 T2 Remaining is Result H1 H
Rails 邮件程序预览无法从规范/邮件程序/预览中获得

我希望能够在浏览器中预览我的电子邮件我正在使用 Rspec 并在 spec mailers previews 中有以下预览设置 Preview all emails at http localhost 3000 rails mailers
getFilesDir() 与 Environment.getDataDirectory() [重复]

这个问题在这里已经有答案了我想用环境变量替换一种上下文方法但不确定它们的意思是否相同有什么区别 getFilesDir and Environment getDataDirectory 我怎样才能得到data data作为来自data
Java：通过_happens-before_关系在最终类的构造函数中安全地“泄漏”this-引用？

Goetz 的 Java Concurrency in Practice 第 3 2 1 节包含以下规则不允许this施工期间逃生参考我理解一般来说允许this转义可能会导致其他线程看到对象的不完整构造版本并违反初始化安全保证fin
Emacs。头盔包。如何查找文件夹（不是 git 文件夹）和所有子文件夹中的文件？

Windows 10 64 位 Emacs 25 1 Helm 包查找文件例如我的文件 txt 在任何文件夹不是 git 不是项目文件中我使用命令helm 查找文件是工作好的但现在我需要找到我的文件 txt在当前文件夹和所有子
JavaScript 中多种情况的 switch 语句

我需要在 JavaScript 中的 switch 语句中使用多种情况例如 switch varName case afshin saeed larry alert Hey break default alert Default case
从 hibernate 迁移到普通 jdbc

我最近开始从事 Java 和 J2EE 工作并且具备 JDBC 和 hibernate 相关概念的理论知识我的工作任务是将现有的 Hibernate 连接转换为普通 JDBC 任何人都可以建议最简单的方法来做到这一点实际上我必须处理
查询为给定事件类型注册的事件侦听器列表

有没有一种方法可以识别 JavaScript 中给定事件的注册侦听器列表如果可以您可以列出示例吗不是一般情况下仅当您自己在代码中跟踪所有事件侦听器时才能执行此操作最简单的方法是对所有事件侦听器分配使用包装函数如果其中一个大型图书
Objective-C KVO 不适用于 C 联合

我需要使用 KVO 观察 Objective C 类上的联合类型属性但似乎我对此没有运气我做了一些实验只要我使用 C 结构一切都会正常一旦我用联合替换结构自动 KVO 就不再工作了 observeValueForKeyPath没
异步加载脚本

我正在使用 JQuery 中的几个插件自定义小部件和其他一些库结果我有几个 js 和 css 文件我需要为我的网站创建一个加载程序因为加载需要一些时间如果我可以在导入所有内容之前显示加载程序那就太好了 etc 我找到了几个教程
失败时漂亮打印数组

describe Rspec do it should print arrays in a readable manner do arr 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 6 g 7 7 h 8 8 i 9 arr
为什么Java编译器11使用invokevirtual来调用私有方法？

当使用 OpenJDK 8 中的 Java 编译器编译以下代码时调用foo 是通过一个完成的invokespecial 但是当使用 OpenJDK 11 时 invokevirtual被发射 public class Invoke pub
两个java源文件的结构差异

有没有办法找到两个java源文件的结构差异我想找到两个java文件的结构差异但我不知道如何开始 java中有没有用于此目的的库更新结构差异意味着像它不关心空白或位置它应该在语法上比较源这有助于我们跟踪实际的更改即使方法被移动
安卓|使用 Retrofit2 和本地 API 进行基本身份验证

我开始制作一个应用程序并首先将其连接到模拟 API 现在我想将其连接到在我的 PC 上运行的 API For starters I m trying to implement the login access Since my API s
在 JavaScript 中将 png/jpg 转换为 .ico

所以我想要一个工具来生成 ico来自 jpg png 的文件我使用以下代码从画布生成了 jpg var img c toDataURL image png document write img src 取自此画布
如何更改 flutter showAboutDialog 中的文本按钮颜色？

我正在使用showAboutDialogflutter 中的函数显示我的项目中使用的许可证我如何坚持改变文本颜色VIEW LICENSES and CLOSE文本按钮请参阅此图片以进行说明这是我的代码 onTap showAboutD
如何在离开和返回 HTTPS 页面时保留更改的表单内容？（适用于 HTTP）

在文本区域中输入更改某些内容在提交表单之前请离开页面例如通过单击浏览器的后退按钮返回编辑页面例如单击前进按钮预期结果在textarea中输入的内容应该仍然存在实际结果 with HTTPS 所有的改变都消失了 bad w
MongoDB无尽查找ToListAsync

我正在尝试从 MongoDB 集合中检索数据但是发生了一些奇怪的事情如果我显示 MessageBox 则数据获取有效如果不显示则数据获取无效 static class MongoDBController static MongoCl
Obj-C Cocoa 通知 NSApplicationDidResignActiveNotification

我有一个名为 AppController h m 的类我想在发送 NSNotificationDidResignActiveNotification 时做一些事情所以我在AppController m中编写了这段代码 void init
CNN - 图像调整大小 VS 填充（是否保持纵横比？）

虽然人们在训练 CNN 时通常倾向于简单地将任何图像调整为正方形例如 resnet 采用 224x224 正方形图像但这对我来说看起来很难看尤其是当长宽比不在 1 左右时事实上这可能会改变基本事实例如专家可能给扭曲图像的标签可

CNN - 图像调整大小 VS 填充（是否保持纵横比？）

CNN - 图像调整大小 VS 填充（是否保持纵横比？） 的相关文章

随机推荐

热门标签

CNN - 图像调整大小 VS 填充（是否保持纵横比？）的相关文章