使用不同尺寸但相同数量的 HoG 特征的图像训练分类器

2023-12-20

我想用一些图像来训练我的分类器，其中一些图像具有不同的尺寸。

它们都属于以下维度：

100x50
50x100
64x72
72x64

然而，由于有 9 个方向箱和每个单元 8 个像素，每个单元都会生成 648 个 HoG 特征。

实际上，我选择所有图像都具有这些尺寸之一，以便它们最终具有相同数量的 HoG 特征，从而使训练是统一的。

我选择这样做的原因是因为训练图像中感兴趣的对象有时具有不同的长宽比，因此将所有图像裁剪为相同的大小，而某些图像会留下太多背景。

现在我的问题是 - 只要 HoG 特征的数量一致，训练图像的长宽比/图像尺寸有什么关系？（我的训练算法只接受 HoG 特征）。

如果你的 HOG 特征全部使用 8x8 单元，那么如何为不同尺寸的图像获得相同尺寸的向量？更大的图像中不会有更多的单元格吗？

一般来说，如果你想使用 HOG，你应该将所有图像调整为相同的大小。

另一个问题：您只想对已经裁剪的图像进行分类，还是想检测大场景中的对象？如果你只是想分类，那么纵横比的变化可能是一个问题。另一方面，如果你想做滑动窗口目标检测，长宽比的变化是一个更大的问题。您可能必须根据纵横比将类别分成子类，并为每个子类训练一个单独的检测器。

Edit:抱歉，通过使用舍入误差和长宽比差异来使 HOG 向量具有相同的长度是作弊行为。 :) 重点是让 HOG 细胞编码空间信息。相应的细胞必须编码不同图像中的相同点。否则你就是在比较苹果和橘子。

就物体检测而言，纵横比至关重要。您将在图像上滑动一个窗口，并且该窗口最好具有与您尝试检测的对象相同的纵横比。否则，它根本行不通。因此，如果您有这 4 种不同的长宽比，那么最好的选择是训练 4 个不同的检测器。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用不同尺寸但相同数量的 HoG 特征的图像训练分类器的相关文章

numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
Oracle Blob 在 PHP 页面中作为 img src

我有一个网站当前使用文件服务器上的图像这些图像显示在页面上用户可以根据需要拖放每个图像这是使用 jQuery 完成的图像包含在列表中每张图片都非常标准 img src network path image png height 8
在 SQL Server 2005 IMAGE 列中存储 20 Meg 文件的最有效方法

我们将文档存储在 SQL Server 2005 数据库表中列格式为 Image 每次我尝试存储大于 1 Meg 的 PDF 文件时它都会以某种方式损坏 NET 中是否有任何特别有效的方法来序列化大文件 10megs 并将其存储到数据库
如何确定与视频中物体的距离？

我有一个从行驶中的车辆前面录制的视频文件我将使用 OpenCV 进行对象检测和识别但我停留在一方面如何确定距已识别物体的距离我可以知道我当前的速度和现实世界的 GPS 位置但仅此而已我无法对我正在跟踪的对象做出任何假设我计划用
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
使用 ImageMagick/convert 创建半透明 PNG

我有 PNG 文件我想将整个图像转换为半透明该图像将在 KML 文件中引用为 Google 地球地图中使用的图标叠加层使用 ImageMagick 向我建议了以下示例convert命令但似乎都不起作用第一个示例会导致错误 usr
鼠标悬停时放大图像而不使用 Jquery 推送其他图像？

当您将鼠标悬停在图像缩略图上例如 Google 图片正在使用的缩略图时我正在尝试创建图像放大效果但是我遇到了一个问题即放大的图像根据放大的图像的位置不断将另一张图像推到另一个位置这是我到目前为止所拥有的
为 iOS 应用程序加载基于 SVG 的图像资源

我从 thenounproject 购买了一个图标作为 SVG 图像然后我使用一个名为的 macOS 程序Gapplin http gapplin wolfrosch com 将此 SVG 导出为 PNG 图像它显示为 100x100
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
使用 HttpUrlConnection Android 将 base64 编码的图像发送到服务器

我正在尝试使用 HttpUrlConnection 将 base64 编码的图像发送到服务器我遇到的问题是大多数图像均已成功发送但有些图像会生成 FileNotFound 异常我的图像编码代码可以在下面找到 public static
将 4 通道图像转换为 3 通道图像

我正在使用 OpenCV 2 4 6 我正在尝试将 4 通道 RGB IplImage 转换为 4 通道 HSV 图像下面是我的代码给出错误 OpenCV 错误未知函数断言失败我认为 cvCvtColor 支持 3 通道图像有没有
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
OpenCV VideoWriter 未写入 Output.avi

我正在尝试编写一段简单的代码来获取视频裁剪视频并写入输出文件系统设置 OS Windows 10 Conda Environment Python Version 3 7 OpenCV Version 3 4 2 ffmpeg Vers
将图像编码为base64有什么效果？

如果我将图像 jpg 或 png 转换为 base64 那么它会更大还是具有相同的大小会大多少呢是否建议在我的网站上使用 Base64 编码的图像大约会大 37 非常粗略地说 Base64 编码的二进制数据的最终大小等于原始数据大小
数学/算法使图像适合屏幕保留纵横比

我需要数学算法方面的帮助来拍摄已知尺寸的图像并适合两个屏幕尺寸之一 720 x 480 或 1280 x 1024 图像尺寸来自 XML 文件但这些尺寸是 Web 尺寸我还从 XML 中选择了一些图像这些图像的分辨率可能比 Web
使用 mongoose 通过 React 应用程序将图像上传到 mongodb 数据库

我正在为找到的对象创建一个反应应用程序我想允许用户上传这些对象的照片我尝试使用 axios 通过 post 请求将图像发送到猫鼬服务器但它不起作用这就是我如何将图像存储在带有预览的 React 组件中 handleImage eve
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
使用 PHP 中的 GD 库在图像上绘图

我创建了一个代码来生成随机图案图像它创建一个具有给定宽度和高度的图像并用 40x40 像素的小矩形填充它这是我的代码
下载后从谷歌照片库检索图像

我正在发起从图库中获取照片的意图当我在图库中使用 Nexus 谷歌照片应用程序时一切正常但如果图像不在手机上在 Google Photos 在线服务上它会为我下载选择图像后我将图像发送到另一个活动进行裁剪但在下载的情况下发

随机推荐

删除选择元素活动状态下的 select2 边框？

我已经浏览了它的 css 代码但无法找到它应用于主元素的实际属性我正在 select2 库中进行一些更改以便我可以按照自己的方式使用它我被困在它的 CSS 中无法从活动或焦点元素上显示哪个属性边框没有找到任何 active se
PHP 中的字符字符串差异

简而言之我正在寻找类似 PHP 中的 google diff match patch 的东西我在 SO 上查看了一些类似的问题也查看了提供的算法here http github com paulgb simplediff blob 5
重载、泛型类型推断和“params”关键字

我刚刚注意到过载解析的奇怪行为假设我有以下方法 public static void DoSomething
如何使用 html 文件选择器（输入类型=“文件”）将照片上传到 facebook（graph api）

我有一个 html 文件它从用户的计算机中选择图像代码如下
AWS Elastic beanstalk 上的 CORS

我是 AWS 新手并且使用过弹性豆茎在节点中部署我的其余 API api example com and S3桶 with 云前我在 React 中的静态网站 example com 从网站调用 API 端点时浏览器会给出 CORS 错
iPad 横向应用程序不响应屏幕底部附近的触摸

我是一位经验丰富的开发人员但对 iOS 还比较陌生我在使用 iPad 应用程序时遇到了一些问题我的视图没有响应屏幕底部三分之一的按钮触摸触摸其他按钮工作正常所以我知道我的视图在加载时已正确连接我已在 IB 中创建了它们我在模拟
网络路径上的 Directory.CreateDirectory

我正在尝试在网络路径上创建一个新的目录树该共享位于 192 168 5 193 FileContext并且有Everyone 完全访问权限权限这段代码 DirectoryInfo directoryInfo Directory Crea
在类构造函数中设置默认值 C#

我需要一个默认值设置以及许多不同的页面访问和更新最初我可以像这样在类构造函数中设置默认值吗在 C NET 中执行此操作的正确方法是什么 public class ProfitVals private static double hipr
根据同一 html 表单中的另一个下拉列表填充下拉列表

我有一个 HTML 表单里面有很多选项我想根据以前的用户选择更改这些选项内的值假设我有这样的东西
在反应原生中存储私有数据的最佳方式是什么？

我怎样才能实现这样的功能remember me通过反应应用程序进行身份验证时我认为未加密AsyncStorage这不是最好的方法因为数据对用户开放我尝试过使用realm 但陷入了在android中无法解决的问题expo测试应用程序它
使用 Outlook VBA 将电子邮件复制到剪贴板

如何将电子邮件复制到剪贴板然后将其粘贴到 Excel 中并保持表格完好无损我正在使用 Outlook 2007 我想做相当于 Click on email gt Select All gt Copy gt Switch to Excel
从 DOUBLE (15,2) 转换为 DECIMAL (15,2)

mysql中double和decimal之间转换会不会有数据丢失双精度数的精度约为 16 位小数所以答案是否定的因为这两种类型都被声明为具有 15 位十进制数字的精度如果类型有 16 位数字则取决于存储的数字因为双精度数的精度实
SQL Server：表中的行更改了顺序

我创建了带有这样的数字的表如何找到数据间隙并插入 NULL 数据点而不是有间隙 https stackoverflow com questions 20911946 sql how to find gaps of data and ins
如何在 MinGW 中启用实验性 C++11 并发功能？

当尝试编译以下代码时 include
浮动条形图

我正在尝试绘制一个图其中 x 轴是时间 y 轴是条形图条形图覆盖特定时间段如下所示 gt time 我有 2 个日期时间值列表分别代表我想要涵盖的这些时间的开始和结束时间到目前为止我已经 x np array dt datetim
ORA-00604: 递归 SQL 级别 1 发生错误

我开始得到以下内容SQL exception我不知道这个异常的根本原因是什么我也关门了dbconnection and prepared statement也那么问题出在哪里呢 java sql SQLException ORA 006
Firestore - 如何检索集合的所有子集合

我有一个关于 Firestore 的问题我创建了一个类别集合其中有几个文档我创建了一个建筑工地子集合我想从每个类别中检索所有子集合但是当我尝试这样做时 useEffect gt const listConstruction
K8S iptables 与 pod 内容器的关系

我已在容器中启用特权模式并向其添加规则 iptables N udp2rawDwrW 191630ce C0 iptables F udp2rawDwrW 191630ce C0 iptables I udp2rawDwrW 191630c
为什么这个映射函数不会改变原始数组中的值？

这是有问题的代码 const array 1 2 3 array map item gt item item 1 console log array 我以为item 第一论证map方法是对数组中原始项目的引用直接改变它会改变第一个数组的
使用不同尺寸但相同数量的 HoG 特征的图像训练分类器

我想用一些图像来训练我的分类器其中一些图像具有不同的尺寸它们都属于以下维度 100x50 50x100 64x72 72x64 然而由于有 9 个方向箱和每个单元 8 个像素每个单元都会生成 648 个 HoG 特征实际上我选择

使用不同尺寸但相同数量的 HoG 特征的图像训练分类器

使用不同尺寸但相同数量的 HoG 特征的图像训练分类器 的相关文章

随机推荐

热门标签

使用不同尺寸但相同数量的 HoG 特征的图像训练分类器的相关文章