物体识别、检测、分类？有什么不同？

2024-03-16

我不知道这是否是正确的 stackexchange 论坛，在哪里提出这个问题，如果不是这种情况，请告诉我。

我正在开发一个应用程序，它给出包含绘画的输入图像作为输入，它能够告诉您绘画的标题。类似的情况是：给定一个包含建筑物的输入图像，返回的结果是建筑物的名称。

这是一个什么样的应用程序？第一次影响时，我会说“图像分类”之类的东西。我不是计算机视觉方面的专家，但我一直认为“图像分类”就像“给定一张图像，告诉我这张图像中包含什么”。

另一方面，对象检测定义似乎更与识别类的对象（例如建筑物）而不是类本身的实例（例如长城）相关：

物体检测是与计算机视觉相关的计算机技术以及处理检测语义实例的图像处理特定类别的对象（例如人、建筑物或汽车）数字图像和视频。

关于物体识别：

物体识别是感知物体物理特征的能力属性（例如形状、颜色和纹理）并应用语义它的属性（例如将该对象标识为苹果）。

我真的不知道如何对我所描述的应用程序进行分类（真是个笑话......）。你怎么认为？

简单地解释一下：你要去森林，那里一片漆黑。突然你看到了与背景不同的东西（纯黑）。这称为检测。

1）出现了与您的背景不同的东西。所以您检测到了。

2) 现在走近一点，你发现它是一种动物。啊..现在你已经分类/识别了。它也可能是一个人。

3) 现在它越来越近了，现在你看到它是一只鹿。所以，现在你已经识别出来了。

所以顺序是“检测到 -> 识别/分类 -> 识别”。

“身份识别是最后一个外壳，你可以用你的身份证来记住这一点，上面有你的脸（已识别），并被归类为（人类）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ComputerVision

Classification

objectdetection

objectrecognition

物体识别、检测、分类？有什么不同？的相关文章

将点云转换为深度/多通道图像

我有一个通过使用立体相机扫描平面生成的点云我已经生成了法线 fpfh 等特征并使用这些信息我想对点云中的区域进行分类为了能够使用更传统的 CNN 方法我想将此点云转换为 opencv 中的多通道图像我将点云折叠到 XY 平面并与
提高 SURF 在小图像上的性能

我在网络上遇到的每个 SURF 实现似乎都特别不擅长从小图像例如 100x100 或更小中提取有用数量的兴趣点我尝试了多种方法 1 使用各种放大算法从简单的最近邻算法到更高级的算法基本上每个放大器 imagemagick 都提供
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
检测不同分辨率下的图像相等性

我正在尝试构建一个脚本来浏览我的原始高分辨率照片并替换我在拥有专业帐户之前上传到 Flickr 的旧的低分辨率照片对于其中许多我可以只使用 Exif 信息例如拍摄日期来确定匹配但有些确实很旧要么原始文件没有 Exif 信息要
Tensorflow 对象检测 API 索引越界

运行 Android TF Detect 演示并使用我重新训练的 3 类 ssd mobilenet v1 coco 模型后我的 TF 检测演示崩溃给出索引越界异常这是 12 26 17 53 13 931 22429 25212 or
使用 Mahout 朴素贝叶斯分类器算法需要哪些步骤？

我正在尝试使用本机贝叶斯分类器来检测欺诈交易我在 Excel 工作表中有大约 5000 个样本数据这是我将用于训练分类器的数据并且我有大约 1000 个测试数据我将在其上应用测试分类器我的问题是我不知道如何训练分类器在将训练数
如何检查 Tensorflow LinearClassifier 的特征权重？

我正在尝试理解使用 TensorFlow 的大规模线性模型 https www tensorflow org tutorials linear文档这些文档对这些模型的推动如下线性模型比神经模型更容易解释和调试网您可以检查分配给每个特
给定焦点和相机主中心，如何创建透视投影矩阵

我设法使用 OpenCV 获取相机的内在和外在参数因此我有 fx fy cx 和 cy 我还有屏幕图像的宽度和高度但是如何根据这些参数创建 OpenGL 透视投影矩阵呢 glFrustum 展示了如何在给定 Z 近 Z 远以及图像宽度
在目标检测中使用步长为 1 的最大池化层的目的是什么

我正在使用单次探测器 SSD 更具体地说这个实现 https github com pierluigiferrari ssd keras在喀拉斯当我检查 SSD300 时正如我注意到的这也适用于 SSD512 我注意到在每个卷积组之后
在 python 上使用 TensorRT .engine 文件进行推理

我使用 Nvidia 的迁移学习工具包 TLT 进行训练然后使用 tlt converter 将 etlt 模型转换为 engine 文件我想使用这个 engine 文件在 python 中进行推理但由于我使用 TLT 进行训练因此
仅正样本和未标记数据集的二元半监督分类

我的数据由评论组成保存在文件中其中很少被标记为正面我想使用半监督和PU http www cs uic edu liub publications ICDM 03 pdf分类将这些评论分为正面和负面类别我想知道 python sci
从霍夫线中选择线

I m using Hough Lines to do corner detection for this image i plan to find the intersection of the lines as the corner T
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
正方形检测找不到正方形

我正在使用该程序方块 c在 OpenCV 库的示例中可用它适用于每个图像但我真的不明白为什么它不能识别该图像中绘制的正方形 After CANNY After DILATE The RESULT图像红色 http img267 ima
“分页文件太小，无法完成此操作”尝试训练 YOLOv5 对象检测模型时出错

我有大约 50000 个图像和注释文件用于训练 YOLOv5 对象检测模型我在另一台计算机上仅使用 CPU 训练模型没有问题但需要太长时间因此我需要 GPU 训练我的问题是当我尝试使用 GPU 进行训练时我不断收到此错误 OSE
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
Java机器学习库可以商用吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有谁知道我可以将其用于商业产品的优秀 Java 机器学习库吗不幸的是 Weka 和 Rapidmin
在 RGB 图像上绘制多类语义分割透明叠加

我有语义分割掩码的结果值在 0 1 之间需要大津阈值来确定什么是积极的我想直接在 RGB 图像上绘制在 RGB 图像上每个预测类具有不同的随机颜色我使用以下内容绘制了具有单一颜色的单个蒙版是否有一个包或简单的策略可以为多类别做到
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
指纹奇异点检测

我正在尝试确定指纹的核心点和增量点我正在使用庞加莱指数方法但我无法成功检测到这一点而且我不明白为什么 First I divide the image in 15x15 blocks then I calculate the x an

随机推荐

如何在arch linux中降级到cuda 10.0？

我想在 arch linux 中将我的 cuda 10 1 降级到 cuda 10 0 因为 TensorFlow 仅需要 cuda 10 0 我在 arch Linux 的 CUDA 10 1 上安装了tensorflow 但我不知道te
为什么 SQL Server DATETIME 类型可以节省 1/300 秒的时间？

SQLServer 日期时间格式存储为 8 个字节其中前四个字节是自 1900 年 1 月 1 日以来的天数其他四个字节是自午夜以来的刻度数刻度为秒的 1 300 我想知道这是为什么那1 300是从哪里来的呢这其中一定有一些历史原
Android JavaCV 从相机创建 IplImage 以与 ColorHistogram 一起使用

我在 Android 中使用 JavaCV 在我的代码中我创建了一个 ImageComparator OpenCV CookBook 的类 http code google com p javacv source browse OpenC
使用正斜杠与连字符的Javascript日期[重复]

这个问题在这里已经有答案了当我创建新的 Date 对象并使用连字符传递日期时 new Date 2015 07 02 I get Thu Jul 02 2015 01 00 00 GMT 0100 IST 当我使用正斜杠时 new Dat
NSButtonCell 作为 NSTableVIew 中的复选框未被选中

我有一个用于多重选择的 NSTableVIew 有两列第一列以 NSButtonCell 作为复选框另一列作为标题这个想法是检查要添加到数组后的项目问题是当我单击复选框时它们的状态不会改变我尝试附加 IBAction 但发送动作
如何使用 ClearCase 递归地“添加到源代码管理...”？

我将 zip 文件交付解压到 Clearcase 视图中现在我想将完整的文件树添加到存储库中 GUI 仅为单个文件目录提供添加到源代码管理你知道如何递归添加整棵树吗我使用的是 Windows 系统但安装了 Cygwin 我宁愿使
如何将 Spark 中的 StructType 分解为 json 数据帧中的行而不是列

我用这个模式读取了一个嵌套的 json root company struct nullable true 0 string nullable true 1 string nullable true 10 string nullable t
如何显示日期范围 Jquery 之间的多个日期范围

您好我有一个日期范围选择器我想显示为特定日期范围定义的所有日期范围如下所示假设我的日期范围是 01 01 2017 01 07 2017 我有一个数组其中定义了 db 中上述日期范围之间的所有日期所以该数组如下 sub date
Keycloak invalid_token 未找到指定孩子的公钥

我正在使用 keycloak 来保护我的休息服务并且我能够获取令牌但是当我使用此令牌来获取我的休息服务响应时出现以下错误 HTTP 1 1 401 Unauthorized Cache Control no cache no stor
应用程序池模式问题：经典还是集成

我面临一个问题希望您能给我一些指导我有一个使用 spring net 和 ext net 库的 Asp net 4 0 网站应用程序我已将其部署在 IIS 7 中使用classic应用程序池模式并且它可以工作它在集成模式下不起作用
Express.js ERR_TOO_MANY_REDIRECTS 错误

这是场景如果用户想要查看需要用户访问的页面我想将他重定向到主页但是当我尝试访问主页时收到 ERR TOO MANY REDIRECTS 错误我不知道如何解决这个问题 app js exports ensureAuthenticate
无法像使用 CTRL-r 一样转发搜索 Bash 历史记录

I am trying to search my bash history similarly as with CTRL r but to forward direction It has been a pain for me when I
Android 4.1.1 中的 WebView 无法接收 KEYCODE_DEL

我要实现WebView通过创建复杂的 JavaScript 来处理键盘事件可进行编辑在所有 Android 版本上一切正常除了4 1 In 4 1我可以处理所有关键事件除了KeyEvent KEYCODE DEL 看来我们无法应对KE
JAXB 使用 Woodstox 解析器来提高性能？

是否可以切换本机解析器我相信它是基于 Java 反射的我们遇到了一些性能问题想知道是否可以切换实现非常感谢您的建议附加信息这是继承的代码我们需要修复网络服务中的性能问题我正在寻求在不更改代码的情况下提高性能现有代码使用 J
从互联网下载 Doc/PDF 并保存到内存 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在尝试制作一个应用程序主要用于打开和读取我拥有的一组预定文档最初的想法是在第一次运行或安装时将所有文档大约 40 MB 复制
多项目 Visual Studio 模板中的嵌套项目

我需要创建一个具有以下结构的 vsTemplate ECart Ecart cs项目模块文件夹 MVC project 我们如何在另一个项目中添加一个项目在本例中 ECart 是一个 Web 项目 MVC 是同一项目的 Modules
如何解决“Microsoft Visual Studio (VS)”错误“无法启动 IIS Express Web 服务器”

PROBLEM 在某些情况下微软 Visual Studio VS http www microsoft com visualstudio eng 当你使用时Microsoft Internet 信息服务 Express IIS htt
正则表达式提取第二个和第三个字符串

我试图从句子中提取第二个和第三个字符串空格始终是分隔符例如我的句子是正则表达式对我来说是新的我需要是新的作为我的输出我有下面的正则表达式当我在 regex101 站点尝试时它正在工作 lt s s lt s s 我在想是否
Node.js 还是 Go 来进行 Hyperledger Fabric 的链码开发？

其中哪一种语言Node js and Go在可维护性可扩展性和更好的支持方面更适合链码开发这是个人喜好的问题但我会说 Golang 因为 Node js chaincode 在容器构建时使用 npm install 速度很慢并且
物体识别、检测、分类？有什么不同？

我不知道这是否是正确的 stackexchange 论坛在哪里提出这个问题如果不是这种情况请告诉我我正在开发一个应用程序它给出包含绘画的输入图像作为输入它能够告诉您绘画的标题类似的情况是给定一个包含建筑物的输入图像返回的结

物体识别、检测、分类？有什么不同？

物体识别、检测、分类？有什么不同？ 的相关文章

随机推荐

热门标签

物体识别、检测、分类？有什么不同？的相关文章