OpenCV学习（三）：一步步实现图像定位（ROS C++版）

2023-05-16

一、预期目标

如下图，要识别图中的国旗，然后框选出来，并且返回国旗的中心位置，效果如下:
图像定位
彩色图像大小: (400,264)
目标中心位置: (225, 218)

二、准备工作
1、将下面的图像另存为在本地，命名为 findflag.jpg
原始图像
2、新建Python文件 findflag.py，与图像保存在同一目录下。

三、开始编写代码

1、读取与显示图像

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");  // 需要下载图片到该目录下，也即 ~/test/flag.jpg，根据自己电脑修改路径
        imshow("Original Image", img_bgr);
        waitKey(0);
        
        return 0;
}

执行python findflag.py，能够正常显示图像
注意OpenCV里面的图像矩阵为 BGR 格式，而不是 RGB

2、根据 HSV 获得目标

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        imshow("Original Image", img_bgr);
        imshow("Flag Image", img_flag);

        waitKey(0);
        waitKey(0);
        return 0;
}

代码中，首先变化为 HSV 格式，因为 HSV 格式更利于做图像处理，具体原因可以参考RGB、HSV和HSL颜色空间。
thresh1 的三个变量分别为 H（色度）、S（饱和度）、V（亮度）分量，[thresh1, thresh2] 之间的便是红旗的颜色。
cv2.inRange(…) 返回一个图像矩阵（此处：256×400），大于阈值 thresh2 的为255（白色），小于阈值 thresh1 的为0（黑色），中间部分不变。
cv2.bitwise_and(…) 函数是将图像进行与运算，使用来掩膜参数 mask，其效果相当于先把掩膜flag 和图像 img_hsv 相成，结果是除了红旗和噪声，其他地方为 0（黑色）。
红旗部分效果如下，可见成功提取到红旗部分，但是含有少量噪声。

3、图像滤波

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        Mat img_morph;
        int elem_type = MORPH_RECT;
        Mat element = getStructuringElement(elem_type, Size(3,3), Point(1,1));
        erode(img_flag, img_morph, element);
        dilate(img_morph, img_morph, element);

        imshow("Flag Image", img_flag);
        imshow("Morph Image", img_morph);

        waitKey(0);
        waitKey(0);
        return 0;
}

此处采用形态学（morphology）滤波算法，首先使用（3×3）的核腐蚀 3次，然后又膨胀 3次，达到滤波效果，如下图：
滤波图像
4、特征显示

#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>
#include <opencv-3.3.1-dev/opencv2/imgproc.hpp>         // Add more .hpp
#include <opencv-3.3.1-dev/opencv2/imgcodecs.hpp>
#include <iostream>

using namespace std;
using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        Mat img_morph;
        int elem_type = MORPH_RECT;
        Mat element = getStructuringElement(elem_type, Size(3,3), Point(1,1));
        erode(img_flag, img_morph, element);
        dilate(img_morph, img_morph, element);

        vector<vector<Point> > contours;
        vector<Vec4i> hierarchy;
        findContours(img_morph, contours, hierarchy, RETR_TREE, CHAIN_APPROX_SIMPLE, Point(0,0));

        vector<vector<Point> > contours_poly(1);        // The contour's points
        vector<Rect> boundRect(1);

        int max_label = 0;                              // Find the max contour
        int max_area = 0;
        for (size_t i=0; i<contours.size(); i++)
        {
                if (contours[i].size() > max_area)
                {
                        max_area = contours[i].size();
                        max_label = i;
                }
        }

        approxPolyDP( Mat(contours[max_label]), contours_poly[0], 3, true);
        boundRect[0] = boundingRect( Mat(contours_poly[0]) ); // The rectangle of the max contour
        Scalar color = Scalar(255, 0, 0);
        //drawContours(img_bgr, contours_poly, 0, color, 1, 8, vector<Vec4i>(), 0, Point());

        vector<Point> aim_pos(2);
        aim_pos[0] = boundRect[0].tl();
        aim_pos[1] = boundRect[0].br();

        cout << "彩色图像大小" << (img_bgr.cols) << ", " << (img_bgr.rows) << endl;
        cout << "目标中心位置" << ((aim_pos[0].x + aim_pos[1].x) / 2) << ", " <<  ((aim_pos[0].y + aim_pos[1].y)/2) << endl;

        rectangle(img_bgr, aim_pos[0], aim_pos[1], color, 2, 8, 0);
        namedWindow("img_frame", WINDOW_AUTOSIZE);
        imshow("img_frame", img_bgr);
        waitKey(0);
        return 0;
}

其中，cv2.findContours(…) 寻找轮廓，并建立一个等级树结构，记录的轮廓采用压缩值，例如一个矩形只用4点记录。返回各个轮廓只 cnts 中。
然后对各个轮廓从大到小排列，我们选择包含面积最大的轮廓（不一定是轮廓点数最多的），得出其最小外接矩形，这个矩形只用了 4 个点记录，如下图：
接下来计算目标图像中心并显示
cv2.drawContours(img_bgr, [points], -1, (255,0,0), 2) 的意思是在图像 img_bgr 上叠加轮廓，轮廓为 points 构成的向量，-1：负数显示所有轮廓，填充颜色为蓝色，宽度为 2像素。

运行即可得到最终结果，如下：
框选图像

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

ROS

一步步实现图像定位

OpenCV学习（三）：一步步实现图像定位（ROS C++版）的相关文章

OpenCV 仅围绕大轮廓绘制矩形？

第一次发帖希望我以正确的方式放置代码我正在尝试检测和计算视频中的车辆因此如果您查看下面的代码我会在阈值处理和膨胀后找到图像的轮廓然后我使用 drawContours 和矩形在检测到的轮廓周围绘制一个框我试图在 drawCont
多视图几何

我从相距一定距离的两台相同品牌的相机捕获了两张图像捕获了相同的场景我想计算两个相机之间的现实世界旋转和平移为了实现这一点我首先提取了两张图像的 SIFT 特征并进行匹配我现在有基本矩阵也单应性矩阵然而无法进一步进行有很多混乱
opencv形态扩张滤波器作为最大滤波器

就像中值滤波器的定义一样我可以将最大滤波器定义为局部窗口例如dst x y max 3x3 局部窗口像素但我在opencv中找不到这样的过滤器最接近的是 dilate 函数然后我使用 dilate 函数的默认配置但结果不正确
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
minAreaRect OpenCV 返回的裁剪矩形 [Python]

minAreaRectOpenCV 中返回一个旋转的矩形如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标以便可以通过循环框内的点来访问像素但是在 Python 中是否有更快的裁剪方法 EDIT See code在
OpenCV IP 相机应用程序崩溃 [h264 @ 0xxxxx] 访问单元中缺少图片

我在 cpp 中有一个 opencv 应用程序它使用 opencv 的简单结构捕获视频流并将其保存到视频文件中它与我的网络摄像头完美配合但是当我运行它从 IP 摄像机捕获流时它可能会在大约十秒后崩溃我的编译命令是 g O3 IP
使用 OpenCV 和/或 Numpy 对两个图像进行 Alpha 混合 [重复]

这个问题在这里已经有答案了我想将一个填充纯色的半透明矩形添加到已加载的半透明 PNG 中这是我正在使用的输入图像示例该图像加载了标准cv2 IMREAD UNCHANGED标志以便完美保留 alpha 通道该输入图像存储在imag
在 Python 中将 OpenCV 帧流式传输为 HTML

我正在尝试从 opencv Pyt hon 中的 URL 读取视频然后逐帧处理它然后将其发送到 HTML 页面 But I am only getting the first frame after that the program g
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
如何在Windows上安装机器人操作系统ROSJava？

ROS 的文档很糟糕一个很大的讽刺是 ROS 的 Groovy 和 ROSJava 版本的创建是为了让 Windows 等平台上的开发人员能够利用出色的机器人 SDK 而所有安装说明仍然面向 Linux ubuntu 用户 The ROS
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
OpenCV：如何从网络摄像头获取原始 YUY2 图像？

你知道如何获得吗raw YUY2来自网络摄像头的图像使用 OpenCV DirectShow 无 VFW http opencv willowgarage com wiki CameraCapture http opencv willow
“没有名为‘cv2’的模块”，但已安装

我已经安装了包含 opencv 贡献的 whl 文件因为我想使用 SIFT 算法我在 conda 环境中使用 pip 安装了它所以当我在 conda list 中提示时它会向我显示 opencv python 3 4 5 contr
OpenCv读/写视频色差

我试图简单地使用 openCV 打开视频处理帧并将处理后的帧写入新的视频文件我的问题是即使我根本不处理帧只是打开视频使用 VideoCapture 读取帧并使用 VideoWriter 将它们写入新文件输出文件看起来比输入更绿
BRISK 特征检测器检测零个关键点

下面显示的 Brisk 探测器没有给我任何关键点有人可以提出一个问题吗我将尝试用一些代码解释我在下面所做的事情 include opencv2 features2d features2d hpp using namespace cv u
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
如何检测斑点并将其裁剪成 png 文件？

我一直在开发一个网络应用程序我陷入了一个有问题的问题我会尝试解释我想要做什么在这里您看到第一个大图像其中有绿色形状我想要做的是将这些形状裁剪成不同的 png 文件并使它们的背景透明就像大图像下面的示例裁剪图像一样第一张图像将
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某

随机推荐

Spring Boot如何优雅提高接口数据安全性

1 背景最近我司业务上需要对接第三方各大银行平台 xff0c 调用第三方接口和提供接口供第三方调用 xff0c 这时候的对外open接口安全性就得重视了 xff0c 再有就是之前我在知乎上发布一篇 Spring Security实现后端接
python错误解决：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd1 in position 0: invalid continuat

当处理文本文档时出现错误 xff1a UnicodeDecodeError utf 8 codec can t decode byte 0xd1 in position 0 invalid continuation byte 可试一下另存为
Centos7编译Golang报错：/usr/bin/ld: /tmp/go-link-xx0.o: unrecognized relocation (0x2a) in section `.text‘

在低版本centos7 xff08 我的是7 4 xff09 中运行goland编译时报错 xff1a usr bin ld tmp go link 038275771 000010 o unrecognized relocation 0x
解决 Macbook 连接蓝牙鼠标卡顿、飘的现象

原因 xff1a 1 鼠标蓝牙缺陷 xff0c 蓝牙版本低 xff0c 电池电量低 xff1b 2 电脑性能卡顿和功能优先度 xff1b 3 2 4Ghz的蓝牙与2 4Ghz的Wi Fi起冲突 xff0c 环境干扰大这里以解决2和3的问题
使用Kotlin的Android TextView –全面教程

Kotlin is the official programming language for Android apps development In this tutorial we ll be discussing TextViews
macOS Ventura 13解决某app软件“已损坏，无法打开”

从12 4升级到13系统的安全选项被重置了 xff0c 时间长不记得怎么回事 xff0c 再次记录一下如图报错 xff1a 方法一 xff1a 前往设置隐私与安全性安全性 xff08 在设置最下面 xff09 强制打开已拦截的xxx
解决MacOS Dock栏不能自动隐藏

已经在设置里面打开了了自动隐藏MacOS Dock栏功能 xff0c 但是实际上不能自动隐藏分别依次运行下面三行终端命令 xff1a defaults write com apple dock autohide delay int 0 d
js判断用户输入完成后按Enter可执行下一步操作，对预选词状态进行识别

js判断用户输入完成后按Enter可执行下一步操作 xff0c 对预选词状态进行识别 HTML如下 xff1a lt input type 61 34 text 34 value 61 34 34 maxlength 61 34 500 3
Mac报错：zsh: command not found: wails

搭建wails go GUI时报时如下 xff1a fyonecon 64 test src wails zsh command not found wails 处理 xff1a 1 安装wails依赖 xff08 官方文档 xff1a 安
Mac 状态栏工具statmenus的下载和激活（网速监控、磁盘和内存健康等）

学习下载 https bjango com mac istatmenus iStat Menus 6的 Email 982092332 64 qq com SN GAWAE FCWQ3 P8NYB C7GF7 NEDRT Q5DTB MFZ
MacOS 上的xshell和xftp

没有 xff01 mac上没有伟大的xshell和xftp 推荐使用 ssh方法登录服务器终端 xff1a 1 工具 xff1a iterm2终端 https www iterm2 com filezilla FTP软件https file
wamp3.1.4下载（PHP7.2.10，Mysql5.7）+ 打开局域网访问服务

下载wamp新版本 1 想试一下laravel56 xff0c PHP要求 gt 61 7 1 3 xff0c win10本地装的是php7 0 1 虽然可以扩展更新以下PHP版本 xff0c 有点麻烦 xff0c 不如更新一下wamp软件
js判断一个元素是否在数组中

方法一 xff1a strong indexOf strong 方法返回给定元素能找在数组中找到的第一个索引值 xff0c 否则返回 1 var a 61 34 1 34 34 3 34 34 2 34 34 3 34 34 0 34 co
Navicat设置MySQL索引+MySQL索引知识

引用 xff1a https www cnblogs com bypp p 7755307 html https blog csdn net resilient article details 82829820 查看当前MySQL存储引擎
xcode没有显示控件区域（右下角控件显示区域不见了）

挪到上面去了 Xcode12版本 xff1a 点右上的加号 xff1a Xcode10版本 xff1a
access排名_在Microsoft Access中对行进行排名

access排名 This is the third article on row numbers in Microsoft Access 这是有关Microsoft Access中行号的第三篇文章 The first is about R
Linux中c语言实现获取wifi状态

Linux中c语言实现获取wifi状态 Linux中c语言实现获取wifi状态1 c语言实现2 命令抓取方式 Linux中c语言实现获取wifi状态获取wifi信息有两种方案 xff0c 参考ifconfig程序使用c语言实现 xff0c
使用远程工具RDO：远程计算机需要网络级别身份验证，而您的计算机不支持该验证解决办法

查询关于网络级别身份验证的说法 xff1a 网络级身份验证是一种在远程桌面服务 xff08 RDP服务器 xff09 或远程桌面连接 xff08 RDP客户端 xff09 使用的技术 xff0c 它要求用户在与服务器创建会话前先进行身份验证
阿米洛蓝牙键盘无线连接Ubuntu16.04和windows10双系统的方法

我这里用的是阿米洛的樱花87键蓝牙键盘 xff0c 首先需要了解键盘自带的几个快捷键 xff1a FN 43 F1 F2 F3 分别代表你的键盘连接的三个设备 xff0c 在对应的连接设备上使用时注意切换可通过观测键盘上F1 F2 F3的
OpenCV学习（三）：一步步实现图像定位（ROS C++版）

一预期目标如下图 xff0c 要识别图中的国旗 xff0c 然后框选出来 xff0c 并且返回国旗的中心位置 xff0c 效果如下彩色图像大小 400 264 目标中心位置 225 218 二准备工作 1 将下面的图像另存为在本地

OpenCV学习（三）：一步步实现图像定位（ROS C++版）

OpenCV学习（三）：一步步实现图像定位（ROS C++版） 的相关文章

随机推荐

热门标签

OpenCV学习（三）：一步步实现图像定位（ROS C++版）的相关文章