OpenCV学习(三):一步步实现图像定位(ROS C++版)

2023-05-16


一、预期目标

如下图,要识别图中的国旗,然后框选出来,并且返回国旗的中心位置,效果如下:
图像定位
彩色图像大小: (400,264)
目标中心位置: (225, 218)


二、准备工作
1、将下面的图像另存为在本地,命名为 findflag.jpg
原始图像
2、新建Python文件 findflag.py,与图像保存在同一目录下。


三、开始编写代码

1、读取与显示图像

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");  // 需要下载图片到该目录下,也即 ~/test/flag.jpg,根据自己电脑修改路径
        imshow("Original Image", img_bgr);
        waitKey(0);
        
        return 0;
}

执行python findflag.py,能够正常显示图像
注意OpenCV里面的图像矩阵为 BGR 格式,而不是 RGB

2、根据 HSV 获得目标

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        imshow("Original Image", img_bgr);
        imshow("Flag Image", img_flag);

        waitKey(0);
        waitKey(0);
        return 0;
}
  • 代码中,首先变化为 HSV 格式,因为 HSV 格式更利于做图像处理,具体原因可以参考RGB、HSV和HSL颜色空间。
  • thresh1 的三个变量分别为 H(色度)、S(饱和度)、V(亮度)分量,[thresh1, thresh2] 之间的便是红旗的颜色。
  • cv2.inRange(…) 返回一个图像矩阵(此处:256×400),大于阈值 thresh2 的为255(白色),小于阈值 thresh1 的为0(黑色),中间部分不变。
  • cv2.bitwise_and(…) 函数是将图像进行与运算,使用来掩膜参数 mask,其效果相当于先把掩膜flag 和图像 img_hsv 相成,结果是除了红旗和噪声,其他地方为 0(黑色)。
    红旗部分效果如下,可见成功提取到红旗部分,但是含有少量噪声。
    红旗部分

3、图像滤波

#include <stdio.h>
#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>

using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        Mat img_morph;
        int elem_type = MORPH_RECT;
        Mat element = getStructuringElement(elem_type, Size(3,3), Point(1,1));
        erode(img_flag, img_morph, element);
        dilate(img_morph, img_morph, element);

        imshow("Flag Image", img_flag);
        imshow("Morph Image", img_morph);

        waitKey(0);
        waitKey(0);
        return 0;
}

此处采用形态学(morphology)滤波算法,首先使用 (3×3)的核腐蚀 3次,然后又膨胀 3次,达到滤波效果,如下图:
滤波图像
4、特征显示

#include <opencv-3.3.1-dev/opencv2/core.hpp>
#include <opencv-3.3.1-dev/opencv/highgui.h>
#include <opencv-3.3.1-dev/opencv2/opencv.hpp>
#include <opencv-3.3.1-dev/opencv2/imgproc.hpp>         // Add more .hpp
#include <opencv-3.3.1-dev/opencv2/imgcodecs.hpp>
#include <iostream>

using namespace std;
using namespace cv;

int main(int argc, char **argv)
{
        Mat img_bgr;
        img_bgr = imread("/home/geng/test/flag.jpg");

        Mat img_hsv;
        cvtColor(img_bgr,img_hsv, CV_BGR2HSV);

        Mat img_flag;
        inRange(img_hsv, Scalar(0,120,120), Scalar(10,255,255), img_flag);

        Mat img_morph;
        int elem_type = MORPH_RECT;
        Mat element = getStructuringElement(elem_type, Size(3,3), Point(1,1));
        erode(img_flag, img_morph, element);
        dilate(img_morph, img_morph, element);

        vector<vector<Point> > contours;
        vector<Vec4i> hierarchy;
        findContours(img_morph, contours, hierarchy, RETR_TREE, CHAIN_APPROX_SIMPLE, Point(0,0));

        vector<vector<Point> > contours_poly(1);        // The contour's points
        vector<Rect> boundRect(1);

        int max_label = 0;                              // Find the max contour
        int max_area = 0;
        for (size_t i=0; i<contours.size(); i++)
        {
                if (contours[i].size() > max_area)
                {
                        max_area = contours[i].size();
                        max_label = i;
                }
        }

        approxPolyDP( Mat(contours[max_label]), contours_poly[0], 3, true);
        boundRect[0] = boundingRect( Mat(contours_poly[0]) ); // The rectangle of the max contour
        Scalar color = Scalar(255, 0, 0);
        //drawContours(img_bgr, contours_poly, 0, color, 1, 8, vector<Vec4i>(), 0, Point());

        vector<Point> aim_pos(2);
        aim_pos[0] = boundRect[0].tl();
        aim_pos[1] = boundRect[0].br();

        cout << "彩色图像大小" << (img_bgr.cols) << ", " << (img_bgr.rows) << endl;
        cout << "目标中心位置" << ((aim_pos[0].x + aim_pos[1].x) / 2) << ", " <<  ((aim_pos[0].y + aim_pos[1].y)/2) << endl;

        rectangle(img_bgr, aim_pos[0], aim_pos[1], color, 2, 8, 0);
        namedWindow("img_frame", WINDOW_AUTOSIZE);
        imshow("img_frame", img_bgr);
        waitKey(0);
        return 0;
}
  • 其中,cv2.findContours(…) 寻找轮廓,并建立一个等级树结构,记录的轮廓采用压缩值,例如一个矩形只用4点记录。返回各个轮廓只 cnts 中。
  • 然后对各个轮廓从大到小排列,我们选择包含面积最大的轮廓(不一定是轮廓点数最多的),得出其最小外接矩形,这个矩形只用了 4 个点记录,如下图:
    图像模型
  • 接下来计算目标图像中心并显示
  • cv2.drawContours(img_bgr, [points], -1, (255,0,0), 2) 的意思是在图像 img_bgr 上叠加轮廓,轮廓为 points 构成的向量,-1:负数显示所有轮廓,填充颜色为蓝色,宽度为 2像素。

运行即可得到最终结果,如下:
框选图像

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OpenCV学习(三):一步步实现图像定位(ROS C++版) 的相关文章

  • OpenCV 仅围绕大轮廓绘制矩形?

    第一次发帖 希望我以正确的方式放置代码 我正在尝试检测和计算视频中的车辆 因此 如果您查看下面的代码 我会在阈值处理和膨胀后找到图像的轮廓 然后我使用 drawContours 和矩形在检测到的轮廓周围绘制一个框 我试图在 drawCont
  • 多视图几何

    我从相距一定距离的两台相同品牌的相机捕获了两张图像 捕获了相同的场景 我想计算两个相机之间的现实世界旋转和平移 为了实现这一点 我首先提取了两张图像的 SIFT 特征并进行匹配 我现在有基本矩阵也单应性矩阵 然而无法进一步进行 有很多混乱
  • opencv形态扩张滤波器作为最大滤波器

    就像中值滤波器的定义一样 我可以将 最大滤波器 定义为局部窗口 例如dst x y max 3x3 局部窗口像素 但我在opencv中找不到这样的过滤器 最接近的是 dilate 函数 然后我使用 dilate 函数的默认配置 但结果不正确
  • 从图像坐标获取对象的世界坐标

    I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
  • minAreaRect OpenCV 返回的裁剪矩形 [Python]

    minAreaRectOpenCV 中返回一个旋转的矩形 如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标 以便可以通过循环框内的点来访问像素 但是在 Python 中是否有更快的裁剪方法 EDIT See code在
  • OpenCV IP 相机应用程序崩溃 [h264 @ 0xxxxx] 访问单元中缺少图片

    我在 cpp 中有一个 opencv 应用程序 它使用 opencv 的简单结构捕获视频流并将其保存到视频文件中 它与我的网络摄像头完美配合 但是 当我运行它从 IP 摄像机捕获流时 它可能会在大约十秒后崩溃 我的编译命令是 g O3 IP
  • 使用 OpenCV 和/或 Numpy 对两个图像进行 Alpha 混合 [重复]

    这个问题在这里已经有答案了 我想将一个填充纯色的半透明矩形添加到已加载的半透明 PNG 中 这是我正在使用的输入图像示例 该图像加载了标准cv2 IMREAD UNCHANGED标志 以便完美保留 alpha 通道 该输入图像存储在imag
  • 在 Python 中将 OpenCV 帧流式传输为 HTML

    我正在尝试从 opencv Pyt hon 中的 URL 读取视频 然后逐帧处理它 然后将其发送到 HTML 页面 But I am only getting the first frame after that the program g
  • 同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

    我目前正在编写一个应用程序 该应用程序将捕获大量 RTSP 流 在我的例子中为 12 个 并将其显示在 QT 小部件上 当我超过大约 6 7 个流时 问题就会出现 CPU 使用率激增并且出现明显的卡顿 我认为它不是 QT 绘制函数的原因是因
  • 如何在Windows上安装机器人操作系统ROSJava?

    ROS 的文档很糟糕 一个很大的讽刺是 ROS 的 Groovy 和 ROSJava 版本的创建是为了让 Windows 等平台上的开发人员能够利用出色的机器人 SDK 而所有安装说明仍然面向 Linux ubuntu 用户 The ROS
  • 如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

    我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
  • cv2.VideoWriter:请求一个元组作为 Size 参数,然后拒绝它

    我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频 构造 VideoWriter 对象时 文档表示 Size 参数应该是一个元组 当我给它一个元组时 它拒绝它 当我尝试用其他东西替换它时 它不会接受它 因为它说参数不是
  • OpenCV:如何从网络摄像头获取原始 YUY2 图像?

    你知道如何获得吗raw YUY2来自网络摄像头的图像 使用 OpenCV DirectShow 无 VFW http opencv willowgarage com wiki CameraCapture http opencv willow
  • “没有名为‘cv2’的模块”,但已安装

    我已经安装了包含 opencv 贡献的 whl 文件 因为我想使用 SIFT 算法 我在 conda 环境中使用 pip 安装了它 所以当我在 conda list 中提示时 它会向我显示 opencv python 3 4 5 contr
  • OpenCv读/写视频色差

    我试图简单地使用 openCV 打开视频 处理帧并将处理后的帧写入新的视频文件 我的问题是 即使我根本不处理帧 只是打开视频 使用 VideoCapture 读取帧并使用 VideoWriter 将它们写入新文件 输出文件看起来比输入更 绿
  • BRISK 特征检测器检测零个关键点

    下面显示的 Brisk 探测器没有给我任何关键点 有人可以提出一个问题吗 我将尝试用一些代码解释我在下面所做的事情 include opencv2 features2d features2d hpp using namespace cv u
  • 从扫描文档中提取行表 opencv python

    我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤 应用倾斜校正 应用高斯滤波器进行去噪 使用 Otsu 阈值进行二值化 进行形态学开局 Canny 边缘检测 进行霍夫变换以获得表格行 去除重复行 10像素范围内相
  • 如何检测斑点并将其裁剪成 png 文件?

    我一直在开发一个网络应用程序 我陷入了一个有问题的问题 我会尝试解释我想要做什么 在这里您看到第一个大图像 其中有绿色形状 我想要做的是将这些形状裁剪成不同的 png 文件 并使它们的背景透明 就像大图像下面的示例裁剪图像一样 第一张图像将
  • 让网络摄像头在 OpenCV 中工作

    我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频 但是 我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头 最近我发现这篇文章表明答案在于重新编译一个文件 o
  • 如何使用 python 定位和读取 Data Matrix 代码

    我正在尝试读取微管底部的数据矩阵条形码 我试过libdmtx http libdmtx sourceforge net 它有 python 绑定 当矩阵的点是方形时工作得相当好 但当矩阵的点是圆形时工作得更糟 如下所示 另一个复杂问题是在某

随机推荐