使用 OpenCV 生成鸟瞰图/顶视图

2023-12-26

我正在尝试从图像生成鸟瞰图。对于相机的内在特性和变形，我使用的是从驾驶模拟器中检索到的硬编码值，该模拟器的顶部安装了相机。

代码的基础来自“使用 OpenCV 库学习 OpenCV 计算机视觉”，第 409 页。

当我在包含每行 3 个内角、每列 4 个内角的棋盘的图像上运行代码时，我的鸟瞰图是颠倒的。我需要图像正确地变成鸟眼，并且是正面朝上的，因为我需要另一个函数调用的单应矩阵。

这是输入和输出图像，以及我正在使用的代码：

Input image: enter image description here

Corners detected: enter image description here

Output Image/bird's eye (upside down!): enter image description here

代码：

#include <highgui.h>
#include <cv.h>
#include <cxcore.h>
#include <math.h>
#include <vector>
#include <stdio.h>

#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char* argv[]) {

if(argc != 4) return -1;
    // INPUT PARAMETERS:
    //
    int board_w = atoi(argv[1]); //inner corners per row
    int board_h = atoi(argv[2]); //inner corners per column
    int board_n = board_w * board_h;
    CvSize board_sz = cvSize( board_w, board_h );

    //Hard coded intrinsics for the camera  
    Mat intrinsicMat = (Mat_<double>(3, 3) <<
        418.7490, 0., 236.8528,
        0.,558.6650,322.7346,
        0., 0., 1.);      

    //Hard coded distortions for the camera 
    CvMat* distortion = cvCreateMat(1, 4, CV_32F);
    cvmSet(distortion, 0, 0, -0.0019);
    cvmSet(distortion, 0, 1, 0.0161);
    cvmSet(distortion, 0, 2, 0.0011);
    cvmSet(distortion, 0, 3, -0.0016);

    IplImage* image = 0;
    IplImage* gray_image = 0;

    if( (image = cvLoadImage(argv[3])) == 0 ) {
        printf("Error: Couldn’t load %s\n",argv[3]);
        return -1;
    }

    gray_image = cvCreateImage( cvGetSize(image), 8, 1 );
    cvCvtColor(image, gray_image, CV_BGR2GRAY );
    // UNDISTORT OUR IMAGE
    //
    IplImage* mapx = cvCreateImage( cvGetSize(image), IPL_DEPTH_32F, 1 );
    IplImage* mapy = cvCreateImage( cvGetSize(image), IPL_DEPTH_32F, 1 );

    CvMat intrinsic (intrinsicMat);

    //This initializes rectification matrices
    //
    cvInitUndistortMap(
        &intrinsic,
        distortion,
        mapx,
        mapy
    );


    IplImage *t = cvCloneImage(image);
    // Rectify our image
    //

    cvRemap( t, image, mapx, mapy );
    // GET THE CHESSBOARD ON THE PLANE
    //

    cvNamedWindow("Chessboard");
    CvPoint2D32f* corners = new CvPoint2D32f[ board_n ];
    int corner_count = 0;
    int found = cvFindChessboardCorners(
        image,
        board_sz,
        corners,
        &corner_count,
        CV_CALIB_CB_ADAPTIVE_THRESH | CV_CALIB_CB_FILTER_QUADS
    );
    if(!found){
        printf("Couldn’t aquire chessboard on %s, "
        "only found %d of %d corners\n",
        argv[3],corner_count,board_n
    );
    return -1;
    }
    //Get Subpixel accuracy on those corners:
    cvFindCornerSubPix(
        gray_image,
        corners,
        corner_count,
        cvSize(11,11),
        cvSize(-1,-1),
        cvTermCriteria( CV_TERMCRIT_EPS | CV_TERMCRIT_ITER, 30, 0.1 )
    );

    //GET THE IMAGE AND OBJECT POINTS:
    // We will choose chessboard object points as (r,c):
    // (0,0), (board_w-1,0), (0,board_h-1), (board_w-1,board_h-1).
    //

    CvPoint2D32f objPts[4], imgPts[4];
    imgPts[0] = corners[0];
    imgPts[1] = corners[board_w-1];
    imgPts[2] = corners[(board_h-1)*board_w];
    imgPts[3] = corners[(board_h-1)*board_w + board_w-1];

    objPts[0].x = 0; objPts[0].y = 0;
    objPts[1].x = board_w -1; objPts[1].y = 0;
    objPts[2].x = 0; objPts[2].y = board_h -1;
    objPts[3].x = board_w -1; objPts[3].y = board_h -1;


    // DRAW THE POINTS in order: B,G,R,YELLOW
    //
    cvCircle( image, cvPointFrom32f(imgPts[0]), 9, CV_RGB(0,0,255), 3); //blue
    cvCircle( image, cvPointFrom32f(imgPts[1]), 9, CV_RGB(0,255,0), 3); //green
    cvCircle( image, cvPointFrom32f(imgPts[2]), 9, CV_RGB(255,0,0), 3); //red
    cvCircle( image, cvPointFrom32f(imgPts[3]), 9, CV_RGB(255,255,0), 3); //yellow
    // DRAW THE FOUND CHESSBOARD
    //

    cvDrawChessboardCorners(
        image,
        board_sz,
        corners,
        corner_count,
        found
    ); 
    cvShowImage( "Chessboard", image );
    // FIND THE HOMOGRAPHY
    //
    CvMat *H = cvCreateMat( 3, 3, CV_32F);
    cvGetPerspectiveTransform( objPts, imgPts, H);
    Mat homography = H;
    cvSave("Homography.xml",H); //We can reuse H for the same camera mounting

    /**********************GENERATING 3X4 MATRIX***************************/

    // LET THE USER ADJUST THE Z HEIGHT OF THE VIEW
    //
    float Z = 23;
    int key = 0;
    IplImage *birds_image = cvCloneImage(image);
    cvNamedWindow("Birds_Eye");
    // LOOP TO ALLOW USER TO PLAY WITH HEIGHT:
    //
    // escape key stops
    //
    while(key != 27) {
        // Set the height
        //
        CV_MAT_ELEM(*H,float,2,2) = Z;
        // COMPUTE THE FRONTAL PARALLEL OR BIRD’S-EYE VIEW:
        // USING HOMOGRAPHY TO REMAP THE VIEW
        //
    cvWarpPerspective(
    image,
    birds_image,
    H,
    CV_INTER_LINEAR | CV_WARP_INVERSE_MAP | CV_WARP_FILL_OUTLIERS
    );
    cvShowImage( "Birds_Eye", birds_image );
    imwrite("/home/lee/bird.jpg", birds_image);

    key = cvWaitKey();
    if(key == 'u') Z += 0.5;
    if(key == 'd') Z -= 0.5;
    }
    return 0;
}

单应性结果似乎是正确的。由于您将相机的 z 轴映射为世界的 y 轴，因此鸟瞰图 (BEV) 重新映射生成的图像是上下颠倒的。

如果您确实需要 BEV 图像作为相机拍摄的图像，您可以使用 H 作为 H = Ty * Rx * H，其中 R 是绕 x 轴 180 度旋转，T 是 y 轴上的平移，H 是原始图像单应性。需要进行平移，因为您的旋转将旧 BEV 重新映射到 y 轴的负侧。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

imageprocessing

使用 OpenCV 生成鸟瞰图/顶视图的相关文章

OpenCV IP 相机应用程序崩溃 [h264 @ 0xxxxx] 访问单元中缺少图片

我在 cpp 中有一个 opencv 应用程序它使用 opencv 的简单结构捕获视频流并将其保存到视频文件中它与我的网络摄像头完美配合但是当我运行它从 IP 摄像机捕获流时它可能会在大约十秒后崩溃我的编译命令是 g O3 IP
2d 图像点和 3d 网格之间的交点

Given 网格源相机我有内在和外在参数图像坐标 2d Output 3D 点是从相机中心发出的光线穿过图像平面上的 2d 点与网格的交点我试图找到网格上的 3d 点 This is the process From Multip
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
OpenCV Mat 和 Leptonica Pix 之间的转换

我需要在 C 中在 OpenCV Mat 图像和 Leptonica Pix 图像格式之间进行转换这用于 8 位灰度图像的二值化我发现发现了 ikaliga的回答 https stackoverflow com a 25929320 2
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
如何在 C++ BOOST 中像图形一样加载 TIFF 图像

我想要加载一个 tiff 图像带有带有浮点值的像素的 GEOTIFF 例如 boost C 中的图形我是 C 的新手我的目标是使用从源 A 到目标 B 的双向 Dijkstra 来获得更高的性能 Boost GIL load tiif
如何使用网格分割图像并保留透明度边界框

我有一些 png 图像我想将其分成几个部分例如按网格或大小但每个部分应具有与原始图像相同的边界框透明度 Example 将图像分成两部分原来的 200 89 Output 部分 1 png 200 89 第2部分 png 200
如何在 Qt 应用程序中通过终端命令运行分离的应用程序？

我想使用命令 cd opencv opencv 3 0 0 alpha samples cpp cpp example facedetect lena jpg 在 Qt 应用程序中按钮的 clicked 方法上运行 OpenCV 示例代码
OpenCV SIFT 描述符关键点半径

我正在深入研究OpenCV的SIFT描述符提取的实现 https github com Itseez opencv blob master modules nonfree src sift cpp 我发现了一些令人费解的代码来获取兴趣点邻域
OpenCV 2.2 和多 CPU - opencv_haartraining.exe 是多线程的吗？

我在 VS 2010 上构建了 OpenCV 2 2 启用了 TBB 3 支持我确保所有项目都有正确的 tbb lib 目录并将 tbb lib 列为依赖项通过隐藏 tbb dll 进行验证果然 haartraining exe 抱
安卓的限制

我需要构建一个应用程序该应用程序拍摄相机图像并将其上传到网络在网络上进行一些处理并返回真假我在这方面遇到了一些问题希望得到澄清 1 我的应用程序有什么方法可以知道 Android 相机捕获的图像吗我从这里明白了什么 Androi
iphone opencv - 模板匹配

我已经在我的 iphone 项目中实现了这个 OpenCV 构建 http aptogo co uk 2011 09 opencv framework for ios http aptogo co uk 2011 09 opencv fra
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
如何使用 AdaBoost 进行特征选择？

我想使用 AdaBoost 从大量 100k 中选择一组好的特征 AdaBoost 的工作原理是迭代功能集并根据功能的执行情况添加功能它选择对现有特征集错误分类的样本表现良好的特征我目前正在 Open CV 中使用CvBoost 我得到
氡变换线检测

我正在尝试检测灰度图像中的线条为此我在 MATLAB 中使用 Radon 变换我的 m 文件的示例如下所示我可以使用此代码检测多行我还使用线条的移位和旋转属性来绘制线条但是我不明白在获取rho和theta值后如何获取检测线的起
如何加速 svm.predict？

我正在编写一个滑动窗口来提取特征并将其输入到 CvSVM 的预测函数中然而我偶然发现 svm predict 函数相对较慢基本上窗口以固定的步幅长度在图像比例上滑动穿过图像遍历图像加上提取每个图像特征的速度窗口大约需要 1000
为什么这个 gif 的持续时间似乎是 0 毫秒？如何找到真实的持续时间？

我正在尝试从动画 gif 文件中获取持续时间和帧数以便计算 gif 的平均帧速率然后将其转换为视频我最近在测试过程中看到了这张图片它似乎让一切都相信它的持续时间为 0 毫秒为什么如何找到真实的持续时间到目前为止我已经尝试过 e
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某

随机推荐

如何在Delphi中正确使用IFileOperation删除文件夹中的文件

我正在尝试创建一个使用 IFileOperation 删除文件中的简单示例给定目录包含在另一个 q 的答案中以便与其他方法进行比较下面是我的代码MRE https stackoverflow com help minimal rep
Lua 从值中找到键

我正在处理这个 chars Nigo Astran 1 pantera 2 nchar chars name 1 变量 name会给我一个我登录的字符串在本例中 Nigo Astran and nchar有价值 2 如果我在 Nigo A
FileStream“无法访问关闭的文件”

为什么我在使用时会收到上述错误消息using fileStream new FileStream path FileMode Append FileAccess Write 但是当我将其替换为时程序可以完美执行fileStream Fil
如果对象的 __hash__ 发生变化，会发生什么？

在Python中我知道这个值 hash 给定对象的返回值在该对象的生命周期内应该是相同的但是出于好奇如果不是的话会发生什么这会造成什么样的破坏 class BadIdea object def hash self return r
MvvmCross ：MvxListView 的动态项目模板选择

如果我有一个具有以下 MvxListView 定义的视图
.NET“双”算术是否独立于平台/架构？

如果我运行一个复杂的计算涉及System Double在 Windows x86 和 x64 下的 NET 上然后在 Mono Linux Unix 等等上我是吗绝对有保证 to get exactly在所有情况下结果相同或者规
从UDP Socket接收并发送回数据

我正在尝试编写一个控制台应用程序它接受请求大小为 18 字节然后将某些内容大小为 7 字节发送回客户端我这辈子似乎都无法让它发挥作用我可以很好地接收数据但我发回的数据永远不会到达客户端这是我的代码 static void
如何设置 NetBeans IDE pkg-config --cflags --libs gtk+-2.0？

有谁知道如何在 NetBeans IDE 中具体应用它我尝试包含 lgtk 2 0 或同一行作为附加选项但总是显示 gcc 错误 gtk 2 0 没有这样的文件或目录如果我手动这样做它就可以工作但我想以IDE方式应用它 gcc p
如何禁用 FlipView 上的箭头？

我有一个 FlipView 它工作得很好但我想禁用滚动时淡入的箭头我认为这会打破键盘鼠标用户的情况不是吗如果确实需要您可以从控件模板中删除按钮
Android dex问题：嵌套类+最终布尔值：com.android.dex.util.ExceptionWithContext

我正在尝试构建我的 Android 项目但在构建步骤中遇到了这个问题 INFO UNEXPECTED TOP LEVEL EXCEPTION INFO com android dex util ExceptionWithContext I
使用 C 或 C++ 从 USB 设备接收数据

我需要所有插入的 USB 设备的列表并让用户选择一个让控制台应用程序接收 USB 设备发送的任何数据然后我可以开始处理程序中的数据我不想使用库只想使用标准 C 函数并且该程序应该在 Windows 98 中运行这是一个very
如何使选项菜单始终显示在屏幕上

我需要始终在屏幕上显示选项菜单我已经编写了在活动启动时打开选项菜单的代码 Override public void onAttachedToWindow openOptionsMenu 但是单击屏幕上的另一个项目时菜单会下降我希望菜
保留history.pushState ie8-9的黑客

在大多数现代浏览器上我可以使用 history pushState Our Work url path 显然 IE 不支持这一点但我想知道为什么我的简单 hack 不起作用 history pushState function stat
无法删除 matplotlib 在 imshow() 图周围的填充

我正在将 matplotlib 嵌入到我的 PyQt4 GUI 中我玩得很开心我可以显示图像但它在我想要删除的内容周围添加了非常厚的填充这就是我正在做的 from PyQt4 QtCore import from PyQt QtGu
使用 MethodHandle::invokeExact 作为方法引用引起的 LambdaConversionException 导致的 BootstrapMethodError

我试图检查是否可以使用 MethodHandle invoke 或 MethodHandle invokeExact 作为接受 MethodHandle 并返回通用输出的功能接口的方法引用我知道 invoke 和 invokeExact
关于高分辨率性能计数器及其与.NET Stopwatch相关的存在的解释？

静态内部Stopwatch在构造函数中我们可以看到下面的代码它主要检查高分辨率性能计数器是否存在 static Stopwatch if SafeNativeMethods QueryPerformanceFrequency out Fr
但是， import sklearn 仍然给我错误。下面给出更多细节。我该如何解决这个问题？

我在 Windows 7 上使用 python3 6 之前尝试过 python3 8 来解决同样的问题我已经安装了 joblib 0 14 0 numpy 1 17 4 scikit learn 0 22 和 scipy 1 3 3 用于
导入 igraph 时出错

在 python 中导入 igraph 时出现错误见下文由于 igraph 不是 anaconda 的一部分因此我执行了以下概述的安装步骤 libglpk 35 dylib是什么我应该如何加载它为什么会出现这个问题 igraph
Visual Studio 可扩展性，如何枚举解决方案中的项目？

只是想加快 SDK 的使用速度所以我创建了自己的工具窗口现在我想迭代当前加载的解决方案中的现有项目并在工具窗口中显示它们的名称但不太确定枚举项目的最佳方式是什么有什么线索吗检查这个微软的代码 https github com M
使用 OpenCV 生成鸟瞰图/顶视图

我正在尝试从图像生成鸟瞰图对于相机的内在特性和变形我使用的是从驾驶模拟器中检索到的硬编码值该模拟器的顶部安装了相机代码的基础来自使用 OpenCV 库学习 OpenCV 计算机视觉第 409 页当我在包含每行 3 个内角每列

使用 OpenCV 生成鸟瞰图/顶视图

使用 OpenCV 生成鸟瞰图/顶视图 的相关文章

随机推荐

热门标签

使用 OpenCV 生成鸟瞰图/顶视图的相关文章