增强现实入门实战，使用ArUco标记实现增强现实

2023-05-16

点击上方“AI算法修炼营”，选择加星标或“置顶”

标题以下，全是干货

在本文中，我们将介绍ArUco标记以及如何使用OpenCV将其用于简单的增强现实任务，具体形式如下图的视频所示。

一、什么是ArUco标记？

ArUco标记最初由S.Garrido-Jurado等人在2014年发表的论文Automatic generation and detection of highly reliable fiducial markers under occlusion中提出。ArUco的全称是Augmented Reality University of Cordoba，下面给出ArUco标记的一些示例。

ArUco标记作为基准标记放置在要成像的对象或场景上。它是一个背景为黑色的正方形，正方形内部的白色图案用来表示标记的唯一性，并且存储一些信息。黑色边界的目的是为了提高ArUco标记检测的准确性和性能。ArUco标记的尺寸可以任意的更改，为了成功检测可根据对象大小和场景选择合适的尺寸。在实际使用中，如果标记的尺寸太小，可能无法检测到它，这时可以选择更换较大尺寸的标记，或者将相机离标记更近一些。

在本文中，我们将ArUco标记放在图像相框的四个角上。当检测到这些标记时，便可以得到图像在相框中的位置，之后用其他图像替换原图像。并且当我们移动相机时，新替换的图片仍然具有正确的透视效果。

此外，在机器人应用中，可以将这些标记沿着仓库机器人的路径放置。当安装在机器人上的摄像头检测到这些标记时，由于每个标记都有唯一的ID，并且且标记在仓库中的放置位置已知，因此就可以知道机器人在仓库中的精确位置。

二、在OpenCV中生成ArUco标记

使用OpenCV可轻松生成这些标记。OpenCV中的Aruco模块总共有25个预定义的标记词典。每个词典中所有的Aruco标记均包含相同数量的块或位(例如4×4、5×5、6×6或7×7)，且每个词典中Aruco标记的数量固定(例如50、100、250或1000)。接下来我们将展示如何在C++和Python中生成和检测各种aruco标记。

调用getPredefinedDictionary函数加载包含250个标记的字典，其中每个标记都是6×6位二进制模式。具体代码在下面给出。

C++代码

// Import the aruco module in OpenCV 
#include <opencv2/aruco.hpp>


Mat markerImage; 
// Load the predefined dictionary 
Ptr<cv::aruco::Dictionary>dictionary=aruco::getPredefinedDictionary(cv::aruco::DICT_6X6_250); 
// Generate the marker 
aruco::drawMarker(dictionary, 33, 200, markerImage, 1);

Python代码

import cv2 as cv
import numpy as np


# Load the predefined dictionary
dictionary = cv.aruco.Dictionary_get(cv.aruco.DICT_6X6_250)


# Generate the marker
markerImage = np.zeros((200, 200), dtype=np.uint8)
markerImage = cv.aruco.drawMarker(dictionary, 33, 200, markerImage, 1);


cv.imwrite("marker33.png", markerImage);

代码中drawMarker函数可以从由250个aruco标记组成的集合中选择给定id(第二个参数– 33)的标记，这250个标记的id由0~249表示。drawMarker函数的第三个参数决定生成的标记的大小，在上面的示例中，它将生成200×200像素的图像。第四个参数表示将要存储aruco标记的对象(上面的markerImage）。最后，第五个参数是边界宽度参数，它决定应将多少位（块）作为边界添加到生成的二进制图案中。

在上面的代码中，将在6×6生成的图形周围添加1位的边界，以在200×200像素的图像中生成7×7位的图像。上述代码生成的aruco标记如下图所示。

在实际应用时，我们可能需要生成多个标记。之后我们只需要将这些标记打印出来就可以直接使用了。

三、检测Aruco标记

将aruco标记放置在环境中后，我们需要检测它们并将其用于进一步处理。接下来我们介绍如何通过代码检测标记。

C++代码

// Load the dictionary that was used to generate the markers.
Ptr<Dictionary> dictionary = getPredefinedDictionary(DICT_6X6_250);


// Initialize the detector parameters using default values
Ptr<DetectorParameters> parameters = DetectorParameters::create();


// Declare the vectors that would contain the detected marker corners and the rejected marker candidates
vector<vector<Point2f>> markerCorners, rejectedCandidates;


// The ids of the detected markers are stored in a vector
vector<int> markerIds;


// Detect the markers in the image
detectMarkers(frame, dictionary, markerCorners, markerIds, parameters, rejectedCandidates);

Python代码

#Load the dictionary that was used to generate the markers.
dictionary = cv.aruco.Dictionary_get(cv.aruco.DICT_6X6_250)


# Initialize the detector parameters using default values
parameters =  cv.aruco.DetectorParameters_create()


# Detect the markers in the image
markerCorners, markerIds, rejectedCandidates = cv.aruco.detectMarkers(frame, dictionary, parameters=parameters)

对于每次成功检测到标记，将按从左上，右上，右下和左下的顺序检测标记的四个角点。在C ++中，将这4个检测到的角点存储为点矢量，并将图像中的多个标记一起存储在点矢量容器中。在Python中，它们存储为Numpy 数组。

detectMarkers函数用于检测和确定标记角点的位置。第一个参数是带有标记的场景图像。第二个参数是用于生成标记的字典。成功检测到的标记将存储在markerCorners中，其ID存储在markerIds中。先前初始化的DetectorParameters对象作为传递参数。

四、增强现实应用

ArUco标记主要是为解决包括增强现实在内的各种应用场景下的相机姿态估计问题。OpenCV在其文档中详细描述了姿势估计过程。

本文中，我们将把ArUco标记用于增强现实应用程序，该程序可以将任何新场景叠加到现有图像或视频上。我们在家中选择一个带有相框的场景，并希望用新的图片替换原有图片，并查看新图片在墙上的样子。然后，我们尝试在影片中插入视频。为此，我们将打印ArUco标记，并粘贴到图像区域的四个角落，如下图所示，然后采集视频，并按顺序分别处理视频的每一帧。

对于每帧图像，首先检测标记。上图中用绿色线条绘制了检测到的ArUco标记。该标记的第一个角点有一个红色小圆圈，可以通过顺时针移动标记来访问第二，第三和第四点。

之后我们应用单应性变换将新的图像放置到视频中的相框位置。其过程与结果如下所示。

图像的替换过程我们可以通过如下代码实现：

C++代码

// Compute homography from source and destination points
Mat h = cv::findHomography(pts_src, pts_dst);


// Warped image
Mat warpedImage;


// Warp source image to destination based on homography
warpPerspective(im_src, warpedImage, h, frame.size(), INTER_CUBIC);


// Prepare a mask representing region to copy from the warped image into the original frame.
Mat mask = Mat::zeros(frame.rows, frame.cols, CV_8UC1);
fillConvexPoly(mask, pts_dst, Scalar(255, 255, 255));


// Erode the mask to not copy the boundary effects from the warping
Mat element = getStructuringElement( MORPH_RECT, Size(3,3) );
erode(mask, mask, element);


// Copy the masked warped image into the original frame in the mask region.
Mat imOut = frame.clone();
warpedImage.copyTo(imOut, mask);

Python代码

# Calculate Homography
h, status = cv.findHomography(pts_src, pts_dst)


# Warp source image to destination based on homography
warped_image = cv.warpPerspective(im_src, h, (frame.shape[1],frame.shape[0]))


# Prepare a mask representing region to copy from the warped image into the original frame.
mask = np.zeros([frame.shape[0], frame.shape[1]], dtype=np.uint8);
cv.fillConvexPoly(mask, np.int32([pts_dst_m]), (255, 255, 255), cv.LINE_AA);


# Erode the mask to not copy the boundary effects from the warping
element = cv.getStructuringElement(cv.MORPH_RECT, (3,3));
mask = cv.erode(mask, element, iterations=3);


# Copy the mask into 3 channels.
warped_image = warped_image.astype(float)
mask3 = np.zeros_like(warped_image)
for i in range(0, 3):
   mask3[:,:,i] = mask/255


# Copy the masked warped image into the original frame in the mask region.
warped_image_masked = cv.multiply(warped_image, mask3)
frame_masked = cv.multiply(frame.astype(float), 1-mask3)
im_out = cv.add(warped_image_masked, frame_masked)

在程序中，将新的场景图像角点作为源点（pts_src），并使用采集图像中图片框内的相应图片角点作为目标点（dst_src）。使用OpenCV中的findHomography函数计算源点和目标点之间的单应性函数h。然后将单应矩阵用于使新图像变形以适合目标框架。新图像被复制到目标帧中。对于视频素材，将此过程在每个帧上重复进行即可。

参考文献

OpenCV Documentation on ArUco markers

Automatic generation and detection of highly reliable fiducial markers under occlusion

Aruco project at Sourceforge

原文地址：https://www.learnopencv.com/augmented-reality-using-aruco-markers-in-opencv-c-python/

作者：Sunita Nayak



目标检测系列秘籍一：模型加速之轻量化网络秘籍二：非极大值抑制及回归损失优化秘籍三：多尺度检测秘籍四：数据增强秘籍五：解决样本不均衡问题秘籍六：Anchor-Free视觉注意力机制系列Non-local模块与Self-attention之间的关系与区别？视觉注意力机制用于分类网络：SENet、CBAM、SKNetNon-local模块与SENet、CBAM的融合：GCNet、DANetNon-local模块如何改进？来看CCNet、ANN
语义分割系列一篇看完就懂的语义分割综述最新实例分割综述：从Mask RCNN 到 BlendMask超强视频语义分割算法！基于语义流快速而准确的场景解析CVPR2020 | HANet:通过高度驱动的注意力网络改善城市场景语义分割

基础积累系列卷积神经网络中的感受野怎么算？
图片中的绝对位置信息，CNN能搞定吗？理解计算机视觉中的损失函数深度学习相关的面试考点总结


自动驾驶学习笔记系列 Apollo Udacity自动驾驶课程笔记——高精度地图、厘米级定位 Apollo Udacity自动驾驶课程笔记——感知、预测 Apollo Udacity自动驾驶课程笔记——规划、控制自动驾驶系统中Lidar和Camera怎么融合？

竞赛与工程项目分享系列如何让笨重的深度学习模型在移动设备上跑起来基于Pytorch的YOLO目标检测项目工程大合集目标检测应用竞赛：铝型材表面瑕疵检测基于Mask R-CNN的道路物体检测与分割
SLAM系列视觉SLAM前端：视觉里程计和回环检测视觉SLAM后端：后端优化和建图模块视觉SLAM中特征点法开源算法：PTAM、ORB-SLAM视觉SLAM中直接法开源算法：LSD-SLAM、DSO视觉SLAM中特征点法和直接法的结合：SVO
2020年最新的iPad Pro上的激光雷达是什么？来聊聊激光SLAM

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

增强现实入门实战，使用ArUco标记实现增强现实的相关文章

分析一下UART IIC SPI驱动编写步骤

1 xff0c 首先都是设置引脚的功能 xff0c 把引脚设置到对应的模式 2 xff0c 然后设置对应串口控制器的一些参数 xff08 也就寄存器的一些参数 xff09 xff0c 完成对串口的基本设置 xff0c 比如UART的波特率等
我现在明白为什么github有些文件不用上传，不然显示的改动很多，实际我们只想看源码的改动，并不想看什么编译出的文件的改动。

我现在明白为什么github有些文件不用上传 xff0c 不然显示的改动很多我们只想看源码的改动我一开始为了想备份整个工程所以干脆整个搜上传 xff0c 后来发现这样以后查看自己的改动 xff0c 反而可能变得比较麻烦 xff0c 因为
rst文件的实时预览（我最后再vscode上实现了）

都是在说一个网站 xff1a http rst ninjs org 但是这个网站挂了 xff0c 似乎得自己下下来在本地跑 https www oschina net p rsted related https zhk me 870 htm
相机标定的目的：获取摄像机的内参和外参矩阵（同时也会得到每一幅标定图像的选择和平移矩阵），内参和外参系数可以对之后相机拍摄的图像就进行矫正，得到畸变相对很小的图像。

相机标定的目的 xff1a 获取摄像机的内参和外参矩阵 xff08 同时也会得到每一幅标定图像的选择和平移矩阵 xff09 xff0c 内参和外参系数可以对之后相机拍摄的图像就进行矫正 xff0c 得到畸变相对很小的图像摘自 xff1a
D435i的接口就是type-c接口，就和我的小米手机的接口一样
电脑主机的两个 USB 接口用一根数据线连起来

链接 xff1a https www zhihu com question 336104107 answer 795676460 USB Host端的DP和DM是有挂15K的下拉电阻 xff0c 但回答中图配错了这个图实际上主要展示了De
ROS查看节点图命令rqt_graph

ROS查看节点图命令rqt graph
PX4飞行模式简单对比梳理（转载）

摘自 xff1a https bbs amovlab com forum php mod 61 viewthread amp tid 61 886 amp extra 61 PX4飞行模式简单对比梳理 PX4飞行模式简单对比梳理 xff1a
recipe for target ‘px4_sitl_default‘ failed这有个出错就重新安装的

AmovLab阿木社区论坛入门学习问答专区 Pixhawk PX4 开发环境搭建 Ubuntu 遇到一些问题返回列表 Mr mystery
搭建无人机仿真环境之PX4安装中出现的一些问题的解决

摘自 xff1a https blog csdn net wangdongjiab article details 107230585 搭建无人机仿真环境之PX4安装 Djarea 2020 07 09 16 02 23 583 收藏 6
启动mavros节点经常看到两条红色报错 reject position controll的原因就是，那个时候T265的位置数据还没有传给飞控，飞控没有位置数据，当然拒绝切到定点模式。

启动mavros节点经常看到两条红色报错 reject position controll的原因就是 xff0c 那个时候T265的位置数据还没有传给飞控 xff0c 飞控没有位置数据 xff0c 当然拒绝切到定点模式而且这个时候你遥控器
px4开源飞控uORB学习笔记

这下面最重要的我觉得是这个图摘自 xff1a https www cnblogs com kinson p 12108591 html px4开源飞控uORB学习笔记 1 uORB是什么 xff0c 起什么作用 xff1f uORB Mi
*T265定点中的/tf消息是谁发布的，为什么是/tf（后来发现激光雷达的cartographer也是发布/tf）,位姿和坐标系变换都是用位置+四元数（欧拉角/旋转）表示的！！！

T265定点中的 tf消息是谁发布的 xff0c 为什么是 tf 可能也是因为讲课 xff0c 倒逼着我把这些真正弄清楚而不是马马虎虎差不多就行了首先我看节点图 xff0c 可以确认tf消息就是摄像头节点发出的我再去realsense
Odometry的发布和发布odom到base_link的tf变换

这里面我觉得重要的话 xff0c 而且我还看到了twist xff0c 这不正是前阵子普罗米修斯群里问的T265发布的带不带速度信息所说到的twist xff1f 导航包使用tf来确定机器人在世界中的位置 xff0c 并将传感器数据与静态地
ROS话题和服务（topic就像UDP，service就像TCP）

看这张图怎么感觉服务有种TCP的味道 xff0c 可靠连接 xff0c 三次握手 xff0c 话题像UDP xff0c 发出去我就不管了看来服务不单单是我请求你响应那么简单 xff0c 还得保证我收到摘自 xff1a https blo
PX4官方手册给的 Auterion 的VIO功能包（用于PX4 T265定点）的代码可以分析一下，感觉写的比vision_to_mavros简单一些

PX4官方手册给的 Auterion 的VIO功能包 xff08 用于PX4 T265定点 xff09 的代码可以分析一下 xff0c 感觉写的比vision to mavros简单一些 https github com Auterion
STM32Cube IDE与MX区别？STM32CubeMX介绍、下载与安装

一 STM32Cube IDE与MX区别 xff1f cubeIDE 61 cubeMX 43 Keil 如您用 keil cubeIDE 61 cubeMX 43 IAR 如您用 IAR cubeIDE 61 cubeMX 43 STUD
手把手教你实现ROS Melodic+Realsense D435i

转载自 xff1a https blog csdn net u013494161 article details 112392528
可以启动D435i的realsense2_camera的launch文件

见我的这篇博文 xff1a https blog csdn net sinat 16643223 article details 114272431
为什么都是source devel文件夹下的setup.bash，是不是只需要找到devel文件夹下的可执行文件就可以了

为什么都是source devel文件夹下的setup bash xff0c 是不是只需要找到devel文件夹下的可执行文件就可以了 xff0c 所以环境变量只需要知道devel文件夹就可以了 xff1f 下面是我的TX2板载计算机上的ba

随机推荐

从ROS功能包的角度分析vins-fusion vins-mono

我直接搜索cmakelists就可以确定它有几个功能包 xff0c 可以看出vins fusion并不是一个功能包是由几个功能包组成的 xff0c 这也和它的目录相符 xff0c 我在看别人使用vins的视频的时候再次印证了我的想法 ht
沈劭劼居然还是大疆的....大疆真的可怕。大疆如果做一款室内无人机不分分钟秒杀其他。

沈劭劼居然还是大疆的大疆真的可怕大疆如果做一款室内无人机不分分钟秒杀其他 https www aiimooc com club exshow htm itemid 908 html
ROS之命名空间

转载自 xff1a https blog csdn net u014587147 article details 75647002 ROS之命名空间小菜虎 2017 07 21 17 02 24 7143 收藏 47 分类专栏 xff1a
ROS----名字空间namespace

这里面很重要的一点就是说出了转载自 xff1a https blog csdn net cookie909 article details 79842334 ROS 名字空间namespace cookie909 2018 04 07 1
ROS源代码阅读（2）：ROS程序的初始化——从ros:init()出发

转载自 xff1a https blog csdn net wanghuiquan0712 article details 78014232 utm medium 61 distribute pc relevant none task bl
双目相机想想也确实需要联合标定这样才能对深度估计得准确啊，联合标定才能真正确定两个相机之间的准确的位置关系，这是估计深度的前提对吧。

双目相机想想也确实需要联合标定这样才能对深度估计得准确啊 xff0c 联合标定才能真正确定两个相机之间的准确的位置关系 xff0c 这是估计深度的前提对吧你理解了单目相机标定的重要性之后 xff0c 应该能比较好理解双目相机的联合标定了
opencv本质是什么，你自己写个opencv工程出来就清楚了（是个类库）

opencv本质是什么 xff0c 你自己写个opencv工程出来就清楚了 xff0c 就像ROS用多了自然知道是什么 https blog csdn net sinat 16643223 article details 115095514
STM32Cube高效开发教程（基础篇）

第一本全面使用STM32CubeMX和STM32CubeIDE作为开发软件 xff0c 系统性地介绍STM32的HAL库开发的书 STM32Cube高效开发教程 xff08 基础篇 xff09 详细目录 STM32Cube高效开发教程 xf
rosparam命令详解

https blog csdn net qq 26234707 article details 112913283
D435i启动遇到control_transfer returned error, index: 768, error: No data available, number: 61

这是我今天准备用D435i跑vins mono遇到的情况 xff0c 主要是启动rs camera launch有这个问题有时还会报这个错误 USB SCP overflow 百度只能搜到一个 xff0c 但是他给的方法没用 xff0c
如何用Realsense D435i运行VINS-Mono等VIO算法获取IMU同步数据（转载）

原来改跑vins改 rs camera launch文件里所修改的负都是参考这篇博文的转载自 xff1a https blog csdn net qq 41839222 article details 86552367 如何用Realse
【VINS-Fusion入门之一】让系统跑起来

转载自 xff1a https blog csdn net wangbaodong070411209 article details 86551370 VINS Fusion入门之一让系统跑起来北络 2019 01 19 13 18 1
单片机: 自定义串口通信协议的实现（转载）

转载自 xff1a https blog csdn net nk test article details 50240933 自定义串口通信协议的实现 weixin 33885253 2017 01 18 21 11 00 1926 收藏
pelco协议及其实现的简单认识

转载自 xff1a https blog csdn net subfate article details 36644419 pelco协议及其实现的简单认识李迟 2014 07 03 13 50 49 6272 收藏 10 分类专栏 x
PELCO-D与PELCO-P协议介绍

转载自 xff1a https blog csdn net wodexiaobaitu article details 43018249 PELCO D与PELCO P协议介绍 wodexiaobaitu 2015 01 22 13 26
开源HTTP解析器---http-parser和fast-http

转载自 xff1a https www cnblogs com arnoldlu p 6497837 html 开源HTTP解析器 http parser和fast http 由于项目中遇到需要发送http请求 xff0c 然后再解析接收到
OpenBTS和硬件平台搭建

OPENBTS安装目标项目使用OpenBTS进行GSM系统仿真 xff0c 用BladeRF进行硬件搭建收发平台所用软硬件版本 Ubuntu 14 04 LTS OpenBTS v 4 0 0 xff1b BladeRF Gnu Ra
OpenBTS for bladeRF代码修改

首先从https github com Nuand dev 上 git clone 下来下载打包的文件 xff0c 接着到本地dev目录下执行 clone sh下载OpenBTS以及它的其他依赖的安装包这里在openbts文件夹Trasc
通信协议/通讯协议有哪些？包含哪些分类？

通讯和通信的区别 xff1f 1 通信与通讯傻傻分得清传统意义上的通讯主要指电话电报电传通讯的讯指消息 xff08 Message xff09 媒体讯息通过通讯网络从一端传递到另外一端媒体讯息的内容主要是话音文字
增强现实入门实战，使用ArUco标记实现增强现实

点击上方 AI算法修炼营 xff0c 选择加星标或置顶标题以下 xff0c 全是干货在本文中 xff0c 我们将介绍ArUco标记以及如何使用OpenCV将其用于简单的增强现实任务 xff0c 具体形式如下图的视频所示一什么是Ar

增强现实入门实战，使用ArUco标记实现增强现实

增强现实入门实战，使用ArUco标记实现增强现实 的相关文章

随机推荐

热门标签

增强现实入门实战，使用ArUco标记实现增强现实的相关文章