DBoW2应用

2023-05-16

图像对应的bag-of-words向量$v_t$

假设词典总共有$W$个单词，那么每一幅图像能够用一个$W$维的向量表示
$（t_1, t_2, t_3, ..., t_W）$其中
\[t_i = \frac{n_{id}}{n_{nd}}\log\frac{N}{n_i}\]
其中，$n_{id}$是单词i在当前帧图像中出现的次数，$n_d$是当前图像中所以单词的数目，$n_i$是词汇$i$在整个数据库中出现的次数，$N$是为所有图像中描述子的数目，$\frac{n_{id}}{n_{nd}}$表示$tf$，$\log\frac{N}{n_i}$表示$idf$，在建立视觉词袋的时候已经得到。

反向索引：描述词汇中的每一个单词在出现过的图像列表，能够加速查找具有相同词汇的图像。（用什么数据结构实现的？）存储一系列$<I_t, v_t^i>$（其中$I_t$为图像的索引，$v_t^i$为该单词在图像中的权重）。查询数据库时只需要比较有相同词汇的图像，加速查找，也就是说搜索图像只需要（1）词袋和（2）反向索引
具体流程如下：提取当前帧的描述子，查询字典，得到单词，查找反向索引表，得到所有具有该单词的图像。

直接索引:（存储每一幅图像的特征）对于每一幅图像$I_t$，存储其使用的词汇的祖先节点（任何一层l）及每一个节点的局部特征$f_{tj}$
直接索引能够加快闭环检测的几何认证，因为只有具有相同的词汇或者在第l层有相同的祖先的关键帧才需要进行几何认证
直接索引存储每一个图像$I_t$中词汇的在第$l$层（预先给定的）的所在的节点已经所有该图像中属于该节点的描述子。

DBow2的作用：通过视觉词汇将一幅图像转换成稀疏的数字向量（能够对大量的图像进行处理）
视觉词汇是离线建立的，通过将描述子空间划分成W个视觉词汇

代码如下：

#include <iostream>
#include <vector>

// DBoW2
//#include "DBoW2/DBoW2.h"
//#include <DUtils/DUtils.h>
//#include <DUtilsCV/DUtilsCV.h> // defines macros CVXX
//#include <DVision/DVision.h>

#include "Thirdparty/DBoW2/DBoW2/FORB.h"
#include "Thirdparty/DBoW2/DBoW2/TemplatedVocabulary.h"
//#include "Thirdparty/DBoW2/DBoW2/FClass.h"

// OpenCV
#include <opencv2/opencv.hpp>
#include "opencv2/core/core.hpp"
#include <opencv/cv.h>
#include <opencv/highgui.h>
#include <opencv2/nonfree/features2d.hpp>
//#include <opencv2/features2d/features2d.hpp>

// ROS
#include <rosbag/bag.h>
#include <rosbag/view.h>
#include <ros/ros.h>
#include <sensor_msgs/Image.h>
#include <boost/foreach.hpp>
#include <cv_bridge/cv_bridge.h>

#include "ORBextractor.h"

#include <dirent.h>
#include <string.h>

using namespace DBoW2;
using namespace DUtils;
using namespace std;
using namespace ORB_SLAM;

// - - - - - --- - - - -- - - - - -

/// ORB Vocabulary
typedef DBoW2::TemplatedVocabulary<DBoW2::FORB::TDescriptor, DBoW2::FORB>
ORBVocabulary;

/// ORB Database
//typedef DBoW2::TemplatedDatabase<DBoW2::FORB::TDescriptor, DBoW2::FORB>
//ORBDatabase;

// - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

void extractORBFeatures(cv::Mat &image, vector<vector<cv::Mat> > &features, ORBextractor* extractor);
void changeStructureORB( const cv::Mat &descriptor,vector<bool> &mask, vector<cv::Mat> &out);
void isInImage(vector<cv::KeyPoint> &keys, float &cx, float &cy, float &rMin, float &rMax, vector<bool> &mask);
void createVocabularyFile(ORBVocabulary &voc, std::string &fileName, const vector<vector<cv::Mat> > &features);

// ----------------------------------------------------------------------------

int main()
{
    //Extracting ORB features from image folder
    vector<std::string> filenames;
    std::string folder = "/home/saodiseng/FRONTAL/";

    cv::glob(folder, filenames);

    // initialze     ORBextractor
    int nLevels = 5;//6;
    ORBextractor* extractor = new ORBextractor(1000,1.2,nLevels,1,20);
    int nImages = filenames.size();

    vector<vector<cv::Mat > > features;
    features.clear();
    features.reserve(nImages);

    //cv_bridge::CvImageConstPtr cv_ptr;
    cv::Mat image;

    //cout << "> Using bag file: " << bagFile << endl;
    cout << "> Extracting Features from " << nImages << " images..." << endl;
    //BOOST_FOREACH(rosbag::MessageInstance const m, viewTopic)
    for(int i = 0; i < nImages; ++i)
    {
        //sensor_msgs::Image::ConstPtr i = m.instantiate<sensor_msgs::Image>();
        std::cout << "Processing the " << i <<" image " << std::endl;
        cv::Mat src = cv::imread(filenames[i]);
        imshow("View", src);
        cv::waitKey(1);
        if (!src.empty())
        {
            //cv_ptr = cv_bridge::toCvShare(i);
            cv::cvtColor(src, image, CV_RGB2GRAY);
            extractORBFeatures(image, features, extractor);
        }

    }

    //bag.close();

    cout << "... Extraction done!" << endl;

    // Creating the Vocabulary
    // define vocabulary
    const int k = 10; // branching factor
    const WeightingType weight = TF_IDF;
    const ScoringType score = L1_NORM;
    ORBVocabulary voc(k, nLevels, weight, score);

    std::string vociName = "vociOmni.txt";

    createVocabularyFile(voc, vociName, features);

    cout << "--- THE END ---" << endl;
    
    return 0;
}


// ----------------------------------------------------------------------------

void extractORBFeatures(cv::Mat &image, vector<vector<cv::Mat> > &features, ORBextractor* extractor) {
    vector<cv::KeyPoint> keypoints;
    cv::Mat descriptorORB;
    // extract
    (*extractor)(image, cv::Mat(), keypoints, descriptorORB);

    // reject features outside region of interest
    vector<bool> mask;

    float cx = 0; float cy = 0;
    float rMin = 0; float rMax = 0;
    isInImage(keypoints, cx, cy, rMin, rMax, mask);

    // create descriptor vector for the vocabulary
    features.push_back(vector<cv::Mat>());
    changeStructureORB(descriptorORB, mask, features.back());
    imshow("ORBFeature", features.back().back());
}

// ----------------------------------------------------------------------------

void changeStructureORB( const cv::Mat &descriptor,vector<bool> &mask, vector<cv::Mat> &out) {
    for (int i = 0; i < descriptor.rows; i++) {
        if(mask[i]) {
            out.push_back(descriptor.row(i));
        }
    }
}

// ----------------------------------------------------------------------------

void isInImage(vector<cv::KeyPoint> &keys, float &cx, float &cy, float &rMin, float &rMax, vector<bool> &mask) {
    int N = keys.size();
    mask = vector<bool>(N, false);
    int num = 0;
    for(int i=0; i<N; i++) {
        cv::KeyPoint kp = keys[i];

        float u = kp.pt.x;
        float v = kp.pt.y;

        if(u>20 && u<320-20 && v>20 && v<240-20)
        {
            mask[i] = true;
            num ++;
        }
    }
    std::cout << "In image number " << num << std::endl;

}

// ----------------------------------------------------------------------------

void createVocabularyFile(ORBVocabulary &voc, std::string &fileName, const vector<vector<cv::Mat> > &features)
{

    cout << "> Creating vocabulary. May take some time ..." << endl;
    voc.create(features);
    cout << "... done!" << endl;

    cout << "> Vocabulary information: " << endl
        << voc << endl << endl;

    // save the vocabulary to disk
    cout << endl << "> Saving vocabulary..." << endl;
    voc.saveToTextFile(fileName);
    cout << "... saved to file: " << fileName << endl;
}

基于DBoW2做闭环检测

A.查询数据库
通过数据库存储和检索相似的所有图像。步骤为：首先将图像图像转换成bag-of-words向量$v_t$（$tf-idf$，开头的公式），然后查找数据库中最相似的bag-of-words向量集，$s(v_t,v_{ti})$（多少个？？）->正则化（$s(v_t,v_{t- \Delta t}$）很小的情况单独考虑）为$\eta (v_t, v_{t_j})=\frac{s(v_t,v_{t_j})}{s(v_t, v_{t-\Delta t})}$->舍弃小于阈值的匹配
计算两个bag-of-word向量（两帧图像）1和v2的相似度
\[s(v_1, v_2)=1-\frac{1}{2}\vert \frac{v_1}{\vert v_1\vert}-\frac{v_2}{\vert v_2\vert}\vert\]

B.匹配聚类
为了防止时间上很近的关键帧之间相互竞争，将检索得到的时间戳相差比价小的帧聚成island并将它们看做一个匹配，一系列匹配可以转换成一个匹配$<v_t, V_{T_i}>$，island也根据评分排序，选择最高的。Island的得分为$ H(v_t, V_{T_i})=\sum_{j=n_i}^{m_i}\eta(v_t, v_{t_j})$。

C.Temporal consistency（时间一致性）
检测$V_{T_i}$和以前的查询结果$<v_{t-\Delta t},V_{T_j}>$的$T_i,T_j$时间一致性，$<v_t,V_{T_i}>$必须和k个以前的匹配查询结果$<v_{t-\Delta t},V_{T_j}>$一致($k$个以前的匹配的island时间$T_i$接近重叠)，一旦通过一致性检验，则选取island$V_{T_i}$中得分最高的词汇$v_{t'}$

D.有效的几何一致性
用RANSAC方法得到$I_t$和$I_t'$的基础矩阵（至少12个对应点），查找对应的特征点（brute force和k-d tree方法）
使用直接索引近似最近邻（字典树中属于第l层的同一个节点，$l$提前设定，是速度和recall的折中）具体做法为：
（1）往数据库中加入图像时，在直接索引中存储节点和一些特征的对；
（2）在得到图像间的对应点时，在直接索引中查找只有在第l层属于同一个节点的描述子，并进行比较。这个方法能够提高对应点计算，l是提前固定的是对应点数目和进行该操作的时间的折中。

转载于:https://www.cnblogs.com/jian-li/p/5666556.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DBoW2

DBoW2应用的相关文章

C++学习——数组的替代品vector

模板类vector 模板类vector类似于string类 xff0c 也是一种动态数组您可以在运行阶段设置vector对象的长度 xff0c 可在末尾附加新数据 xff0c 还可在中间插入新数据基本上 xff0c 它是使用new创建动
磁盘结构损坏且无法读取

以下纯数个人见解如有疑问请留言 xff0c 共同讨论造成这个问题的原因完全是由于BT造成的或者是这一类BTB类的软件大家有兴趣的朋友可以仔细注意一下 xff0c 凡是自己常用BT的 xff0c 我估计大多都会发生这个问题现在我要
matlab中设置colorbar为几种规定颜色

我们可以通过修改colormap的值来达到这种目的一般来说colormap的值是64 3的矩阵 xff0c 64代表64种颜色 xff0c 3列是这种颜色的RGB值 xff0c 不过归一化了如果你想将colorbar颜色设成6种 xff
docker pull报错failed to register layer: Error processing tar file(exit status 1): open permission de...

近来在一个云主机上操作docker pull xff0c 报错如下 xff1a failed to register layer Error processing tar file exit status 1 open etc init d
echarts 图例显示到右边

原 xff1a legend data 39 同龄普通孩子 39 39 已具备技能 39 39 已泛化技能 39 39 已掌握技能 39 39 学习中 39 改 xff1a legend data 39 同龄普通孩子 39 39 已具备技能
PX4的启动脚本

以前STM32的PX4的时候 xff0c 启动脚本是工程的ROMFS px4fmu commom init d里面的rcs里面在高通平台里面 xff0c 启动脚本是在工程的posix configs eagle flight 里面的px4
如何在Ubuntu上搭建WordPress网站，并公网可访问 17-17

系列文章如何在Ubuntu上搭建WordPress网站 xff0c 并公网可访问 1 17如何在Ubuntu上搭建WordPress网站 xff0c 并公网可访问 2 17如何在Ubuntu上搭建WordPress网站 xff0c 并公网
《深入理解Linux内核3rd》学习笔记——进程切换（上）：相关知识

进程切换 xff08 process switch xff09 xff0c 作为抢占式多任务OS中重要的一个功能 xff0c 其实质就是OS内核挂起正在运行的进程A xff0c 然后将先前被挂起的另一个进程B恢复运行硬件上下文每个进程都
Windows命令查看文件MD5

certutil hashfile filename MD5 certutil hashfile filename SHA1 certutil hashfile filename SHA256 转载于 https www cnblogs c
百度2013校园招聘移动软件研发工程师笔试题(二)

百度2013校园招聘移动软件研发工程师笔试题二第一题 1 xff1a 用C 43 43 JAVA Objective c C 解释 xff0c 怎么实现面向对象特征 2 xff1a 第二小题 xff1a 用Java或C 43 43 编写
Python人工智能第一篇：语音合成和语音识别

Python人工智能第一篇 xff1a 语音合成和语音识别此篇是人工智能应用的重点只用现成的技术不做底层算法也是让初级程序员快速进入人工智能行业的捷径目前市面上主流的AI技术提供公司有很多比如百度阿里腾讯主做语音的科大讯飞
Python人工智能第二篇：人脸检测和图像识别

Python人工智能第二篇 xff1a 人脸检测和图像识别人脸检测详细内容请看技术文档 xff1a https ai baidu com docs Face Python SDK top code from aip import Aip
使用STM Studio进行电机测量

使用STM Studio进行电机测量软件环境 xff1a 操作系统 xff1a win10 企业版 xff08 由家庭普通版升级之前存在自动更新现在已经被尝试关闭自动更新 xff09 IAR for ARM 8 30 1 17148
为方便旅客，某航空公司拟开发一个机票预定系统。旅行社把预定机票的旅客信息......

为方便旅客 xff0c 某航空公司拟开发一个机票预定系统旅行社把预定机票的旅客信息姓名性别工作单位身份证号码旅行时间旅行目的地等输入进入该系统 xff0c 系统为旅客安排航班 xff0c 印出取票通知和账单 xff0c 旅客
前端调用后端接口返回200（成功状态码），后端有返回，但是控制台Network Response为空，没展示任何信息...

解决方法 xff1a 1 在js里面debugger xff0c 可以看到后台是否有返回数据 2 直接console log xff0c 直接把返回值打印出来 xff0c 查看返回的数据格式 xff0c 方便前端进行数据的处理 PS xff
IDM下载百度资源出现403的解决方法

测试发现是受cookie的影响 xff0c 百度为了防止用外部下载工具突破限速加入了cookie验证 xff0c 因为一般的下载工具请求下载的时候不会附加cookie信息 IDM就是这样 xff0c 它请求下载文件时只知道文件的下载地址 x

随机推荐

一些黄页网站

1 http www chinabig com http www chinabig com v07 product product sitemap htm 10 2 www ypinfo com 3 www chinapages com 转
【免费内网穿透】公网环境下，Windows系统远程桌面控制树莓派

系列文章免费内网穿透公网环境下 xff0c Windows系统远程桌面控制树莓派无需公网IP 为远程桌面树莓派配置固定的公网TCP端口地址远程桌面控制树莓派 xff0c 我们可以用xrdp协议来实现 xff0c 它内部使用的是win
如何两个月刷400道leetcode

前言随着互联网寒潮的到来越来越多的互联网公司提高了面试的难度 xff0c 其中之一就是加大了面试当中手撕算法题的比例这里说的算法题不是深度学习 xff0c 机器学习这类的算法 xff0c 而是排序 xff0c 广度优先 xff0c 动
DE1-SOC开发板使用学习

1 Yocto build utility 工具是什么 xff1f Linux Console with framebuffer是什么 xff1f 2 文档里面有几个Linux发布版本的 xff0c 分别是ubuntu和LXDE版本 LXD
在shell脚本的第一行中，必须写#!/bin/bash吗？

可以不写执行时手工执行 bin sh xxxx sh 效果是一样的 bin sh 表示本脚本由 bin 路径的sh程序来解释跟命令行下 xff03 通常用作注释 xff0c 但是 xff03 xff01 放在一起就标志着这是一个shel
android架构中最底层是什么层,Android体系架构

Android开发入门教程一丶了解手机通讯技术发展史1 第一代通讯技术第一代通讯技术简单来说就是大哥大其原理是通过模拟信号进行传输 1 说话的时候产生声波震动 2 声波震动会让大哥大中的铜片产生震动 3 铜片震动会让其电容产生变化
linux桌面lxde 安装_Archlinux LXDE 桌面环境安装配置

安装 LXDE LXDE 是模块化的你可以从下面的列表中挑选你需要的包 xff0c 所有的包都可以通过pacman下载安装得到他们大多数都在extra和community仓库中如果你要安装像 LXAppearance 和 LXNM 这
PX4 FMU启动流程 2. 二、 nsh_initscript

PX4 FMU启动流程 2 二 nsh initscript PX4 FMU启动流程 2 二 nsh initscript 转载请注明出处 2014 11 27 冷月追风
Eigen库

MatrixXd表示任意size的矩阵 xff0c 元素类型为double VectorXd表示任意size的向量 xff0c 元素类型为double 创建3 1的向量v xff0c 并赋值为1 2 3 VectorXd v 3 v lt
亲爱的热爱的百度云全集资源

网盘链接转载于 https www cnblogs com awesome share p 11234341 html
解决Docker容器 iptables问题---docker: Error response from daemon: driver failed programming external conne...

一问题现象最近在研究Docker容器日志管理时 xff0c 启动容器出现iptables相关报错 xff0c 具体问题如下运行容器 root 64 node 11 docker run d p 24224 24224 p 24224
内网穿透远程查看内网监控摄像头

在现代社会中 xff0c 大家总是奔波于家和公司之间大部分时间用于工作中 xff0c 也就很难及时知晓家中的动态情况 xff0c 对于家中有老人小孩或宠物的 xff08 甚至对居住环境安全不放心的 xff09 xff0c 这已然是个棘手
2022/6/15 docker安装与项目部署(入门教程)

目录一丶docker简介二丶Docker私库简介 xff08 Dockerhub xff09 三丶Docker优势四丶docker安装 4 1 使用官方安装脚本自动安装 xff08 仅适用于公网环境 xff09 4 2 手动安装 4
vim实现批量注释和批量删除注释

批量注释 1 进入文档 xff0c vim test txt 后 xff0c 按住ctrl 43 v进入VISUAL BLOCK模式 xff0c 上下选择需要注释的行 2 按大写键 xff0c 再按i xff0c 或者直接按shift 43
20191003

A 把字典树建出来 xff0c 问题就转化成要选择m个节点 xff0c 使得它们能覆盖所有叶子节点 xff0c 且不存在两个节点使得一个是另一个的祖先于是可以在字典树上跑树形dp xff0c 复杂度 O n 2m 或 O nm 2 xff
20191004

A 解 1 我们发现只需要关心处于结果字符串前 k 位的字符因此考虑从后往前处理对于一个询问区间 xff0c 我们暴力连边 xff0c 用并查集维护 xff0c x 的父亲等于 y 相当于位于 x 的字符是从位于 y 的字符处复制过来的
git 如何解决 (master|MERGING)

git 如何解决 master MERGING git reset hard head 回退版本信息 git pull origin master 转载于 https www cnblogs com 651434092qq p 110188
linux ping 指定次数

ping 192 168 0 1 c4 转载于 https www cnblogs com sea stream p 10345600 html
java 解决 java.lang.Integer cannot be cast to java.lang.String

1 在执行代码打印map的value时 xff0c 提示错误java lang Integer cannot be cast to java lang String xff0c 这个错误很明显是类型转换错误查看表字段的数据解决方案 1
DBoW2应用

图像对应的bag of words向量 v t 假设词典总共有 W 个单词 xff0c 那么每一幅图像能够用一个 W 维的向量表示 xff08 t 1 t 2 t 3 t W xff09 其中 t i 61 frac n id n nd l

DBoW2应用

图像对应的bag-of-words向量\(v_t\)

基于DBoW2做闭环检测

DBoW2应用 的相关文章

随机推荐

热门标签

DBoW2应用的相关文章