OpenCV SIFT 描述符关键点半径

2024-05-19

我正在深入研究OpenCV的SIFT描述符提取的实现 https://github.com/Itseez/opencv/blob/master/modules/nonfree/src/sift.cpp。我发现了一些令人费解的代码来获取兴趣点邻域的半径。下面是带注释的代码，变量名称已更改为更具描述性：

// keep octave below 256 (255 is 1111 1111)
int octave = kpt.octave & 255;
// if octave is >= 128, ...????
octave = octave < 128 ? octave : (-128 | octave);
// 1/2^absval(octave)
float scale = octave >= 0 ? 1.0f/(1 << octave) : (float)(1 << -octave);
// multiply the point's radius by the calculated scale
float scl = kpt.size * 0.5f * scale;
// the constant sclFactor is 3 and has the following comment:
// determines the size of a single descriptor orientation histogram
float histWidth = sclFactor * scl;
// descWidth is the number of histograms on one side of the descriptor
// the long float is sqrt(2)
int radius = (int)(histWidth * 1.4142135623730951f * (descWidth + 1) * 0.5f);

我知道这与转换为获取兴趣点的比例有关（我已阅读 Lowe 的论文），但我无法将这些点连接到代码。具体来说，我不明白前三行和最后一行。

我需要理解这一点才能为运动创建类似的局部点描述符。

我不明白前 3 行

事实上这个 SIFT 实现encodes内的几个值KeyPoint octave属性。如果您参考line 439 https://github.com/Itseez/opencv/blob/173442bb2ecd527f1884d96d7327bff293f0c65a/modules/nonfree/src/sift.cpp#L439你可以看到：

kpt.octave = octv + (layer << 8) + (cvRound((xi + 0.5)*255) << 16);

这意味着八度音程存储在第一个字节块中，层存储在第二个字节块中，等等。

So kpt.octave & 255（可以在unpackOctave方法）只是屏蔽关键点八度音程以检索有效八度音程值。

另外：此 SIFT 实现使用负的第一个八度音程（int firstOctave = -1）以处理更高分辨率的图像。由于八度音阶索引从 0 开始，因此计算映射：

octave index = 0 => 255
octave index = 1 => 0
octave index = 2 => 1
...

该映射是在以下位置计算的line 790 https://github.com/Itseez/opencv/blob/173442bb2ecd527f1884d96d7327bff293f0c65a/modules/nonfree/src/sift.cpp#L790:

kpt.octave = (kpt.octave & ~255) | ((kpt.octave + firstOctave) & 255);

因此上面的第二行只是映射回这些值的一种方法：

octave = 255 => -1
octave = 0   => 0
octave = 1   => 1
..

第三行只是计算音阶的一种方法，考虑到负八度给出的音阶 > 1，例如1 << -octave给出 2 为octave = -1这意味着它的大小增加了一倍。

[我不明白]最后一行。

基本上它对应于包裹尺寸平方块的圆的半径D，因此sqrt(2)并除以 2。D通过乘法计算：

关键点尺度，
放大倍数 = 3,
描述符直方图的宽度 = 4，向上舍入到下一个整数（因此为 +1）

事实上，您可以在其中找到详细的描述vlfeat 的 SIFT 实现 https://github.com/vlfeat/vlfeat/blob/38a03e12daf50ee98633de06120834d0d1d87e23/vl/sift.c#L1948:

每个空间仓的支持度扩展为SBP = 3sigma 像素，其中 sigma 是关键点的比例。因此所有的 bin 一起具有支持 SBP x NBP 像素宽。自从使用像素加权和插值，支持扩展另一个半箱。因此，支撑体是一个方形窗口 SBP x (NBP + 1) 像素。最后，由于补丁可以任意旋转，我们需要考虑一个窗口 2W += sqrt(2) x SBP x (NBP + 1) 像素宽。

最后强烈推荐大家参考一下这个vlfeat SIFT 文档 http://www.vlfeat.org/api/sift.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenCV SIFT 描述符关键点半径的相关文章

CMake 找不到请求的 Boost 库

既然我已经浏览了其他人的解决方案几个小时但找不到适合我的问题的正确答案我想将我的具体问题带给您我正在尝试使用 CMake 构建 vsomeip 为此我之前构建了 boost 1 55 但是我在 CMake 中收到以下错误 The
json.net自定义jobject反序列化

我正在尝试使用 JsonConvert DeserializeObject string 将字符串反序列化为可与动态一起使用的 jobject 来动态访问 json 文档但是我想避免知道文档的大小写以便我可以输入 dynamic doc
检测wlan是否关闭

任何人都可以给我一个提示如何在 Windows Phone 上以编程方式检测 C 8 1 应用程序不是 8 0 是否启用禁用 WLAN 我不想更改这些设置只是需要知道该解决方案是一个 Windows 8 1 通用应用程序 Wind
从模板切换传递的类型

在 C 中是否可以检查传递给模板函数的类型例如 template
是否存在指向不同类型的指针具有不同大小的平台？

C 标准允许指向不同类型的指针具有不同的大小例如sizeof char sizeof int 是允许的但是它确实要求如果将指针转换为void 然后转换回其原始类型它必须与其原始值进行比较因此从逻辑上来说 sizeof void
如何制作可启动程序？

所以这个问题可能看起来很奇怪但假设我编译了 int main void int x 3 int y 4 int z x y 是否可以让CPU这样运行如何例如这允许我写入监视器吗如果我没记错的话内存中有些地方可以写入要显示的内容
为什么'enable_if'不能用于禁用这里声明

include
在 omp 并行 for 循环中使用 unique_ptr 会导致 SEG.FAULT

采取以下代码 include
访问 ascx 文件中的母版页控件

我有一个母版页文件其中包含 2 个面板控件中的 2 个菜单我还使用控件来检查用户是否登录并获取用户类型根据我想要显示隐藏面板的类型控件本身不在母版页中引用而是通过 CMS 系统动态引用我想在用户控件中使用findcontrol
UI 函数在快速事件完成之前触发

我有一个停靠在 Silverlight 应用程序中的 Web 浏览器框架有时会在其上弹出全窗口 XAML Silverlight UI 元素我已经或多或少修复了一个老问题即 Web 框架的内容似乎与 Silverlight 内容不能很
C#6 中的长字符串插值行

我发现虽然字符串插值在应用于现有代码库的字符串 Format 调用时非常好但考虑到通常首选的列限制字符串对于单行来说很快就会变得太长特别是当被插值的表达式很复杂时使用格式字符串您将获得一个可以拆分为多行的变量列表 var str
在 asp.net MVC 中使用活动目录进行身份验证

我想使用活动目录对我的 asp net mvc 项目中的用户进行身份验证在网上冲浪了几个小时后我没有找到任何对我有用的东西我已经看到了所有结果但什么也没有我尝试按照许多帖子的建议编辑我的 web config 如果有人可以帮助我提
为什么 Cdecl 调用在“标准”P/Invoke 约定中经常不匹配？

我正在开发一个相当大的代码库其中 C 功能是从 C P Invoked 的我们的代码库中有很多调用例如 C extern C int stdcall InvokedFunction int 使用相应的 C DllImport CPlu
在谷歌Colab中使用cv2.imshow()

我正在尝试通过输入视频来对视频进行对象检测 cap cv2 VideoCapture video3 mp4 在处理部分之后我想使用实时对象检测来显示视频 while True ret image np cap read Expand di
使用 GCC 生成可读的程序集？

我想知道如何使用GCC http en wikipedia org wiki GNU Compiler Collection在我的 C 源文件中转储机器代码的助记符版本这样我就可以看到我的代码被编译成什么你可以使用 Java 来做到这一
如何从 Rx Subscribe 回调异步函数？

我想回调 Rx 订阅中的异步函数例如像那样 public class Consumer private readonly Service service new Service public ReplaySubject
Linux mremap 不释放旧映射？

我需要一种方法将页面从一个虚拟地址范围复制到另一个虚拟地址范围而无需实际复制数据范围很大延迟很重要 mremap 可以做到这一点但问题是它也会删除旧的映射由于我需要在多线程环境中执行此操作因此我需要旧映射能够同时使用因此稍后当
如何调试 .NET 运行时中的内部错误？

我正在尝试调试一些处理大文件的工作代码本身works 但 NET 运行时本身会报告零星错误对于上下文这里的处理是一个 1 5GB 文件仅加载到内存中一次在循环中处理和释放故意尝试重现此否则不可预测的错误我的测试片段基本上是 t
C++ 中 void(*)() 和 void(&)() 之间的区别[重复]

这个问题在这里已经有答案了在此示例代码中 func1是类型void int double and funky是类型void int double include
为什么匹配模板类上的部分类模板特化与没有模板匹配的另一个部分特化不明确？

这个问题可能很难用标题中的句子来描述但这里有一个最小的例子 include

随机推荐

javax.persistence.Table.indexes()[Ljavax/persistence/Index 中的 NoSuchMethodError

我有一个 Play Framework 应用程序并且我was使用 Hibernate 4 2 5 Final 通过 Maven 依赖项管理器检索我决定升级到 Hibernate 4 3 0 Final 成功重新编译我的应用程序并运行它
如何更改 aptana studio 的背景颜色？

如何将 Aptana IDE 或整个主题的黑色背景更改为其他背景例如蓝色正如 gyozo 在评论中提到的对于蓝色主题请使用窗口 gt 首选项 gt Aptana Studio gt 主题并选择 Eclipse 主题
如何获得 JavaScript 阶乘程序的循环来显示所使用的工作？

你好我面临着用 JavaScript 编写一个程序的挑战尽管我对它不太了解但它要求用户输入一个数字然后计算该数字的阶乘我使用了已经提出的问题并设法使计算正常工作但无法获得所需的输出我必须在以下输出中获取它而不使用任何花哨的库
用javascript调用外部网页（跨域）

我正在尝试使用以下网络服务来验证提要这个问题 https stackoverflow com questions 11996430 check if a url is a valid feed 但浏览器不允许我向另一台服务器发送 ajax
如何将十六进制字符串转换为无符号长整型？

我有以下十六进制值 CString str str T FFF000 如何将其转换为unsigned long 您可以使用strtol作用于常规 C 字符串的函数它使用指定的基数将字符串转换为 long long l strtol str
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import
Jackson 将单个项目反序列化到列表中

我正在尝试使用一项服务该服务为我提供了一个带有数组字段的实体 id 23233 items name item 1 name item 2 但是当数组包含单个项目时将返回该项目本身而不是包含一个元素的数组 id 43567 item
Swagger/Openapi-Annotations：如何使用 $ref 生成 allOf？

我正在生成 Rest 端点包括添加OpenAPI Swagger对生成的代码进行注释虽然它对于基本类型运行得很好但我在自定义类方面遇到了一些问题现在我有很多自定义类的重复架构条目使用 Schema 实现 MyClass class
我可以将 MongoDB 与实体框架一起使用吗？

实体框架有可能支持MongoDB数据库吗有人写过实体框架MongoDB Provider吗简短的回答不这肯定是可能的但不合理 MongoDB 是文档数据库不支持集合之间的任何物理关系 EF 非常适合 SQL MySQL 等关系数
不区分大小写的字符串比较 C++ [重复]

这个问题在这里已经有答案了我知道有一些方法可以进行忽略大小写的比较其中涉及遍历字符串或一个good one https stackoverflow com questions 11635 case insensitive string
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA
使用 VBA 通过 Access 导航网页/操作 IE

你好 StackOverflow 社区我有一个关于使用 Access VBA 操作 IE 的问题本质上我正在尝试编写代码使用 IE 打开特定网页在该页面中搜索特定链接目标链接的名称将取决于用户的情况通过以编程方式单击该链接导航
我可以让 swagger-php 在查询字符串上使用数组吗？

我使用 Swagger php 当我定义查询字符串上的参数时它可以是一个数组但据我所知它不支持这种查询字符串 https api domain tld v1 objects q 1 q 5 q 12 我相信这会被设定in the co
如何将容器管理事务 (CMT) 与 JBoss AS 6、Hibernate 3.6、JPA、JTA 和 EJB3 结合使用

我正在尝试使用 CMT 设置网络应用程序我已经让它在 Eclipse 中独立运行了现在我尝试使用 Struts 1 0 让它在 Jboss AS 6 中工作我选择 CMT 是因为我读过的 doco 暗示它是最好的并且使用起来最简单
使用适用于 Android 和 ios 的 Angular NativeScript 的透明选项卡栏和操作栏

我想让标签栏透明操作栏在滑动布局或页面上透明操作栏或选项卡栏必须位于页面顶部就像两层一样我尝试过使用 css 使其透明但它在页面上并没有变得透明
JQuery 删除和内存泄漏

我正在开发一个游戏我看到了很多内存消耗我使用jquery animate 动画完成后我 remove 元素我的问题是从 dom 树中删除一个元素后对象还存在记忆中吗 Javascript 是一种垃圾收集语言这意味着当没有代码保
ubuntu：升级软件（cmake）-版本消歧（本地编译）[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我的机器上安装了 cmake 2 8 0 来自 ubuntu 软件包二进制文件放置在 usr bin cmake 中我需要将 cmake 版本至少
使用 IIS 发布：找不到服务器 DNS

我正在尝试使用 IIS 发布我的项目我能够通过 Visual Studio 发布它 La aplicaci n web se public correctamente file D www plataformafantasy com Co
在 Google 地图上绘制线条/路径

我很长一段时间都在忙于寻找如何在 HelloMapView 中的地图上的两个 GPS 点之间画一条线但没有运气谁能告诉我该怎么做假设我使用扩展 MapView 的 HelloMapView 我需要使用叠加层吗如果是这样我是否必须重
OpenCV SIFT 描述符关键点半径

我正在深入研究OpenCV的SIFT描述符提取的实现 https github com Itseez opencv blob master modules nonfree src sift cpp 我发现了一些令人费解的代码来获取兴趣点邻域

OpenCV SIFT 描述符关键点半径

OpenCV SIFT 描述符关键点半径 的相关文章

随机推荐

热门标签

OpenCV SIFT 描述符关键点半径的相关文章