vl_dsift 尝试获取每个像素的特征向量

2024-03-10

我正在尝试使用 vl_dsift 获取每个像素的 128*1 特征向量。因此我希望得到的矩阵具有大小

128*（像素数）

然而，当我在尺寸为 (192*168) 的图像上使用它时，生成的描述符给出尺寸 (128*31,185)，binsize 为 1，放大系数为 1。

I = imread('Faces\yaleB11_P00A-130E+20.pgm');
size(I)

figure
imshow(I)

binSize = 1 ;
magnif = 1 ;
Is = vl_imsmooth(single(I), sqrt((binSize/magnif)^2 - .25)) ;
[f, d] = vl_dsift(single(I), 'size', binSize) ;

size(f)
size(d)

恐怕您无法提取图像中所有像素的特征向量。

正如您可以从以下链接中的图“密集 SIFT 描述符几何”中看到的那样（http://www.vlfeat.org/api/dsift.html http://www.vlfeat.org/api/dsift.html）密集筛选从 4×4 窗口中提取特征。由于该框无法移出图像，因此 4×4 窗口的左上角 bin 可以位于第一个像素，即 (1,1)。因此，在这种情况下（假设 bin 大小为 1），4×4 窗口的中心位于 (2.5, 2.5)，换句话说，位于 x 和 y 方向上的第二个和第三个像素之间。请注意，在这种情况下，4×4 窗口覆盖 16 个像素，即 [1,4] x [1,4] 像素。

现在说出你的图像大小为 n×m。以同样的方式，当 4×4 窗口的右下 bin 位于最后一个像素（n,m 处的像素）时，4×4 窗口的中心将位于 [n-1.5, m-1.5]。在您的情况下，您的功能将从 2.5 x 2.5 像素开始，以 190.5 x 166.5 结束

所以底线是 4×4 窗口的中心从 ' 沿 X 方向移动XMIN + 3/2 * SIZE”到“MAX - 3/2 * SIZE”，步长为“STEP”。其中 XMIN 和 XMAX 分别是 X 方向上的第一个和最后一个像素。 Y 轴相同（请参阅链接中的底部段落“几何结构的更多详细信息”http://www.vlfeat.org/matlab/vl_dsift.html http://www.vlfeat.org/matlab/vl_dsift.html）。结果，4×4 窗口遍历整个图像。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

vl_dsift 尝试获取每个像素的特征向量的相关文章

使用 mongoose 通过 React 应用程序将图像上传到 mongodb 数据库

我正在为找到的对象创建一个反应应用程序我想允许用户上传这些对象的照片我尝试使用 axios 通过 post 请求将图像发送到猫鼬服务器但它不起作用这就是我如何将图像存储在带有预览的 React 组件中 handleImage eve
将向量（或弧）绘制到玫瑰图上。 MATLAB

我有两个数据集其中详细列出了angles 我正在绘制玫瑰图 angles 0 8481065519 0 0367932161 2 6273740453 n 另一个从这组角度详细说明方向统计 angle error 0 848106563
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
下载后从谷歌照片库检索图像

我正在发起从图库中获取照片的意图当我在图库中使用 Nexus 谷歌照片应用程序时一切正常但如果图像不在手机上在 Google Photos 在线服务上它会为我下载选择图像后我将图像发送到另一个活动进行裁剪但在下载的情况下发
MATLAB：将当前文件夹设置为脚本位置

我在不同的文件夹中有一些脚本和数据我使用addpath和相对路径经常我的问题是只有当我的当前文件夹是我执行的脚本所在的位置时这才有效例如如果我执行添加路径 X 的脚本 A 然后执行位于路径 X 中的脚本 B 则 Matlab 不
使用 ImageMagick 和 PHP 将 PNG 转换为 JPG 并将透明背景设置为白色

将图像从 PNG 转换为 JPEG 时如何使用 ImageMagick 带有 php 扩展将透明背景设置为白色在撰写本文时您尚未指定正在使用哪个扩展但如果您使用命令行则命令将是 convert image png backgro
使用简单矩阵乘法时出错

我在一次简单的乘法运算中偶然发现了一个错误这让我感到非常惊讶我一直以为这里发生了什么只为矩阵乘法 http www mathworks nl help matlab matlab prog operators html x 2 y z
沿着预定路径移动图像？

是否可以通过按下 iphone SDK 中的按钮来将图像设置为沿着预定路径运动我不是在寻找任何奇特的东西我正在研究一个简单的概念但这会节省大量动画工作是的您可以通过创建一个路径来为任何 CALayer 制作动画CAKeyframe
MATLAB 变量传递和惰性赋值

我知道在 Matlab 中当将新变量分配给现有变量时会进行惰性评估例如 array1 ones 1 1e8 array2 array1 的价值array1不会被复制到array2除非元素array2被修改由此我推测Matlab中
优先连接，Matlab 中的复杂网络

大家好我现在正在 MATLAB 中研究优先附件模型在理解以下内容时遇到一些困难假设我一开始有 4 个节点连接如下 time 0 1 lt gt 2 3 lt gt 4 在下一个时间步骤中我添加一个节点和 4 个连接然后添加另一个
pytesseract 无法从图像中识别复杂的数学公式

我在用pytesseractpython 中的模块 pytesseract从图像中识别文本但它不适用于包含复杂数学公式例如根推导积分数学问题或方程的图像代码2 py Import modules from PIL import
两个图像之间的视频变形，FFMPEG/Minterpolate

我正在尝试在 Ubuntu Linux 上的 bash 脚本中使用两个帧 png 图像和 ffmpeg 的 minterpolate 过滤器制作一个快速且简单的变形视频目的是稍后使用变形作为不同视频编辑器中相似视频之间的过渡它适用于
高级 Win32 图像文件 I/O？

我想在 Windows C 应用程序中将图像文件读入内存什么是一个相当简单的解决方案也许类似于 IOS 提供的UIImage 我希望支持合理数量的文件格式我需要为图像处理的位图提供一些低级访问权限我在互联网上阅读了很多内容看起来
如何检测斑点并将其裁剪成 png 文件？

我一直在开发一个网络应用程序我陷入了一个有问题的问题我会尝试解释我想要做什么在这里您看到第一个大图像其中有绿色形状我想要做的是将这些形状裁剪成不同的 png 文件并使它们的背景透明就像大图像下面的示例裁剪图像一样第一张图像将
氡变换线检测

我正在尝试检测灰度图像中的线条为此我在 MATLAB 中使用 Radon 变换我的 m 文件的示例如下所示我可以使用此代码检测多行我还使用线条的移位和旋转属性来绘制线条但是我不明白在获取rho和theta值后如何获取检测线的起
在 Pari-GP 中嵌套特定递归

每个人我最初在 Stackexchange 上发布了类似的问题它已移至此处可以在链接中找到在 Matlab 中声明函数递归序列 https stackoverflow com questions 67146061 declaring
Java - 使用 JNA 的 Windows 任务栏 - 如何将窗口图标 (HICON) 转换为 java 图像？

我正在尝试将应用程序切换器添加到我正在处理的更大项目中它需要在 Windows XP Vista 7 8 上运行我正在使用 Java 1 7 下面是我创建的一个示例应用程序用于演示我遇到的一些问题我对 JNA 很陌生非常感谢充满
找到 4 个特定的角像素并将它们与扭曲透视一起使用

我正在使用 OpenCV 我想知道如何构建一个简单版本的透视变换程序我有一张平行四边形的图像它的每个角都由具有特定颜色的像素组成该像素在图像中没有其他位置我想遍历所有像素并找到这 4 个像素然后我想将它们用作新图像中的角点以扭曲
如何用 JavaScript 修复图像透视变形和旋转？

我有一些用手机拍摄的图像有没有可以拉直纸张照片并将其压平的 JavaScript 库例如我想创建一个矩形图像该图像没有任何失真换句话说我想知道如何用 JavaScript 修复透视变形和旋转例如我发现下面的示例图像来自this
Matlab strcat 不返回字符串？

imgstr 无法识别 strcat 的输出字符串 homedir C Users images for img 01 bmp 02 bmp 03 bmp imgstr strcat homedir img I imread imgstr

随机推荐

使用 Cassandra 进行事件重复数据删除

我正在寻找使用 Cassandra 消除重复事件的最佳方法我有很多客户端接收事件 ID 每秒数千个我需要确保每个事件 id 都被处理一次且仅一次并且具有高可靠性和高可用性到目前为止我已经尝试了两种方法使用事件 id 作为分区键然
设置HashMap线程安全吗？

我有一个HashMap在我的程序中它由多个线程访问并且偶尔由单个线程设置例如 Map
在go中获取未安装卷的BLKID

我试图找出是否有一种方法可以通过一些本机 golang 库获取已卸载卷的 blkid 详细信息我对卷的 fstype 特别感兴趣我不认为有一个本地库我找不到一个我想你有3个选择掏出壳 https golang org pkg os
如何显示“助理编辑器”？

https web archive org web 20110604185120 http developer apple com library ios documentation iphone conceptual iPhone101
AngularJs http get 响应未定义，但数据存在于 success 函数中

我是有角度的新手我尝试从 http get 方法获取 json 响应我的代码是 app factory getdata function http q this getlist function alert 1 return http
EnumProcessModulesEx 和 CreateToolhelp32Snapshot 失败 - 无论是 32 位还是 64 位

Edit 这个问题的答案在这里 https stackoverflow com a 27317947 996540 https stackoverflow com a 27317947 996540 在 msvc 中创建项目时默认启用选项
如何隐藏VSCode的Java编译器路径？

当我在 vscode 的集成终端中运行 java 程序时完整的 java 路径显示为一个大文本框有什么办法可以摆脱这个吗 Library Java JavaVirtualMachines jdk 13 0 1 jdk Contents
350 多个错误：类型“blah.blah.blah”已包含定义？

这是什么意思是否因为我有两个不同的 DBML 文件包含相同的数据库表 Error 343 The type mvc Models Bundle already contains a definition for BundleIcon C
将多个值添加到一个 numpy 数组索引

简单版本如果我这样做 import numpy as np a np zeros 2 a 1 1 np array 1 1 I get 0 1 作为输出但我想要 0 2 这是否可能以某种方式使用隐式 numpy 循环而不是我自己循环我
输入是自动关闭的并且不应该有内容

当我加载 Express 网页时出现以下错误表达 500 错误 app views index jade 114 112 TD 2 113 TD 4 年 gt 114 输入是自动关闭的并且不应该有内容 112 td 2 113 td 4
使用数据源和实体框架填充以编程方式声明的 datagridview

只是 c winforms datagridview 存在一些小问题这是我的场景我正在使用实体框架并尝试将某些实体模型绑定到我的 datagridview 数据源 var query from q in context foo sel
PHP 致命错误：未找到接口“JsonSerialized”

我今天已将我的 D8 站点从 Windows 迁移并配置到 Ubuntu 14 04 PC 但是当我运行该网站时我收到以下错误致命错误在第 32 行 var www eCartZone core lib Drupal Componen
提供随机访问的整数序列压缩

我有一个小范围内的 n 个整数序列 0 k 并且所有整数都有相同的频率f 所以序列的大小是n f k 我现在想做的是压缩这个序列同时提供随机访问第 i 个整数是多少实现随机访问的时间不一定是 O 1 我更感兴趣的是以更高的随机访问时间
无法访问 Spring Boot 和 Jersey 应用程序中的某些控制器

我在访问某些控制器时遇到一个小问题当我发送请求至我得到一个 HTTP 404 同样的movies path package com emo server Configuration ComponentScan com emo serve
从电子邮件文本中解析“发件人”地址

我正在尝试从电子邮件的纯文本记录中提取电子邮件地址我拼凑了一些代码来查找地址本身但我不知道如何让它区分它们现在它只是输出文件中的所有电子邮件地址我想让它只吐出以发件人和一些通配符开头并以 gt 结尾的地址因为电子邮件设置为
查找第二个 vlookup 值

我在工作表 SKU DATA 的单元格 J2 中有以下 vlookup 公式 VLOOKUP A2 DUPLICATE C AJ 34 0 但是在重复工作表范围的第 34 列中有 2 个可能的结果最多只有 2 个结果 Vlooku
$.post() 没有时间运行？

我试图在提交表单之前将数据从表单发送到外部脚本但我似乎无法让数据到达外部脚本除非我return false 在表格本身上 document ready function Handle Form Submission mainForm s
无法在 Mac OSX 上使用 gtk3 FileChooser？

我将使用 gtk 3 0 构建的程序从 Linux 迁移到 Mac OS X 10 6 8 而且我编译的程序没有错误但是在启动程序并选择打开文件后终端显示以下消息 GLib GIO CRITICAL Settings schema o
在我的 Mac 上安装 python 包（ffnet、spacepy）时找不到 -lbundle1.o 的库

我在我的 mac 10 9 上安装了 anaconda python 发行版我正在尝试安装ffnet http ffnet sourceforge net包和SpacePy http spacepy lanl gov包但这样做时遇到麻烦
vl_dsift 尝试获取每个像素的特征向量

我正在尝试使用 vl dsift 获取每个像素的 128 1 特征向量因此我希望得到的矩阵具有大小 128 像素数然而当我在尺寸为 192 168 的图像上使用它时生成的描述符给出尺寸 128 31 185 binsize 为 1

vl_dsift 尝试获取每个像素的特征向量

vl_dsift 尝试获取每个像素的特征向量 的相关文章

随机推荐

热门标签

vl_dsift 尝试获取每个像素的特征向量的相关文章