如何使用词袋进行训练和预测？

2024-04-15

我有一个文件夹，里面有汽车各个角度的图像。我想使用词袋方法来训练系统识别汽车。训练完成后，我希望如果给出那辆车的图像，它应该能够识别它。

我一直在尝试学习 opencv 中的 BOW 函数，以便完成这项工作，并且已经达到了我现在不知道该怎么做的水平，并且希望得到一些指导。

这是我用来制作词袋的代码：

Ptr<FeatureDetector> features = FeatureDetector::create("SIFT");
    Ptr<DescriptorExtractor> descriptors = DescriptorExtractor::create("SIFT");
    Ptr<DescriptorMatcher> matcher = DescriptorMatcher::create("FlannBased");

    //defining terms for bowkmeans trainer
    TermCriteria tc(MAX_ITER + EPS, 10, 0.001);
    int dictionarySize = 1000;
    int retries = 1;
    int flags = KMEANS_PP_CENTERS;
    BOWKMeansTrainer bowTrainer(dictionarySize, tc, retries, flags);

    BOWImgDescriptorExtractor bowDE(descriptors, matcher);

    //training data now
    Mat features;
    Mat img = imread("c:\\1.jpg", 0);
    Mat img2 = imread("c:\\2.jpg", 0);
    vector<KeyPoint> keypoints, keypoints2;
    features->detect(img, keypoints);
    features->detect(img2,keypoints2);
    descriptor->compute(img, keypoints, features);
    Mat features2;
    descripto->compute(img2, keypoints2, features2);
    bowTrainer.add(features);
    bowTrainer.add(features2);

    Mat dictionary = bowTrainer.cluster();
    bowDE.setVocabulary(dictionary);

这一切都是基于弓文档 http://docs.opencv.org/modules/features2d/doc/object_categorization.html#bowtrainer-getdescriptors.

我认为在这个阶段我的系统已经训练好了。下一步是预测。

这是我不知道该怎么做的地方。如果我使用SVM or NormalBayesClassifier他们都使用术语“训练”和“预测”。

之后我如何预测和训练？任何指导将不胜感激。如何将分类器的训练连接到我的“bowDE”函数？

下一步是提取实际的单词描述符包。您可以使用compute来自 BOWImgDescriptorExtractor 的函数。就像是

 bowDE.compute(img, keypoints, bow_descriptor);

使用此函数创建描述符，然后将其收集到一个矩阵中，该矩阵用作分类器函数的输入。或许this http://www.morethantechnical.com/2011/08/25/a-simple-object-classifier-with-bag-of-words-using-opencv-2-3-w-code/教程可以给你一点指导。

我想提的另一件事是，对于分类，通常至少需要 2 个类。因此，您还需要一些不包含汽车的图像来训练分类器。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

machinelearning

sift

featuredetection

如何使用词袋进行训练和预测？的相关文章

PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
无法在 Windows 7 机器中使用 OpenCV 2.4.3、Python 2.7 打开“.mp4”视频文件

我目前正在进行一个涉及读取 mp4 视频文件的项目我遇到的问题是它在Windows 7机器上使用Python 2 7 32位 OpenCV 2 4 3 cv2 pyd 代码片段如下 try video cv2 VideoCapture v
OpenCV 3 中的 FLANN 错误

我运行的是 Ubuntu 14 04 我正在尝试使用 openCV 3 运行 FLANN 但出现错误下面的所有内容都是通过使用 AKAZE 和 ORB 进行尝试的但代码来自我尝试使用 ORB 的情况我使用 ORB 来查找描述符和关键点
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
仅获取图像中的外部轮廓

我有这段代码可以在图像中绘制轮廓但我只需要外部轮廓 import cv2 import numpy as np camino C Users Usuario Documents Deteccion de Objetos 123 jpg
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
ffmpeg AVFrame 到 opencv Mat 转换

我目前正在开发一个使用 ffmpeg 解码接收到的帧的项目解码后我想将 AVFrame 转换为 opencv Mat 帧以便我可以在 imShow 函数上播放它我拥有的是字节流我将其读入缓冲区解码为 AVFrame f fope
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
minAreaRect OpenCV 返回的裁剪矩形 [Python]

minAreaRectOpenCV 中返回一个旋转的矩形如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标以便可以通过循环框内的点来访问像素但是在 Python 中是否有更快的裁剪方法 EDIT See code在
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
神经网络不能立即重现？

通过使用反向传播导数弹性的前馈神经网络中的随机权重初始化误差图上的初始位置位于某个随机谷的顶部该随机谷可能是也可能不是局部最小值可以使用方法来克服局部最小值但假设这些方法没有被使用或者在给定的地形上不能很好地工作那么神经网络
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video

随机推荐

Crockford 的“curry”方法中的“this”无效是否有原因？

在 Douglas Crockford 的书 Javascript The Good Parts 中他提供了curry方法接受一个函数和参数并返回已添加参数的函数显然这并不是真正的咖喱是什么意思 https stackoverfl
复制PNG文件错误

当我归档应用程序时我的项目中的所有图像都会出现 CopyPNG 错误我尝试了所有方法删除所有图像再次添加它们检查构建阶段复制捆绑资源没有找到重复项我无法理解要进一步做什么提交应用程序当我归档具有相同图像的另一个应用程序时
codeigniter 1 分页错误

在模型 rci model php中 public function record count return this gt db gt count all produk public function fetch countries li
@mui/system -- 如何将瞬态道具传递给 styled()

我在用着import styled from mui system 像这样 const Column styled div
找不到以下 Boost 库：boost_asio

当我尝试编译使用 boost 和 asio 的 cmake 项目时 make我收到这些错误 CMakeFiles client network handler test dir main cpp o In function cxx glob
如何为一个 Python/C 扩展源文件指定不同的编译器标志？

我有一个使用 CPU 特定功能的 Python 扩展如果可供使用的话这是通过运行时检查来完成的如果硬件支持POPCNT指令然后选择一个我的内部循环的实现如果 SSSE3 可用的话它选择另一个否则它会回退到通用版本我的性能
Rails 2 到 Rails 3，控制器中的方法验证消失了吗？

来自 Rails 2 的我的大多数控制器都会有这些行 verify method gt post only gt create render gt text gt 405 HTTP POST required status gt 405 a
错误的泛型转换没有 ClassCastException [Java]

看一下下面这个类的main方法 public class Outer static class A
Google 地图，设置最小和最大滑块控件

我正在开发一个谷歌地图除了我似乎无法设置最大和最小缩放这一事实之外它一切正常我想将默认缩放视图的级别限制为几个级别我尝试过使用 map getMimimumResolution 但这似乎不起作用有什么想法吗 function in
如何在 gdb 中打印长字符串的完整值？

我想在 GDB 中打印 C 字符串的完整长度默认情况下它是缩写的如何强制 GDB 打印整个字符串 set print elements 0 来自GDB手册 https sourceware org gdb onlinedocs gdb
将 Jersey 日志输出到文件？

我们已将这些添加到 web xml 中
如何在 Ruby 中计算字符串的宽度？

String length只会告诉我字符串中有多少个字符事实上在Ruby 1 9之前它只会告诉我有多少字节这更没有什么用处我真的很想知道一个字符串有多少 en 宽例如 foo width gt 3 moo width gt 3
git 将上游设置为原点

我一直在阅读和使用 git 但仍然对起源一词感到困惑我有一个本地存储库并在其上创建了一个新分支这个新分支是我主人的副本我的主控是原始主控的分叉是其他人制作的另一个存储库并且在某些提交方面领先于原始主控而在其他方面则落后于原
在 64 位计算机上使用 Redemption dll (Outlook)

我在 32 位机器上安装了一个 exe 它循环访问登录的用户收件箱并且工作正常注意我仍然没有让它为另一个用户工作 see here https stackoverflow com questions 589254 using redemp
防止隐藏状态栏重新布局（伪造 SYSTEM_UI_FLAG_LAYOUT_STABLE）

我正在开发具有列表视图和详细信息视图的应用程序并且我从列表视图到详细视图进行动画处理在执行此操作时我想在某个阶段隐藏状态栏最好仍然在后台显示列表视图问题是使用隐藏状态栏 getWindow setFlags WindowManag
如何使用 java.nio.ByteBuffer 从 C++ 返回到 Java

这几乎是问题的重复如何使 Swig 正确包装在 C 中修改为 Java Something or other 的 char 缓冲区 https stackoverflow com questions 2740068 how can i ma
更新的标题：为什么 ICommand.CanExecute 一直被调用，而不是像事件一样工作？

我在 WPF 中采用 MVVM 模式并学习了使用Command 但在我的实现中我分配来实现的代表CanExecute总是被调用我的意思是如果我在委托函数内放置一个断点它表明该函数不断被调用根据我的理解也是一种自然的思维方式但我
如何使用 CSS 实现这种视觉效果

我需要仅使用 css 和一个高度和宽度为 300px 的 div 创建上述视觉效果我尝试了渐变但无法得到任何相同的东西有人可以帮忙吗渐变是一个好主意您甚至可以添加内容无论渐变的大小如何只要将其大小设置为正方形即可 div bac
使用带有几个字符串的 Ionic Storage 的 QuotaExceededError

我在离子存储方面遇到了这个问题这是完整的堆栈跟踪 core es5 js 1084 ERROR Error Uncaught in promise QuotaExceededError at c polyfills js 3 at c p
如何使用词袋进行训练和预测？

我有一个文件夹里面有汽车各个角度的图像我想使用词袋方法来训练系统识别汽车训练完成后我希望如果给出那辆车的图像它应该能够识别它我一直在尝试学习 opencv 中的 BOW 函数以便完成这项工作并且已经达到了我现在不知道该怎么做

如何使用词袋进行训练和预测？

如何使用词袋进行训练和预测？ 的相关文章

随机推荐

热门标签

如何使用词袋进行训练和预测？的相关文章