帮助--LibSVM 的准确率达到 100%？

2024-04-20

名义上这是一个好问题，但我很确定这是因为发生了一些有趣的事情......

作为上下文，我正在研究面部表情/识别空间中的一个问题，因此获得 100% 的准确度似乎令人难以置信（并不是说在大多数应用程序中这是合理的......）。我猜测数据集中存在一些一致的偏差，这使得 SVM 过于容易地得出答案，=或者=，更有可能的是，我在 SVM 方面做错了一些事情。

我正在寻找建议来帮助理解正在发生的事情——是我吗（=我对 LibSVM 的使用）？或者是数据？

细节：

大约 2500 个标记数据向量/实例（个人的转换视频帧 - 总共
运行subset.py 将数据分为测试（500 个实例）和训练（剩余）。
运行“svm-train -t 0”。（注意：显然不需要“-w1 1 -w-1 4”...）
对测试文件运行 svm-predict。准确率=100%！

尝试过的事情：

通过一些无意的命令行参数错误检查了大约 10 次，我没有在相同的数据文件上进行训练和测试
重新运行subset.py（即使使用-s 1）多次，并且只训练/测试多个不同的数据集（以防我随机地使用最神奇的训练/测试pa
运行一个简单的类似 diff 的检查，以确认测试文件不是训练数据的子集
数据上的 svm-scale 对精度没有影响（精度=100%）。（尽管支持向量的数量确实从 nSV=127、bSV=64 下降到 nBSV=72、bSV=0。）
（（奇怪））使用默认的 RBF 内核（副线性——即删除“-t 0”）会导致准确率变成垃圾（？！）
（健全性检查）使用针对未缩放数据集在缩放数据集上训练的模型运行 svm-predict 会导致准确度 = 80%（即，它总是猜测主导类）。这是严格的健全性检查，以确保 svm-predict 名义上在我的机器上正常运行。

暂定结论？：

数据中的某些东西是奇怪的——不知何故，在数据集中，支持向量机正在捕捉到一种微妙的、由实验者驱动的效应。

（然而，这并不能解释为什么 RBF 内核在第一遍时给出垃圾结果。）

如果有任何建议，我将不胜感激：a）如何修复我对 LibSVM 的使用（如果这确实是问题）或 b）确定 LibSVM 在数据中发现了哪些微妙的实验者偏差。

另外两个想法：

确保您没有使用相同的数据进行训练和测试。这听起来有点愚蠢，但在计算机视觉应用中，您应该注意：确保您没有重复数据（例如同一视频的两帧落在不同的折叠上），您不是在同一个人上进行训练和测试等等。它比听起来更微妙。

确保搜索 RBF 内核的 gamma 和 C 参数。有很好的理论（渐近）结果证明线性分类器只是一个退化的 RBF 分类器。所以你应该寻找一个好的（C，gamma）对。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

帮助--LibSVM 的准确率达到 100%？的相关文章

如何更新反卷积层的权重？

我正在尝试开发一个反卷积层或者准确地说是转置卷积层在前向传递中我进行了完全卷积零填充卷积在向后传递中我进行有效的卷积没有填充的卷积以将错误传递到前一层偏差的梯度很容易计算只需对多余维度进行平均即可问题是我不知道如何更新
没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
朴素分类器 matlab

在 matlab 中测试朴素分类器时即使我在相同的样本数据上进行训练和测试我也会得到不同的结果我想知道我的代码是否正确是否有人可以帮助解释这是为什么 dimensionality reduction columns 6 U S V
实例标准化与批量标准化

据我所知批量归一化通过将激活转向单位高斯分布来帮助加快训练速度从而解决梯度消失问题批量归一化行为在训练使用每个批次的平均值 var 和测试时间使用训练阶段的最终运行平均值 var 时应用不同另一方面实例归一化充当本文提到的对比
Tensorflow：np数组的next_batch函数

我的火车数据为 xTrain numpy asarray 100 1 5 6 yTrain numpy asarray 200 2 10 12 如何定义 next batch size 方法以从训练数据中获取随机元素的 size 个数您可
在 iPad 上使用 OpenCV 避免碰撞

我正在开展一个项目需要使用 OpenCV 实现碰撞避免这是在 iOS 上完成的 iOS 5 及以上版本即可项目目标这个想法是将 iPad 安装在汽车仪表板上并启动应用程序应用程序应该从相机中抓取帧并进行处理以检测汽车是否会与任何
SpaCy 模型“en_core_web_sm”的词汇量大小

我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词我也在同
将四边形（四边形）拟合到斑点

应用不同的过滤和分割技术后我最终得到如下图像我可以访问一些轮廓检测函数这些函数返回该对象边缘上的点列表或者返回一个拟合的多边形尽管有很多边远多于 4 个我想要一种将四边形适合该形状的方法因为我知道它是应该是四边形的鞋盒的正面
opencv createsamples没有错误，但是没有找到样本

我在用着this http coding robin de 2013 07 22 train your own opencv haar classifier html教程我正在根据我的正面图像创建大量样本我正在使用 Windows 这是
在提供给 sklearn 管道中的分类器之前获取所选特征的名称和数量

我在用sel SelectFromModel ExtraTreesClassifier 10 threshold mean 选择我的数据集中最重要的特征然后我想将这些选定的特征提供给我的 keras 分类器但是我的基于 keras 的神
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

在 Jupyter 笔记本上本地运行并使用 MNIST 数据集 28k 条目每个图像 28x28 像素以下内容为27秒 from sklearn neighbors import KNeighborsClassifier knn clf
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
将索引数组转换为 NumPy 中的 one-hot 编码数组

给定一个一维索引数组 a array 1 0 3 我想将其一次性编码为二维数组 b array 0 1 0 0 1 0 0 0 0 0 0 1 创建归零数组b有足够的列即a max 1 然后对于每一行i 设置a i 第列至1 gt

随机推荐

使用 Firebase SDK v3 中的数据库密钥进行身份验证？

首先我喜欢新的 Firebase 但是我无法让我的 Swift 项目连接到 Firebase 因为我使用数据库机密来验证设备在 Firebase SDK 版本 3 之前我可以使用 Firebase 密钥现在是数据库密钥进行身份验
汉诺塔递归算法

我在理解这个河内塔递归算法时遇到问题 public class MainClass public static void main String args int nDisks 3 doTowers nDisks A B C public
辅助功能：仅限 sr 或 aria-label

From MDN https developer mozilla org en US docs Web Accessibility ARIA ARIA Techniques Using the aria label attribute 在下
Laravel phpunit 异常处理

我正在使用 Laravel 5 5 和 Vue js 编写一个 Web 应用程序 PHPUnit 版本是 6 3 1 当用户使用表单请求注册时我正在测试验证错误 Route web php Route post register Auth
Rails::Railtie：创建 Rails 3 gem 时遇到问题

我真的可以用另一双眼睛来看待这个问题所以我想我会把它发布在这里不久前我出于自己的教育目的编写了一个基本的 ActiveRecord 扩展我最近一直在阅读有关 Railties 的内容并想尝试让它与 Rails 3 一起工作我想我
Swift 与 Objective C 指针操作问题

我在 Objective C 中有这段代码运行良好 list controller gt audioBufferList list gt mBuffers 0 mDataByteSize inNumberFrames kSampleWor
导入Stanford nlp Intellij

我在使用斯坦福词形还原器时遇到问题当我使用 Intellij IDE 时我尝试通过依赖项 Windows 导入它但我无法通过这种方式访问所有类有没有办法在 Intellij 上正确导入 stanford english coren
使用随机数生成引擎

我正在尝试使用兰德字节 https www openssl org docs crypto rand htmlOpenSSL 的 API 但我想尝试使用各种随机数生成引擎在 OpenSSL 中是否有推荐的生成随机字节并添加熵的方法我在
模型无法通过烧瓶迁移检测到

我的烧瓶应用程序中有这棵树 api migrations model init py Persons py Comments py other classes py resources init py app py util py This
如何更新实体？

我之前有一个更详细的问题但我没有答案我将以更简单的方式提出同样的问题 I have an EF database with foreign key to another table 我想UPDATE an ENTITY 但我需要这样我
如何定期更新WebView中的HTML5位置（使用FINE_ACCURACY）

我正在开发一个应用程序来跟踪我的手机定期不仅是第一次 with navigator geolocation getCurrentPosition 运行在 HTML5 页面中运行在 webkit webview 中运行在 android
SpringFramework：预期有一个匹配的 bean，但发现了 2 个

我正在构建一个使用 SpringFramework 从 MongoDB 读取数据的项目其结构为存储库 and Service如下 Repository Interfaces I
将安装文件打包为单个可执行安装程序

我有一个用 C 编写的旧程序的旧设置其中包含多个安装文件 SETUP 1 SETUP DLL INST32I EX ISDEL EXE SETUP EXE DISK1 ID SETUP INI SETUP INS SETUP LIB SE
UITableView 的本地化索引

我正在尝试为我的 UITableView 使用本地化索引就像 iPhone 的联系人应用程序一样这是我返回字符数组的方法 NSArray sectionIndexTitlesForTableView UITableView tableV
如何停止对辅助隐式加载 DLL 的 DLL 劫持

例如 COMDLG32 DLL 隐式链接到以下系统 DLL 以及其他 xmllite dll dll srvcli dll wkscli dll 链接信息库 netutils dll 微星 dll 由于这些是由操作系统隐式加载的而不是使用
如何重定向 Visual Studio 调试器的输出？

在 Visual Studio 2008 中我可以指定命中断点时要打印的消息通过右键单击断点并选择命中时当程序运行时这些消息出现在输出窗口中我想知道有什么办法可以将它们重定向到文件吗指定 gt file txt作为程序的命令参
休眠批量插入

这是我在数据库中插入批次的代码 Override public void addMultiple session get session tx session beginTransaction for int i 0 i lt 100 i
错误：ValueFactory 尝试访问此实例的 Value 属性

Error 源文件 c Projects WaterfrontSeattle org src Orchard Logging OrchardLog4netLogger cs Line 63 来源错误 Line 61 Load the log
升级到Numpy 1.8.2后，ImportError：无法导入名称多数组

我刚刚使用 Anaconda 的 Spyder 在 64 位 Windows 机器上升级到 Numpy 1 8 2 我使用了命令 conda update numpy 它安装了它在此之前我有numpy 1 7 1 并且我在另一个路径中也有
帮助--LibSVM 的准确率达到 100%？

名义上这是一个好问题但我很确定这是因为发生了一些有趣的事情作为上下文我正在研究面部表情识别空间中的一个问题因此获得 100 的准确度似乎令人难以置信并不是说在大多数应用程序中这是合理的我猜测数据集中存在一些一致的偏差这使得

帮助--LibSVM 的准确率达到 100%？

帮助--LibSVM 的准确率达到 100%？ 的相关文章

随机推荐

热门标签

帮助--LibSVM 的准确率达到 100%？的相关文章