Predict.svm 中的错误:测试数据与模型不匹配

2023-12-09

我有一个大约 500 行和 170 列的数据框。我正在尝试使用 e1071 包中的 svm 运行分类模型。分类变量称为“SEGMENT”,是一个有 6 个级别的因子变量。数据框中还有其他三个因子变量,其余都是数字。

data <- my.data.frame
# Split into training and testing sets, training.data and testing.data
.
.
.
fit <- svm(SEGMENT ~ ., data = training.data, cost = 1, kernel = 'linear', 
+ probability = T, type = 'C-classification')

该模型运行良好。

Parameters:
SVM-Type:  C-classification 
SVM-Kernel:  linear 
   cost:  1 
   gamma:  0.0016 

Number of Support Vectors:  77

( 43 2 19 2 2 9 )

Number of Classes:  6 

Levels: 
EE JJ LL RR SS WW

当我尝试在 data.testing 上测试模型时出现问题,该模型是结构化的exactly就像训练集一样:

x <- predict(fit, testing.data, decision.values = T, probability = T)

然后事情就发生了相当惊人的爆炸:

Error in predict.svm(fit, newdata = testing, decision.values = T, probability = T) : 
test data does not match model !

非常欢迎提出想法。


当测试数据和训练数据中的列不相同时,就会发生这种情况。 尝试 str(training.data) 和 str(testing.data) 除了需要预测的变量之外,它们应该具有相同的变量。 仅包含您想要在 svm 训练模型中用于预测的因素。

For eg:

fit <- svm(SEGMENT ~ ., data = training.data[,1:6], cost = 1, kernel = 'linear', 
+ probability = T, type = 'C-classification')     


x <- predict(fit, testing.data[,1:5], decision.values = T, probability = T)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Predict.svm 中的错误:测试数据与模型不匹配 的相关文章

  • 如何从 data.frame 中删除列?

    不是 你怎么 但更多的是 你怎么 如果有人给你一个包含 200 列的文件 并且你想将其减少到分析所需的少数列 你会如何做呢 一种解决方案是否比另一种解决方案更有优势 假设我们有一个包含列 col1 col2 到 col200 的数据框 如果
  • 有没有一种简单的方法可以在 R 的 igraph 中按度数对网络节点进行着色?

    使用igraphR 包 我想按度数对网络节点进行着色 颜色应代表渐变 例如从蓝色到红色 或从黄色到红色 从网络中观察到的最低程度到最高程度 我找到了一个可行的解决方案 https stackoverflow com questions 40
  • 如何对 lm() 中的一系列值进行子集化

    lm 的帮助文件没有涉及子集参数的语法 我不知道如何让它找到最适合我的数据集的一部分的线 这个问题是类似的 但我无法使用它解决我的特定问题 子集参数在 lm 函数中如何工作 https stackoverflow com questions
  • 删除第一次出现某个值后的行

    我有以下 df df lt data frame var1 c 1 2 2 3 4 5 5 6 7 8 9 var2 c a b c d e f g h i j k 我想在达到前 5 var1 后进行过滤 所以结果应该是 var1 var2
  • R 中的卡方拟合优度检验

    我有一个观察值向量 还有一个用模型计算的值向量 actual lt c 1411 439 214 100 62 38 29 64 expected lt c 1425 3 399 5 201 6 116 9 72 2 46 3 30 4 6
  • 单击 hPlot 图表中闪亮的数据点时打印组名称

    我有一个闪亮的应用程序 它使用 rCharts 中的 highcharts 库显示一些图表 在某些情况下 我在单个图表上有多个图表 这些图表是使用 hPlot 中的组选项创建的 我希望在单击图表时打印单个数据点的所有参数 x y 和组值 我
  • 如何根据另一列的条件语句将因子列添加到数据框?

    我有一个数据框 我需要根据条件语句添加一个因子列 这里是data https www dropbox com s hujiacus8ek5o5z MoroccoCGE CC Stats csv Code morstats agri f lt
  • 如何扩展 ggplot y 轴限制以包含最大值

    通常 在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
  • 如何使用 R 更改 png 文件的大小

    我正在绘制 png 文件并获取一张小图片 你知道一些可以改变 png 图大小的简单代码吗 我的地块太高太 薄 另外有没有办法改变情节的分辨率 谢谢 伊格尔 png png filename Rplot 03d png width 480 h
  • ggplot2 geom_function 可以跨 arg 值进行分面吗?

    我想通过分面 geom function 创建 ggplot2 图 以便函数的参数在网格中变化 例如像这样的东西 my function lt function x par if par 1 return sin x else return
  • 连接路径的函数?

    是否有现有的函数来连接路径 我知道实施起来并不困难 但仍然 除了照顾尾随 or 我需要注意正确的操作系统路径格式检测 即我们是否编写C dir file or dir file 正如我所说 我相信我知道如何实施它 问题是 我应该这样做吗 现
  • 使用多边形图层下方的轮廓线切割多边形

    我想根据高程将多边形图层切割成两部分 上部和下部 多边形可能是凸的或凹的 并且切割的位置可能彼此不同 等高线的间隔为 5m 这意味着我可能需要生成一个具有更紧凑的等高线的等高线 例如 1m 的间隔 关于如何做到这一点的任何想法 在 ArcG
  • 如何加速 svm.predict?

    我正在编写一个滑动窗口来提取特征并将其输入到 CvSVM 的预测函数中 然而 我偶然发现 svm predict 函数相对较慢 基本上 窗口以固定的步幅长度在图像比例上滑动穿过图像 遍历图像加上提取每个图像特征的速度 窗口大约需要 1000
  • 数据框中按行相关

    我正在尝试计算大型数据帧的所有行之间的相关性 到目前为止已经提出了一个有效的简单 for 循环 例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
  • 如何在 Shiny 应用程序中访问/打印/跟踪当前选项卡选择?

    我正在一个闪亮的应用程序中工作 我希望能够访问用户在会话中当前所在选项卡上的信息 我有一个观察事件 用于侦听要单击的特定按钮 简而言之 我想存储 打印用户单击此按钮时所在的当前选项卡 单击此按钮后 选项卡将更改为带有 updateTabIt
  • R:适合显示具有倾斜计数的数据的图

    我有这样的数据 Name Count Object1 110 Object2 111 Object3 95 Object4 40 Object2000 1 因此 只有前 3 个物体的计数较高 其余 1996 个物体的数量少于 40 个 其中
  • 将一长行带空格的数据导入R中

    这个问题是我上一个问题的后续问题 将一长行数据导入到 R 中 https stackoverflow com questions 8389913 我有一个由单行文本组成的大型数据文件 格式类似于 Cat 14 15 Horse 16 我最终
  • 使用 xtable 对乳胶输出的表进行排序

    我正在尝试生成一个排序表并导出到乳胶中 然而 xtable 似乎无法处理排序表 建议 a lt sample letters 500 replace T b lt table a c lt sort table a decreasing T
  • Dplyr 过滤多个类似条件

    我正在尝试在 dplyr 中做一个过滤器 其中的列就像某些观察结果 我可以使用 sqldf 作为 Test lt sqldf select from database Where SOURCE LIKE ALPHA OR SOURCE LI
  • 将 r 中的一列从出生日期更改为年龄

    我是第一次使用 data table 我的表中有大约 400 000 个年龄的列 我需要将它们从出生日期转换为年龄 做这个的最好方式是什么 我一直在思考这个问题 到目前为止对这两个答案都不满意 我喜欢用lubridate 就像 KFB 所做

随机推荐

  • 如何编写迭代器?

    我有一个节点网络 在节点之间传递结构化数据 对于我的子问题 我们有这个分支 节点的线性序列 nodes source n1 n2 n3 n4 第一个节点是生成器 每个其他节点从输入节点获取值并提供输出值 当前的实现是从管道的普通 get 和
  • jQuery onmouseover + onmouseout / 悬停在两个不同的 div 上

    我有一个问题 这是我的 HTML 的一部分 div Here Hover div div Here content to show div 这是我的 jQuery 脚本的一部分 jQuery div 2 hide jQuery div 1
  • 如何使用 vegas.js 插件添加文本动画

    我正在使用 vegas js 插件 http vegas jaysalvat com documentation 对于我的网站 我想用这些图像显示一些文本 我如何添加一些带有图像的动画文本 在 body 中初始化 vegas js
  • Flask url_for 在模板的外部 JavaScript 中不起作用

    在index html 中 我链接到index js 文件 单击一个按钮 js 会向 Flask 后端发送请求 后端返回静态文件路径 data Sharon 4 png 我想使用以下函数以 HTML 形式呈现它 但它不起作用 为了简化它 我
  • 将代码直接放在InitializeComponent 之后是不好的做法吗?

    我只是想知道一件事 我有一个加载页面的框架 当前每个页面都有一个Page Loaded每次访问页面时都会运行的方法 这工作得很好 但如果我使用导航转到以前访问过的页面 我会注意到错误 返回页面后 Page Loaded我不希望再次被呼叫 使
  • 仅选择具有上次修改时间戳的行,不选择具有相同 ID 和旧时间戳的重复行

    我找不到解决我的问题的方法 我有两个表 Order 和 OrderDetail 订单表 简单版 ID modified 1 7 1 2018 2 10 1 2018 3 15 1 2018 4 20 1 2018 5 25 1 2018 订
  • Oracle插入if不存在语句

    insert into OPT email campaign id values email protected 100 where not exists select from OPT where email email protecte
  • LINQ 到实体转换问题

    我正在尝试以通用方式过滤 LINQ to entities 查询 但我不断收到错误 这是一段代码 private IQueryable
  • 将 window tester 与 eclipse 集成以测试 UI

    我们计划使用窗口测试器自动测试我的 Eclipse 应用程序 GUI 日食的版本是氧气 请告诉我如何将窗口测试器与 Eclipse 应用程序集成 我在 eclipse 市场上没有看到任何窗口测试器插件 如果没有 我可以使用哪个 GUI 测试
  • 如何让 JInternalFrame 填充容器并禁用拖动功能?

    我正在做一个项目 大型机中有JInternalFrames 现在 我们需要让它们成为 JFrame 我正在考虑使用 JFrame 来保存 JInternalFrame 问题是Internalframe的标题栏在那里 用户可以拖动它 有没有办
  • 在帐单地址 woocommerce 中添加新字段

    我想在我的网站上编辑我的帐单地址 我需要add and delete我的帐户页面中还有其他一些代码 我应该编辑哪些代码 提前谢谢您 您可以检查下面的代码吗add新的自定义字段示例 add filter woocommerce billing
  • 从 numpy loadtxt() 获取日期列

    我有一个文本文件 其中包含下表 Day Month Year Avg Power 01 01 2000 30 02 01 2000 41 04 01 2000 55 05 01 2000 78 06 01 2000 134 07 01 20
  • 在谷歌云ML中导入librosa

    我正在运行 Google Cloud ML 当我尝试导入 librosa 时 出现错误 ImportError 没有名为 tkinter 的模块 请安装 python tk 包 我确实有一个 setup py 文件 一个空的 init py
  • 保持 UIAlertView 显示

    我有一个 UIAlertView 上面有一个文本字段和两个按钮 保存和取消 点击 保存 按钮时 我会检查文本字段是否不为空 如果为空 我只想将 textFields 占位符更改为 请输入名称 并将警报视图保留在屏幕上 但它会自动被驳回 我该
  • 如何摆脱 pygame 表面?

    在下面的代码中 不仅有one在任何给定时间点屏幕上出现圆圈 我想修复这个问题 使其看起来只有一个圆圈 而不是在鼠标光标所在的地方留下污迹 import pygame sys from pygame locals import pygame
  • HTML 数字输入最小值和最大值无法正常工作

    I have type number输入字段和我已经设置min and max它的值
  • JSON 格式在附加文件时添加 \ 字符,但不添加到输出中的字符串

    我正在使用以下函数来获取json来自 flickrAPI 它返回的字符串是格式正确的 JSON 块 def get photo data photo id para para photo id photo id para method fl
  • Tensorflow - 推理时间评估

    我正在使用 Tensorflow 评估不同的图像分类模型 特别是使用不同设备的推理时间 我想知道是否必须使用预训练模型 我使用一个脚本生成 1000 个随机输入图像 将它们一一输入到网络 并计算平均推理时间 谢谢 让我首先发出警告 大多数人
  • 在c#中一段时间​​内非阻塞等待/延迟的最佳实现是什么

    目前我需要在Windows Store应用程序项目中实现一个简单的非阻塞延迟功能 该函数不应该执行任何操作 只是在特定时间段内空闲而不阻塞 UI 我的问题是 如何正确实现这样的功能 我知道这是一个老问题 但在网上搜索后我真的没有任何线索 最
  • Predict.svm 中的错误:测试数据与模型不匹配

    我有一个大约 500 行和 170 列的数据框 我正在尝试使用 e1071 包中的 svm 运行分类模型 分类变量称为 SEGMENT 是一个有 6 个级别的因子变量 数据框中还有其他三个因子变量 其余都是数字 data lt my dat