R 错误：某些组对于“qda”来说太小

2024-04-03

我用的是MASS::qda()找到我的数据的分类器，它总是报告

“某些群体对于‘qda’来说太小了

是由于我用于模型的测试数据的大小吗？我将测试样本大小从 30 增加到 100，它报告了相同的错误。求助啊啊啊啊啊……

set.seed(1345)
AllMono <- AllData[AllData$type == "monocot",]
MonoSample <- sample (1:nrow(AllMono), size = 100, replace = F)
set.seed(1355)
AllEudi <- AllData[AllData$type == "eudicot",]
EudiSample <- sample (1:nrow(AllEudi), size = 100, replace = F)
testData <- rbind (AllMono[MonoSample,],AllEudi[EudiSample,])
plot (testData$mono_score, testData$eudi_score, col = as.numeric(testData$type), xlab = "mono_score", ylab = "eudi_score", pch = 19)
qda (type~mono_score+eudi_score, data = testData)

这是我的数据示例

>head (testData)
                              sequence mono_score eudi_score    type
PhHe_4822_404_76       DTRPTAPGHSPGAGH    51.4930   39.55000 monocot
SoBi_10_265860_58      QTESTTPGHSPSIGH    33.1408    2.23333 monocot
EuGr_5_187924_158        AFRPTSPGHSPGAGH    27.0000   54.55000 eudicot
LuAn_AOCW01152859.1_2_79 NFRPTEPGHSPGVGH    20.6901   50.21670 eudicot
PoTr_Chr07_112594_90     DFRPTAPGHSPGVGH    43.8732   56.66670 eudicot
OrSa.JA_3_261556_75    GVRPTNPGHSPGIGH    55.0986   45.08330 monocot
PaVi_contig16368_21_57 QTDSTTPGHSPSIGH    25.8169    2.50000 monocot

>testData$type <- as.factor (testData$type)

> dim (testData)
[1] 200   4

> levels (testData$type)
[1] "eudicot" "monocot" "other" 

> table (testData$type)
eudicot monocot   other 
    100     100       0

> packageDescription("MASS")
Package: MASS
Priority: recommended
Version: 7.3-29
Date: 2013-08-17
Revision: $Rev: 3344 $
Depends: R (>= 3.0.0), grDevices, graphics, stats, utils

我的 R 版本是 R 3.0.2。

tl;dr我的猜测是你的预测变量被意外地变成了因子或字符向量。如果数据集中存在一些小故障，例如一行中存在虚假字符，则很容易发生这种情况。

以下是构建与您的数据集相似的数据集的方法：

set.seed(101)
mytest <- data.frame(type=rep(c("monocot","dicot"),each=100),
                 mono_score=runif(100,0,100),
                 dicot_score=runif(100,0,100))

一些有用的诊断：

str(mytest)
## 'data.frame':    200 obs. of  3 variables:
## $ type       : Factor w/ 2 levels "dicot","monocot": 2 2 22 2 2 2 ...
##  $ mono_score : num  37.22 4.38 70.97 65.77 24.99 ...
##  $ dicot_score: num  12.5 2.33 39.19 85.96 71.83 ...
summary(mytest)
##       type       mono_score      dicot_score     
##  dicot  :100   Min.   : 1.019   Min.   : 0.8594  
##  monocot:100   1st Qu.:24.741   1st Qu.:26.7358  
##                Median :57.578   Median :50.6275  
##                Mean   :52.502   Mean   :52.2376  
##                3rd Qu.:77.783   3rd Qu.:78.2199  
##                Max.   :99.341   Max.   :99.9288  
## 
with(mytest,table(type))
## type
##   dicot monocot 
##    100     100

重要的是，前两个（str() and summary()）向我们展示什么type每个变量都是。Update：事实证明，在这种情况下，第三个测试实际上是重要的一个，因为问题是一个虚假的额外级别：droplevel()函数应该解决这个问题......

这个虚构的例子似乎工作得很好，所以一定有一些你没有向我们展示的关于你的数据集的东西......

library(MASS)
qda(type~mono_score+dicot_score,data=mytest)

这是一个猜测。如果你的score变量实际上是factors而不是数字，那么qda会自动尝试从中创建虚拟变量，这将使模型矩阵更宽（本例中为 101 列）并引发您所看到的错误......

bad <- transform(mytest,mono_score=factor(mono_score))
qda(type~mono_score+dicot_score,data=bad)
## Error in qda.default(x, grouping, ...) : 
##    some group is too small for 'qda'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

lineardiscriminant

R 错误：某些组对于“qda”来说太小的相关文章

R：按组，测试一个变量的每个值是否存在于另一个变量中

我有一个数据框架结构如下 a lt c 1 1 1 2 2 2 3 3 3 3 4 4 b lt c 1 2 3 1 2 3 1 2 3 4 1 2 c lt c NA NA 2 NA 1 1 NA NA 1 1 NA NA df lt
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
如何在 R 中的 dygraph 标题中使用 UTF-8 字符

使用 Rstudio Windows8 当我使用 dygraph 函数绘制时间序列时在尝试在主标题中使用 UTF 8 字符时遇到问题 library dygraphs dygraph AirPassengers main T tulo 这
如何将旋转的 NetCDF 转换回正常的纬度/经度网格？

我有一个带有旋转坐标的 NetCDF 文件我需要将其转换为正常的纬度经度坐标经度为 180到180 纬度为 90到90 library ncdf4 nc open dat nf 对于尺寸它显示 1 5 variables exclu
R 改变构面的顺序

我正在尝试将方面的顺序从 BA SLG 更改为 SLG BA 我发现了与此类似的问题但我认为我的解决方案可能不起作用因为我已经在Excel中汇总了数据因此我的数据框可能会有所不同无论如何我尝试实现这个但无济于事 df2 lt f
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
斯皮尔曼相关性和联系

我正在一小组配对排名上计算斯皮尔曼的 rho 斯皮尔曼因处理领带不当而闻名例如取2组8个排名即使两组中有6个是平局相关性仍然很高 gt cor test c 1 2 3 4 5 6 7 8 c 0 0 0 0 0 0 7 8 met
如何在R中实现countifs函数（excel）

我有一个包含 100000 行数据的数据集我尝试做一些countifExcel 中的操作但速度慢得惊人所以我想知道R中是否可以完成这种操作基本上我想根据多个条件进行计数例如我可以指望职业和性别 row sex occupati
如何根据多个条件创建列？

我有一个数据框我想根据多个条件创建一个列 v1 v2 v3 v4 v5 4 1 2 4 5 5 5 2 4 5 6 21 9 20 30 50 6 4 5 7 9 10 3 6 5 9 基本上使用以下可能的值创建 v6 Cat dog
devtools::test() 有效，但 devtools::check() 无效。为什么？

我正在测试this https github com beanumber etlR 包以下三件事就可以正常工作 devtools test devtools test file tests testthat R Travis CI 与 R
计算字符串向量中连续数字的函数

我想创建一个函数它接受至少 1 个元素的字符串对象并包含数字 2 到 5 并确定是否存在至少 N 长度的连续数字其中 N 是实际数字值如果是则返回字符串 true 否则返回字符串 false 例如 Input 555123 Outp
识别包含字符串的行的最快方法[重复]

这个问题在这里已经有答案了我有一个字符串数据框尺寸为 30 列 x 500 万行我想识别包含任何预定义字符串列表的行有没有比下面我的 apply any 方法更快的方法这是一个可重现的示例请注意此示例中的字符串是随机数但在我
rpart 决策树中的 rel 误差和 x 误差有什么区别？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个来自 UCI 机器学习数据库的纯分类数据框https archive ics uci edu ml datasets Diabet
如何使用 ggplot2 将 IPCC 点画添加到全球地图

我需要将 IPCC style 点画添加到全球地图中如下所示这个帖子 https stackoverflow com questions 11736996 adding stippling to image contour plot 不过
用于安装 R 软件包的备用编译器：clang：错误：不支持的选项“-fopenmp”

我正在尝试在 OS X 10 11 6 上使用 R 版本 3 4 0 安装 rJava 包 install packages rJava type source 我收到以下错误 clang o libjri jnilib Rengine o
autoplot.microbenchmark 实际绘制了什么？

根据文档 microbenchmark autoplot 使用 ggplot2 生成更清晰的微基准计时图凉爽的让我们尝试一下示例代码 library ggplot2 tm lt microbenchmark rchisq 100 0 r
Linux 中的 R 有哪些可用的 IDE？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Linux 中的 R 有哪些好的 IDE 我尝试过 Rcmdr 和 Eclipse 但似乎都不具有与 Windows 中的 Tinn R
如何绘制 Voronoi 曲面细分的多边形而不是线段？

我找到了一种使用 ggplot2 绘制 Voronoi 曲面细分的分段的方法 library deldir library ggplot2 library ggthemes set seed 123 df lt data frame lat

随机推荐

如何防止用户关闭我的应用程序？

我有一个将在餐厅使用的 Android 应用程序所以我希望用户无法退出该应用程序用户唯一可以做的就是使用应用程序如果可能的话只有管理员可以通过登录或重新启动设备退出应用程序我不知道哪种方法是最好的方法有解决方案或其他方法来做到这
PayPal iOS 和 Android SDK 中的 PAYMENT_CREATION_ERROR

今天我在 iOS 应用程序中使用 PayPal 结帐时遇到问题用户登录后我收到错误 PayPal SDK 请求失败出现错误 PAYMENT CREATION ERROR 设置此付款时出现问题请访问 PayPal 网站检查您的帐户
虚拟审判室设计

作为我的硕士项目的一部分我建议构建一个用于零售服装店的虚拟试用室应用程序目前它旨在直接在商店中使用但也可能扩展到在线商店该应用程序将通过在屏幕上的 3D 复制品上展示选定的服装向客户展示所选服装的外观它涉及3个步骤评估客户
C++11 Polyfills

我正在开始一个新项目目标是MSVC GCC latest GCC 4 3 ARM和更多这waf我们已经构建了构建系统C 11编译器的功能检测我现在拥有针对我目标的编译器中所有功能的预处理器宏C 11 例如 ifdef WAF FEAT
C++绘制像素问题

如何制作窗口或者更像剪辑区域我可以在其中绘制像素它可能使用 WinApi 但是我不希望我的项目看起来像 winapi 所以它将有 int main 代替 int WINAPI WinMain HINSTANCE 我找到了一个例子我可
django admin - 如何显示缩略图而不是文件路径

我正在尝试在管理界面中显示模型的缩略图当我使用 list display 添加图像字段时它显示文件的路径而不是图像本身如何显示图像并控制其大小我通过添加解决了这个问题 def image thumb self return img
有哪些开源 C 项目值得学习来学习好的设计？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有哪些小型 C 语言开源项目对于学习良好的设计很有趣该项目应该是不太大像linux内核有据可查也许仍在积极开发中我刚刚开始学习
错误：未指定模块（IntelliJ IDEA）

我试图在 IntelliJ IDEA 中作为静态 Web 项目执行一个简单的程序我是新手正在学习使用 Node js 进行 Web 开发我向IntelliJ IDEA官网寻求帮助但错误还是一样不过我还配置了设置和项目结构 Err
我怎样才能说服 IE 只显示 application/json 而不是提供下载它？

在调试使用 AJAX 的 jQuery 应用程序时我经常需要查看服务返回到浏览器的 json 因此我会将 JSON 数据的 URL 放入地址栏中这对于 ASPNET 来说很好因为如果出现编码错误我可以在浏览器中看到 ASPNET
从 SQL 脚本调用 aspnet_regsql.exe

如何打电话aspnet regsql exe来自 SQL 脚本谢谢你可以看看xp cmdshell http msdn microsoft com en us library aa260689 SQL 80 aspx xp cmdshe
需要与 Microsoft.SqlServer.Management.Smo Transfer 类连接的帮助

我试图复制所有内容数据索引触发器存储过程在 C 中从一个数据库到另一个数据库这是我的代码 SqlConnection connection new SqlConnection ConnectionString Server my
通过减去属性来获取两个对象的差异

我试图找出两个物体之间的差异 previousChart BWP 1 ZAR 1 3 USD 0 09324 number 1 currentChart BWP 1 ZAR 1 35 USD 0 01 number 2 期望的答案是 new
如何让 Swing 应用程序感知屏幕尺寸变化？

当我的 swing 应用程序运行时我更改屏幕尺寸例如从 1024x768 更改为 800x600 我可以收听任何活动以获得有关此事件的通知吗或者我可以每隔几秒检查一次屏幕尺寸但 Toolkit getScreenSize 不断告诉
在 Apache Spark SQL 中我们可以回滚事务吗

我想让spark sql将数据持久化这样的话我可以使用回滚我们已经持久化的数据吗前任假设我们有 3 个表 t1 t2 和 t3 t1 和 t2 表数据已成功保留但 t3 在数据完整性级别上失败了那么我可以回滚我已经坚持的 t1 和
python 中的日志精度

以下是检查数字是否可以用幂表示的源代码但为什么代码失败n 76 89 1 and n 76 89 我该如何解决这个错误对于两个 n 给出x log n 2 log i 2 89 0 from math import log sqrt f
Amazon ElasticBeanStalk 工作线程层无法连接到 SQS

目前我在允许我的工作人员连接到 SQS 时遇到问题这是日志 2014 07 21T21 37 26Z error AWS SQS Errors AccessDenied Access to the resource https sqs
从 java.util.date 转换为 JodaTime

我想转换一个java util Date to JodaTime以便在日期之间进行减法有没有一个好的简洁方法来转换Date to JodaTime java util Date date DateTime dateTime new Dat
如何在网页中动态显示 ping 输出？

作为诊断页面的一部分我希望用户能够运行 ping 即一个普通的 shell 命令将 ICMP ECHO REQUST 发送到某个 IP 并在浏览器的 div 中动态显示结果后端是 Ruby Rails 我已经在服务器端运行该命令并读取
如何使用 FCM 向特定用户发送通知？

我为 FCM 准备了接收器可以向所有设备发送通知 gcm http googleapis com gcm send使用此链接可以发送给注册的目标用户并发布到目标设备如下所示 json notification title sample
R 错误：某些组对于“qda”来说太小

我用的是MASS qda 找到我的数据的分类器它总是报告某些群体对于 qda 来说太小了是由于我用于模型的测试数据的大小吗我将测试样本大小从 30 增加到 100 它报告了相同的错误求助啊啊啊啊啊 set seed 1345 Al

R 错误：某些组对于“qda”来说太小

R 错误：某些组对于“qda”来说太小 的相关文章

随机推荐

热门标签

R 错误：某些组对于“qda”来说太小的相关文章