带插入符的主成分分析

2024-05-01

我正在使用 Caret 的 PCI 预处理。

multinomFit <- train(LoanStatus~., 
                     train, 
                     method = "multinom", 
                     std=TRUE, 
                     family=binomial, 
                     metric = "ROC",
                     thresh = 0.85, 
                     verbose = TRUE, 
                     pcaComp=7, 
                     preProcess=c("center", "scale", "pca"), 
                     trControl = ctrl)

我指定,PCA 组件的数量为 7。为什么摘要显示 使用 68 个组件进行拟合?

summary(multinomFit)

Call:
multinom(formula = .outcome ~ ., data = dat, decay = param$decay, 
    std = TRUE, family = ..2, thresh = 0.85, verbose = TRUE, 
    pcaComp = 7)

Coefficients:
                   Values  Std. Err.
(Intercept)  1.6650694329 0.03760419
PC1         -0.1023790683 0.01474812
PC2          0.0375344688 0.01554707
PC3         -0.1012080589 0.01870754
PC4         -0.1004020357 0.02418817
PC5          0.0707421015 0.02403815
PC6          0.0034671796 0.02535015
PC7          0.1218028495 0.02852909
PC8          0.2191031963 0.03291266
PC9          0.1534144811 0.02986523
PC10        -0.0665337138 0.02999863
PC11        -0.1313662645 0.03032963
PC12         0.0668422208 0.03397493
PC13         0.0002770594 0.03282500
PC14        -0.0883400819 0.03337427
PC15         0.0221726084 0.03323058
PC16        -0.0222984250 0.03210718
PC17        -0.0394014147 0.03282160
PC18         0.0280583827 0.03459664
PC19        -0.0295243295 0.03430506
PC20        -0.0149573710 0.03358775
PC21         0.0653722886 0.03388418
PC22        -0.0114810174 0.03583050
PC23        -0.0594912738 0.03376091
PC24         0.0117123190 0.03476835
PC25        -0.0406770388 0.03507369
PC26         0.0373200991 0.03440807
PC27         0.0050323427 0.03366658
PC28         0.0678087286 0.03516197
PC29         0.0234294196 0.03459586
PC30         0.0540846491 0.03464610
PC31         0.1054946257 0.03459315
PC32         0.0216292907 0.03485001
PC33         0.0247627243 0.03488016
PC34         0.0033126360 0.03402770
PC35        -0.0434168834 0.03468038
PC36        -0.0098687981 0.03497515
PC37        -0.0193788562 0.03268054
PC38         0.0572276670 0.03837009
PC39         0.0535213906 0.03737078
PC40         0.0007157334 0.03321343
PC41        -0.0286461676 0.03546742
PC42         0.0640903943 0.03378855
PC43        -0.0111873647 0.03626063
PC44        -0.0304589978 0.03448459
PC45         0.0191817954 0.03690284
PC46        -0.0330040383 0.03277895
PC47         0.0328641857 0.03460263
PC48         0.0204941541 0.03460759
PC49         0.0345105736 0.04002168
PC50         0.0076131373 0.03621336
PC51         0.0082765068 0.03299395
PC52        -0.0594596197 0.03633509
PC53        -0.0276656822 0.03596515
PC54         0.0411414647 0.03529887
PC55        -0.0644394706 0.03490393
PC56        -0.0266971243 0.03403656
PC57        -0.1415322396 0.03681683
PC58        -0.0332329932 0.03469459
PC59        -0.0273683007 0.03524604
PC60         0.0450430472 0.03586438
PC61        -0.0708218651 0.03807458
PC62         0.1523605734 0.03851722
PC63        -0.0385759566 0.03920662
PC64        -0.0602633030 0.03902837
PC65         0.0547553856 0.03970764
PC66         0.0727331180 0.04273518
PC67         0.1142574406 0.04522347
PC68        -0.1059928013 0.04077592

Residual Deviance: 5273.035 
AIC: 5411.035 

最后,有没有办法将描述数据中 85% 变异的 7 个 PCA 因子映射回原始观察中的 7 个输入属性?

提前致谢。


您可以通过以下方式传递预处理选项preProcOptions in trainControl(), 看一下?trainControl。这是一个例子,

ctrl <- trainControl(method = "repeatedcv", 
                     repeats = 3, 
                     classProbs = TRUE,
                     preProcOptions = list(thresh = 0.85), #or list(pcaComp = 7)
                     summaryFunction = twoClassSummary)

multinomFit <- train(LoanStatus~., train, 
                     method = "multinom", 
                     family=binomial, 
                     metric = "ROC",  
                     verbose = TRUE, 
                     preProcess=c("center", "scale", "pca"), 
                     trControl = ctrl)

请注意,如果您指定 PCA 分量的数量pcaComp = 7,这将覆盖thresh(看一下?preProcess)。所以使用其中之一。

您可以通过以下方式查看变量对每个 PCA 分量的贡献:

multinomFit$preProcess$rotation 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

带插入符的主成分分析 的相关文章

  • 如何从 R 中的多列中获取计数?

    我有一个包含三列的数据框 State1 State2 State3 有没有一种方法可以使用所有三列 最好使用 dplyr 并且没有显式循环 来获取一个数据帧中每个状态的计数 我只知道如何做一栏 df gt group by State1 g
  • R 颜色 - 许多独特的颜色仍然很漂亮

    我很好奇你是否有一些关于 R 中颜色酿造的技巧 对于许多独特的颜色 在某种程度上图形仍然好看 我需要相当数量的独特颜色 至少 24 种 可能需要更多 50 种 用于堆叠区域图 所以不是热图 渐变颜色不起作用 我发现了 viridis 它的调
  • 使用非标准评估公式

    我正在创建一个使用的包非标准评价 http adv r had co nz Computing on the language html跟踪列的含义 该包在函数之间传递数据框 这些函数执行同一组列的各种操作 非标准评估对此非常有用 my s
  • 使用操作按钮在闪亮的 R 中添加包含现有数据框的新行

    我正在构建一个闪亮的表单 它将从 textInput 字段获取数据 并将这些输入与文本文件 将通过文件输入上传 组合起来 并在主面板中显示输出 有一个操作按钮用于第一次更新数据 从文本输入中获取数据并与处理后的文本文件合并 我添加了另一个操
  • 在 R 中显示变量的精确值

    gt x lt 1 00042589212565 gt x 1 1 000426 如果我想打印的确切值x 我该怎么办呢 抱歉 如果这是一个愚蠢的问题 我尝试在谷歌上搜索 R 和 精确 或 圆形 但我得到的只是有关如何舍入的文章 先感谢您 所
  • 通过消除嵌套的 for 循环来改进此代码

    R 包corrplot除其他内容外 还包含这个漂亮的功能 cor mtest lt function mat conf level 0 95 mat lt as matrix mat n lt ncol mat p mat lt lowCI
  • 用于安装 R 软件包的备用编译器:clang:错误:不支持的选项“-fopenmp”

    我正在尝试在 OS X 10 11 6 上使用 R 版本 3 4 0 安装 rJava 包 install packages rJava type source 我收到以下错误 clang o libjri jnilib Rengine o
  • 如何绘制 Voronoi 曲面细分的多边形而不是线段?

    我找到了一种使用 ggplot2 绘制 Voronoi 曲面细分的分段的方法 library deldir library ggplot2 library ggthemes set seed 123 df lt data frame lat
  • ggplot2 的 fortify 函数出错

    我在 ggplot2 中使用 fortify 方法时收到此错误 Error in function classes fdef mtable unable to find an inherited method for function pr
  • 在R中,按特定字符分割字符向量;将第三块保存在新向量中

    我有一个格式为 aaa 9999 1 的数据向量 其中第一部分是字母位置代码 第二部分是四位数年份 最后部分是唯一的点标识符 例如 有多个 sil 2007 X 点 每个点都有不同的最后一位数字 我需要使用 字符拆分此字段 并仅将唯一 ID
  • 如何从 ISI Web of Knowledge 检索有关期刊的信息?

    我正在从事一些预测文章引用计数的工作 我遇到的问题是我需要 ISI Web of Knowledge 中有关期刊的信息 他们逐年收集这些信息 期刊影响因子 特征因子 但无法一次下载所有一年期期刊信息 只有 标记全部 选项 该选项始终标记列表
  • 使用 data.table 对分组数据进行插值

    这是我最初发布的问题的延续http r 789695 n4 nabble com subset Between data table list and single data table object tp4673202 html http
  • 根据一个或多个下拉选项创建具有不同类型线型的折线图

    在下面闪亮的应用程序中 我尝试根据侧边栏中的下拉选择创建点线图 我已成功在选择一个指标时创建折线图 但无法选择 2 个指标 为了x and y我想要一个solid线 对于x1 and y1我想要一个dashed线和对于x2 and y2一条
  • 使用 lapply、Reduce 和 union 折叠 data.table 中的行

    我有一个 data table 示例 JACcar 它应该使用下面的代码根据 ID 折叠成一行 但是 我不明白为什么它不会折叠少于 2 行 我还尝试通过将列限制为仅包含 NA 以外的值的列来验证我的输出 因为原始数据中有 123 列 有人可
  • 在 R 中,如何获得某些向量值的所有可能组合?

    背景 我有一个需要一些参数的函数 我想要获得所有可能的参数组合的函数结果 一个简化的例子 f lt function x y return paste x y sep colors c red green blue days c Monda
  • 如何检查向量是否是单个 NA 值,没有长度警告且没有抑制

    我有一个功能NA作为默认值 但如果没有NA应该是一个不限于大小 1 的字符向量 我有一个检查来验证这些 但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
  • 基于两列对数据框中的行进行求和[重复]

    这个问题在这里已经有答案了 我想添加一列的值 将它们按两列分组 我找到了如何在一列上执行此操作 但无法弄清楚如何在两列上执行此操作 例如 如果我有以下数据框 x c a a b b c c a a b b c c a a b b c c y
  • R:从 Github 安装包时出现编码问题

    我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包 这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
  • 连接路径的函数?

    是否有现有的函数来连接路径 我知道实施起来并不困难 但仍然 除了照顾尾随 or 我需要注意正确的操作系统路径格式检测 即我们是否编写C dir file or dir file 正如我所说 我相信我知道如何实施它 问题是 我应该这样做吗 现
  • 获取数据集 R 包中所有对象名称的列表?

    如何获取对象中对象的确切名称列表datasets https stat ethz ch R manual R devel library datasets html 00Index html包裹 我在这里找到了很多 data package

随机推荐