如何使用 caret 包解释模型输出的准确性

2024-06-28

我正在使用 caret 包来训练模型，并希望获得模型的准确性。我听说的一种常见方法是使用confusionMatrix。然而，当我运行下面的代码时，经过训练的模型给出了一些与confuseMatrix() 报告的精度值略有不同的精度值。所以我的问题是我应该使用什么精度？如何解释模型直接在控制台中给出的准确性？

ModelRF_ALL_b <- train(price~.,method="rf",data=datatraining_b)
ModelRF_ALL_b

控制台报告如下

Random Forest 

8143 samples
   8 predictor
   2 classes: '0', '1' 

No pre-processing
Resampling: Bootstrapped (25 reps) 
Summary of sample sizes: 8143, 8143, 8143, 8143, 8143, 8143, ... 
Resampling results across tuning parameters:

  mtry  Accuracy   Kappa    
  2     0.9948108  0.9843501
  4     0.9945824  0.9836512
  7     0.9940732  0.9821099

Accuracy was used to select the optimal model using the largest value.
The final value used for the model was mtry = 2.

我还可以运行confusionMatrix()

confusionMatrix(datatraining_b$price,
predict(ModelRF_ALL_b,datatraining_b))

它的准确度为 1。

Confusion Matrix and Statistics

      Reference
Prediction    0    1
     0 6414    0
     1    0 1729

           Accuracy : 1          
             95% CI : (0.9995, 1)
No Information Rate : 0.7877     
P-Value [Acc > NIR] : < 2.2e-16  

              Kappa : 1          
 Mcnemar's Test P-Value : NA         

        Sensitivity : 1.0000     
        Specificity : 1.0000     
     Pos Pred Value : 1.0000     
     Neg Pred Value : 1.0000     
         Prevalence : 0.7877     
     Detection Rate : 0.7877     
   Detection Prevalence : 0.7877     
  Balanced Accuracy : 1.0000     

   'Positive' Class : 0

您可以将这些值解释为样本内分别是有和没有重采样的精度。

套餐caret当您拟合模型时，会执行 25 次重复的引导重采样，这可以在模型输出中看到。因此，准确度值基于 25 x 8143 个观测值。为了创建混淆矩阵，您使用最终模型（mtry = 2 的模型）来预测训练样本的结果，该样本的长度为 8143。因此，对应的模型存在轻微差异是正常的。准确性。

在评估拟合优度时需要小心，因为您正在使用相同的数据集来训练和评估模型。毫不奇怪，您会获得很高的准确度。使用未见过的数据集评估最终模型总是好的，以确保其性能并检测可能的过度拟合问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

如何使用 caret 包解释模型输出的准确性的相关文章

如何在 dbplyr 中使用自定义 SQL 函数？

我想计算数据库中的 Jaro Winkler 字符串距离如果我将数据带入 R 使用collect 我可以轻松地使用stringdist函数从stringdist包裹但我的数据非常大我想过滤 Jaro Winkler 距离before将
R data.table 使用列作为参数将函数应用于行

我有以下内容data table x structure list f1 1 3 f2 3 5 Names c f1 f2 row names c NA 3L class c data table data frame 我想对每一行应用一个
在 dplyr tbl_df 中获取删除列的最佳实践

我记得 2001 年 r help 上的一条评论说drop TRUE in data frame是 R 历史上最糟糕的设计决策 dplyr纠正这一点并且不会隐式删除当尝试将旧代码转换为dplyr风格这会引入一些讨厌的错误d 1 or d
包“diamonds”不可用（对于 R 版本 3.0.0）[重复]

这个问题在这里已经有答案了在我的 R 环境中拥有钻石包数据集的简单方法是什么我是使用 RStudio 3 0 的新手 gt install packages diamonds Warning in install packages p
使用 R 并行处理 XML 节点

我正在尝试与 R 并行处理 XML 文档xml2包装和foreach功能但我收到 node attrs x node nsMap ns 中的错误外部指针无效尝试导出树集群导出示例代码 library xml2 library for
R 数据框中的重复行

我正在尝试使用下面的代码复制数据框中的行但是我发现它很慢 duprow df 1 for i in 1 2000 print i df rbind df duprow 有更快的方法吗您可以使用rep 例如对于数据框第 1 行的 5 个
我想将两个变量合并为一个具有日期格式的变量

我有一个包含几个月的字符列的数据集 MONTH 和指示年份的数字列 YEAR 为了将其用作面板数据我需要将这些结合起来YEAR and MONTH转换为日期格式的变量我尝试过改变变量MONTH转换为数字格式然后合并MONTH与柱YEA
R 中带有自定义字段类的参考类？

我想在另一个引用类中使用自定义引用类但此代码失败 nameClass lt setRefClass nameClass fields list first character last character methods list ini
如何在其他脚本中包含（源）R 脚本

我创建了一个实用程序 R 脚本 util R 我想从项目中的其他脚本中使用它确保此脚本定义的函数可在我的其他脚本中运行的正确方法是什么我正在寻找类似的东西require函数仅在尚未加载的情况下加载包我不想打电话source util
如何使用核心 R 操作/访问“dist”类实例的元素？

R 中的基本公共类称为 dist 并且是对称距离矩阵的相对有效的表示不像一个 matrix 对象但是似乎不支持操纵 dist 使用索引对实例操作员例如以下代码不返回任何内容 NULL 或出现错误 First create an
Shiny：合并 DT::datatable 中的单元格

我想以闪亮的方式合并 DT datatable 列中的几行可以这样做吗目前我能够输出如下所示但理想情况下我想合并行并希望输出如下所示的内容是否可以在 DT datatable 中合并这样的行在以下人员的帮助下这是可能的数据表行组
照片与 r 中的图形对齐

首先我想我需要在powerpoint中手动完成它然后我想如果有解决方案的话可以尝试使用R 这是我的示例数据 set seed 123 myd lt expand grid cat LETTERS 1 5 cond c F T phase
如何从 R 中的列表列表中提取元素？

我有一堆列表其中包含列表广义线性模型输出我想编写一个函数该函数将从每个列表中提取多个元素然后将结果组合到数据框中我想提取modelset 1 likelihood modelset 1 fixef modelset 2 like
从数据框中提取具有最高值和最低值的行

我对 R 还很陌生我主要用它来可视化统计数据ggplot2图书馆现在我遇到了数据准备的问题我需要编写一个函数该函数将从数据框中删除指定列中具有最高和最低值的一些数字 2 5 或 10 行并将它们放入另一个数据框中并对两个因素的每
Stata的xtnbreg有R函数吗？

一直在使用 Stata 在复制中运行负二项式回归不确定 Stata 是如何做到这一点的但想知道是否有 R 函数包可以做同样的事情 R 会让我更好地了解它是如何工作的因为我可以看到代码看看glm nb函数在MASS包裹如果您对幕
绘图中的文本错误 | Jupyter-R

我正在尝试在通过 Anaconda 安装的 Jupyter 笔记本上使用 R 中的 ggplot2 绘制一个带有一些数据的简单散点图以下是我使用的代码 ggplot data df1 1 1000 geom point mapping a
tmap 仅在 sf 几何列中绘制第一个多边形

tmap 仅绘制 sf 几何列中的第一个多边形但是plot 得到他们全部一些 github 问题tmap https github com mtennekes tmap issues 360 and leaflet https gith
在 R 中创建多维 NetCDF

我正在尝试使用 R 包创建多维 NetCDF 文件ncdf http cran r project org web packages ncdf index html 我正在对一组 1500 个点进行气候日常观测每个点的观测数量约为 182
update() 具有局部协变量的函数内的模型

我需要从函数内部更新回归模型理想情况下该函数应该适用于任何类型的模型 lm glm multinom clm 更准确地说我需要添加函数内部定义的一个或多个协变量这是一个例子 MyUpdate lt function model ra
将多个ggplot2图保存为列表中的R对象并在网格中重新显示

我想在大型 for 循环期间将多个绘图使用 ggplot2 保存到列表中然后随后在网格中显示图像使用 grid arrange 我已经尝试了两种解决方案 1 将其存储在列表中如下所示 pltlist qplot lt qplot 然

随机推荐

从 Bash 中的字符串中删除固定前缀/后缀

我想从字符串中删除前缀后缀例如给定 string hello world prefix hell suffix ld 我如何得到以下结果 o wor prefix hell suffix ld string hello world f
颤动 NO_RENEGOTIATION（ssl_lib.cc：1725）错误 268435638

我不确定为什么我请求的这个 API 仅针对 dart 抛出此错误由于某种原因当我尝试发出 POST 请求时 dart 会抛出此错误未处理的异常 NO RENEGOTIATION ssl lib cc 1725 错误268435638
升级pip有什么用？

虽然 pip 用于从 PyPI 安装和升级其他 Python 包但您能帮我理解为什么需要升级 pip 本身吗我正在开发一个新的 python 项目并将使用 pip 来安装依赖项但是我不确定在安装其他软件包之前是否需要将 pip 升
为什么安装成功后无法导入pandas？

我已经使用命令 pip3 4 install pandas 安装了 pandas Successfully installed pandas python dateutil pytz numpy six Cleaning up root h
来自 CPU/内存使用百分比的 Grafana 警报

我想通过 Grafana 发出警报定义 CPU 或内存使用率是否高于阈值比方说 85 它将触发警报我现在拥有的是时间序列限制CPU 内存 kube pod container resource limits namespace nam
Tweepy 为什么我收到搜索 AttributeError [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案当我运行代码时我收到以下错误消息该代码应返回与指定查询匹配的推文 Twitter 屏蔽了搜索属性吗错误信息 for twee
如何使用Dapper获取存储过程的返回值？

我在 asp net mvc 4 项目 net f w 4 6 1 中使用 Dapper 使用 sql server 2016 Express
如何使用 AOS 触发向上滚动动画

我正在使用 AOS 库 css 和 js 它可以帮助我创建每次用户向下滚动页面时触发的动画我有一个问题页面的顶部元素仅运行一次因为 AOS 仅在向下滚动时触发它我希望我的所有动画在每次用户向下和向上滚动时运行我怎样才能做到呢这是
PostgreSQL 中有类似 SSIS 的功能吗？

我们正在使用SSIS SQL Server 集成服务 http msdn microsoft com en us library ms141026 aspx在 SQL 2008 R2 中将数据库表从 30 多个数据库在 SQL Serv
在数据网格中绑定枚举属性的最佳方法

将枚举属性绑定到数据网格的最佳方法是什么当前我正在使用公共属性并从那里返回枚举名称还有其他方法吗枚举 public enum enStatus Draft 1 Published 2 Started 3 Completed 4 Mode
观察Eclipse中很长的String内容

由于 LogCat 会截断长字符串因此我使用 FileOutputStream 来检查很长字符串的内容来解决此问题它可以工作但它迫使我 adb pull 该文件与在 LogCat 上观看相比这不是很方便 Eclipse中有没有其他
.NET 4.0 是否与 Windows XP SP2 或更低版本兼容？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我读过这里http www microsoft com downloads en details aspx FamilyID 5765
是否可以将tinyInteger或smallInteger添加到laravel ORM上的增量中？

可以将该代码或类似的内容添加到laravel Illuminate Database Schema Blueprint与迁移一起使用 public function incrementsTiny column return this gt
为什么使用 StackTraceElement 时 getLineNumber 返回 -1

我想在检测 java 字节码时获取当前代码行号仪表化是通过ASM实现的在visitcode后面插入getLineNumber对应的字节码返回值为 1 但在其他位置插桩得到的返回值正常例如源码如下 public static int
球衣：com.sun.jersey.server.impl.template.ViewableMessageBodyWriter

我对泽西岛完全陌生我正在尝试运行一个抛出异常的罐子javax ws rs WebApplicationException当我到达终点时程序抛出的错误如下 2011 年 4 月 9 日 08 32 20 com sun jersey sp
在 DLL 中使用 IXMLDocument 需要 CoInitialize？

有没有理由使用CoInitialize使用时在我的 DLL 函数中IXMLDocument msxml 包装器或与此相关的其他 com 对象调用应用程序线程是否负责调用CoInitialize CoUninitialize 如果我使用
CocoaPods 找不到 pod“Firebase/CoreOnly”的兼容版本

我已经将我的 flutter 包更新到最新版本现在 IOS 不再工作了当我尝试更新 Pod 时它显示此错误 CocoaPods could not find compatible versions for pod Firebase C
使用 Numpy 或 Scipy 的累积乘积

我有一个一维 numpy 数组我希望将其转换为其累积乘积一个幼稚的实现是这样的 import numpy as np arr 1 2 3 4 5 6 7 8 9 10 c sum np prod arr i for i in range
如何使用基于表单登录的 Java Web 应用程序通过 AJAX 处理身份验证

我有一个在WebSphere 7上运行的java Web应用程序该应用程序使用表单身份验证方法并且应用程序的一部分使用ajax请求访问一些受保护的资源但是当用户的会话过期时我将获取登录页面来代替应该由 ajax 请求刷新的内容有
如何使用 caret 包解释模型输出的准确性

我正在使用 caret 包来训练模型并希望获得模型的准确性我听说的一种常见方法是使用confusionMatrix 然而当我运行下面的代码时经过训练的模型给出了一些与confuseMatrix 报告的精度值略有不同的精度值所以我的

如何使用 caret 包解释模型输出的准确性

如何使用 caret 包解释模型输出的准确性 的相关文章

随机推荐

热门标签

如何使用 caret 包解释模型输出的准确性的相关文章