如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？

2024-03-31

使用 R 中的虹膜数据集，我尝试将朴素贝叶斯分类器拟合到虹膜训练数据，以便我可以为朴素贝叶斯分类器生成训练数据集（预测与实际）的混淆矩阵，错误分类率是多少朴素贝叶斯分类器？

到目前为止，这是我的代码：

 iris$spl=sample.split(iris,SplitRatio=0.8)
 train=subset(iris, iris$spl==TRUE)
 test=subset(iris, iris$spl==FALSE)

 iris.nb <- naiveBayes(Species~.,data = train)
 iris.nb

 nb_test_predict <- predict(iris.nb, train)

关于如何解决这个问题有什么建议吗？

Package caret包括confusionMatrix返回非常完整的输出的函数。

library(e1071)
library(caTools)
library(caret)

iris$spl = sample.split(iris, SplitRatio = 0.8)
train <- subset(iris, iris$spl == TRUE)
test <- subset(iris, iris$spl == FALSE)

iris.nb <- naiveBayes(Species ~ ., data = train)

nb_train_predict <- predict(iris.nb, test[ , names(test) != "Species"])

cfm <- confusionMatrix(nb_train_predict, test$Species)
cfm

# Confusion Matrix and Statistics
# 
# Reference
# Prediction   setosa versicolor virginica
# setosa         17          0         0
# versicolor      0         14         1
# virginica       0          2        16
# 
# Overall Statistics
# 
# Accuracy : 0.94            
# 95% CI : (0.8345, 0.9875)
# No Information Rate : 0.34            
# P-Value [Acc > NIR] : < 2.2e-16       
# 
# Kappa : 0.9099          
# Mcnemar's Test P-Value : NA              
# 
# Statistics by Class:
# 
#                      Class: setosa Class: versicolor Class: virginica
# Sensitivity                   1.00            0.8750           0.9412
# Specificity                   1.00            0.9706           0.9394
# Pos Pred Value                1.00            0.9333           0.8889
# Neg Pred Value                1.00            0.9429           0.9688
# Prevalence                    0.34            0.3200           0.3400
# Detection Rate                0.34            0.2800           0.3200
# Detection Prevalence          0.34            0.3000           0.3600
# Balanced Accuracy             1.00            0.9228           0.9403

将混淆矩阵显示为 ggplot 图形：

library(ggplot2)
library(scales)

ggplotConfusionMatrix <- function(m){
  mytitle <- paste("Accuracy", percent_format()(m$overall[1]),
                   "Kappa", percent_format()(m$overall[2]))
  p <-
    ggplot(data = as.data.frame(m$table) ,
           aes(x = Reference, y = Prediction)) +
    geom_tile(aes(fill = log(Freq)), colour = "white") +
    scale_fill_gradient(low = "white", high = "steelblue") +
    geom_text(aes(x = Reference, y = Prediction, label = Freq)) +
    theme(legend.position = "none") +
    ggtitle(mytitle)
  return(p)
}

ggplotConfusionMatrix(cfm)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

naivebayes

如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？的相关文章

如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
我可以使用哪个 R 函数来查找两条线的交点？

我刚刚研究了 stackoverflow 上所有的在 R 中寻找交集问题它们要么是关于曲线要么是关于分布像这个 https stackoverflow com questions 20519431 finding point of
行对名称中具有特定模式的列求和

我有一个像这样的数据表 DT lt ata table data table ref rep 3L 4L nb 12 15 i1 c 3 1e 05 0 044495 0 82244 0 322291 i2 c 0 000183 0 155
如何按定义的顺序将图像合并到一个文件中

我有大约 100 张图像 png 我不想手动执行此操作而是希望将它们按照定义的顺序基于文件名并排放置在一个 pdf 中每行 12 个图像有人有什么建议吗我按照下面托马斯告诉我的方法尝试了它把它们贴在旁边有一个黑边我怎样才能去
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
R：按组，测试一个变量的每个值是否存在于另一个变量中

我有一个数据框架结构如下 a lt c 1 1 1 2 2 2 3 3 3 3 4 4 b lt c 1 2 3 1 2 3 1 2 3 4 1 2 c lt c NA NA 2 NA 1 1 NA NA 1 1 NA NA df lt
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
使用数据帧的 R 中的 EWMA 波动性

我正在尝试从一系列股票每日收益中获取 EWMA 波动性这些收益来自一个名为base retorno diario Data IBOV ABEV3 AEDU3 ALLL3 BBAS3 BBDC3 BBDC4 1 2000 01 04 0 0
扩展数据框以使其具有与原始行中两列的范围一样多的行[重复]

这个问题在这里已经有答案了我有一个数据框如下 structure list symbol c u n v i a start c 9L 6L 10L 8L 7L end c 14L 15L 12L 13L 11L Names c symb
R：单纯形错误：在下标赋值中不允许使用 NA

对于以下具有目标函数和约束的最小化 boot simplex返回错误 Error in tab pr lt tab pr tab pr pc pv o tab pr NAs are not allowed in subscripted as
R - 基于列名称的子集

我的数据框有超过 120 列变量我想根据列名称创建子集例如我想创建一个子集其中列名称包含字符串心情这可能吗我一般用 SubData lt myData grep whatIWant colnames myData 我很清楚
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
在 R 上安装 TDA 包时出错：目标“diag.o”的配方失败

使用 Ubuntu 16 04 和 R 3 4 1 安装 R 包 TDA 时收到错误消息它似乎与制作 CGAL diag cpp 和或 diag o 最后的完整错误打印输出有关我仔细看了这个在 R 上安装 TDA 包时出错 htt
条件和分组 mutate dplyr

假设我有以下每个抽屉库存增加的数据 gt socks year drawer nbr sock total 1990 1 2 1991 1 2 1990 2 3 1991 2 4 1990 3 2 1991 3 1 我想要一个二进制变量来标
将整个包传递给雪簇

我正在尝试并行化使用snow parLapply 一些依赖于包即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群而不必显式命名每个函数包括用户函数调用的
是否有weighted.median()函数？

我正在寻找类似形式的东西weighted mean 我通过搜索找到了一些解决方案这些解决方案写出了整个函数但希望有一些更用户友好的解决方案以下软件包都有计算加权中位数的函数 aroma light isotone limma cwhm
R：改变堆积条形图的颜色

library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g
使用“assign()”为列表项分配值

首先了解一些背景我写了一个中缀函数本质上取代了这个习惯用法 x length x 1 lt y 或者简单地说x lt append x y 对于向量这里是 lt function x y xcall lt substitute x x
闪亮井板宽度

library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d

随机推荐

Excel VBA 条件格式未执行

这很奇怪我正在从 MS Access 2003 VBA 创建 Excel 2003 电子表格编码包括条件格式如果单元格值大于 a value 则为红色如果小于 a value 则为绿色即使在生成电子表格时成功创建了 CF 公式但
从文件中读取最后一行

我遇到了一个问题我在 Linux 机器上有一个日志其中写入了多个正在运行的进程的输出这个文件有时会变得非常大我需要读取该文件的最后一行问题是此操作将经常通过 AJAX 请求调用当该日志的文件大小超过 5 6MB 时这对服务器来
PySpark PCA：避免 NotConvergedException

我试图通过 ml linalg 方法使用 PCA 来减少广泛的数据集 51 个特征约 1300 个个体如下所示 1 将我的列命名为一个列表 features indi prep df select c for c in indi pre
bootstrap下拉菜单根据屏幕位置自动下拉？

我想知道你们中是否有人已经准备好我所要求的东西以帮助我摆脱麻烦我正在寻找的是一个下拉菜单可以根据其在屏幕上的位置自动添加下拉类并且当用户滚动或调整窗口大小时也会自动更改我正在寻找的内容已经在 bootstrap select 插件
.net Core amd Roslyn CSharpCompilation，类型“Object”在未引用的程序集中定义

我正在尝试将一些 net 代码移植到新的 Core 运行时但在移植一些即时编译时遇到了麻烦要恢复它总是要求我引用 System Runtime 和 mscorlib 但不知道如何引用它们附带说明一下我无法引用 Framework
如何修复致命异常：Resources$NotFoundException：资源 ID #0x20c003b DeviceFormFactor.java 第 107 行 org.chromium.ui.base.DeviceFormFactor.a

在 crashlytics 中得到这个不知道问题出在哪里 Fatal Exception android content res Resources NotFoundException Resource ID 0x20c003b at a
使用 JavaScript 加密本地存储的数据

当我学习 JavaScript 和 HTML5 时我正在尝试构建一个基本的测验应用程序该应用程序会提出一些可在移动网络上运行的多项选择题并且也可以作为使用 PhoneGap 的应用程序当提出问题时结果会存储在本地我希望 Phon
java.lang.NoClassDefFoundError: org.joda.time.DateTime

在 android 4 3 API 18 上启动应用程序时出现此错误没有编译错误并且库已添加到build gradle中 compile joda time joda time 2 9 2 在 android api 23 上工作没有问
Neo4j cpu 卡在 GC 上

突然间工作了一个月后 CPU 几乎没有使用 1 到 5 之间 neo4j 服务器在垃圾收集时 cpu 占用率达到 100 我在 ubuntu 4 处理器服务器上运行 neo4j entherprise 2 0 3 未嵌入这是我的 neo
将 XSD 导入 OpenAPI

我的 XSD 文件中有一些模型定义我需要从 OpenApi 定义中引用这些模型由于文件太大手动重新建模是不可能的我需要将其放入构建系统中这样如果 XSD 发生更改我可以为 OpenApi 重新生成模型架构我尝试过并且几乎有效
Flutter - 每次关闭应用程序时存储对象列表的最佳方式？

情况我对 Flutter 和移动开发都很陌生因此对 Dart 不太了解我已经从有类似问题的人那里阅读了一些解决方案但没有设法将这些解决方案应用于我自己的事情问题我有一个待办事项应用程序它有 2 个对象列表我想在用户重新打开应
在 Eclipse/RCP 中定位工具栏

我正在开发我的小型 RCP 应用程序它需要一个自定义透视切换器来控制用户可以访问哪些视图所以我在这里尝试添加一个带有几个按钮的工具栏来切换视角我认为对这些内容进行一些控制的最佳方法是在 Application ActionBar Ad
如何尽快有效地发出数千个网络请求

我需要从 C 控制台应用程序发出 100 000 个轻量级即小内容长度 Web 请求我可以做到这一点的最快方法是什么即在尽可能短的时间内完成所有请求以及我应该遵循哪些最佳实践我不能一劳永逸因为我需要捕获响应大概我想用async
MongoDB：匹配嵌套数组元素的计数

我有一个简单的父子对象作为文档存储在 MongoDB 中像 Order OrderItems 这样简单的东西订单有一个 OrderItem 数组我想要做的是查询满足一组条件的订单项目的数量示例在订单 999 中找出数量为 3 的
PostgreSQL 立即选择值并递增

我正在寻找以下可能的解决方案我将数据存储在表中以跟踪客户在数据库中想要的特殊增量编号这是他们内部使用的特殊号码我想要做的是当我选择它时自动增加表中的这个数字因此我不存在使用该系统的其他人使用相同 ID 号进行另一笔交易的问题所
使用内容重命名 PDF 文件的批处理脚本

我有一个批处理脚本用于提取 PDF 信息并重命名 PDF 该脚本对于 1 个 PDF 文件运行良好但我需要直接在folder有很多 PDF 文件那么该怎么做呢该脚本需要针对每个 PDF 文件逐个运行直至结束一旦 PDF 文件被重
UWP，如何处理图像和缩放？

我们有一个 Xamarin Forms 项目它将在 Android iOS 和 UWP 上运行在 Android 上不同的文件夹中有许多不同的图像以支持大量不同的屏幕和 PPI 在 iOS 上您有类似的系统 2x 3x 等我一
Android 相机教程（使用 SurfaceView）

这是我的示例代码 package newslab video server import android app Activity import android hardware Camera import android os Bundl
MUI：将分页移动到 DataGrid 的顶部？

有谁知道我如何移动标准XGrid分页到表格上方或者我是否必须创建自己的自定义分页而不使用内置的XGrid 没有公共 API 可以将分页组件放在顶部但您可以使用以下 CSS 技巧 const useStyles makeStyles gr
如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？

使用 R 中的虹膜数据集我尝试将朴素贝叶斯分类器拟合到虹膜训练数据以便我可以为朴素贝叶斯分类器生成训练数据集预测与实际的混淆矩阵错误分类率是多少朴素贝叶斯分类器到目前为止这是我的代码 iris spl sample split

如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？

如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？ 的相关文章

随机推荐

热门标签

如何生成混淆矩阵并找出朴素贝叶斯分类器的误分类率？的相关文章