混淆矩阵和列联表有什么区别？

2024-02-27

我正在编写一段代码来评估我的聚类算法，我发现每种评估方法都需要来自m*n类似矩阵A = {aij} where aij是属于类成员的数据点的数量ci和簇的元素kj.

但似乎有两个这种类型的矩阵数据挖掘简介（Pang-Ning Tan 等），一个是混淆矩阵，另一个是列联表。我不完全理解两者之间的区别。哪个最能描述我想要使用的矩阵？

维基百科的定义 http://en.wikipedia.org/wiki/Confusion_matrix:

在人工智能领域，混淆矩阵是一个可视化工具通常用于监督学习（在无监督学习通常称为匹配矩阵）。每个矩阵的列表示预测类中的实例，而每一行代表实际类中的实例。

混淆矩阵应该很清楚，它基本上告诉了有多少实际结果与预测结果相匹配。例如，请参阅这个混淆矩阵

                 predicted class
                        c1  -  c2
  Actual class   c1     15  -   3
                ___________________
                 c2     0   -   2

它告诉我们：

第 1 列、第 1 行表示分类器已预测 15 个项目属于该类c1，实际上有 15 个项目属于该类c1（这是正确的预测）
第二列第 1 行表明分类器已预测 3 个项目属于该类别c2，但它们实际上属于类c1（这是一个错误的预测）
第 1 列第 2 行表示没有任何项目实际属于该类c2已被预测属于类别c1（这是一个错误的预测）
第 2 列第 2 行表明 2 个项目属于该类c2已被预测属于类别c2（这是正确的预测）

现在看看你书上的准确率和错误率的公式（第4章，4.2），你应该能够清楚地理解什么是混淆矩阵。它用于使用具有已知结果的数据来测试分类器的准确性。 K-Fold 方法（书中也提到了）是计算分类器准确性的方法之一，您的书中也提到了这一点。

现在，对于列联表：维基百科的定义 http://en.wikipedia.org/wiki/Contingency_table:

在统计学中，列联表（也称为交叉表）制表或交叉表）是一种矩阵格式的表格，显示变量的（多变量）频率分布。常用于记录和分析两个或两个事物之间的关系更多分类变量。

在数据挖掘中，列联表用于显示哪些项目一起出现在阅读中，例如在交易中或销售分析的购物车中。例如（这是你提到的书中的示例）：

       Coffee  !coffee
tea    150       50      200
!tea   650       150     800
       800       200    1000

它表明，在 1000 个回复中（关于他们喜欢咖啡和茶还是两者或其中之一的回复，调查结果）：

150 人既喜欢茶又喜欢咖啡
50 人喜欢茶但不喜欢咖啡
650人不喜欢茶但喜欢咖啡
150 人既不喜欢茶也不喜欢咖啡

列联表用于查找关联规则的支持度和置信度，基本上是为了评估关联规则（请参阅第 6 章 6.7.1）。

现在的区别在于，混淆矩阵用于评估分类器的性能，它告诉分类器对分类进行预测的准确性，而列联表用于评估关联规则。

现在，读完答案后，谷歌一下（在阅读书本时始终使用谷歌），阅读书中的内容，看一些示例，并且不要忘记解决书中给出的一些练习，您就会应该对它们有一个清晰的概念，以及在特定情况下使用什么以及为什么使用。

希望这可以帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

matrix

clusteranalysis

datamining

difference

混淆矩阵和列联表有什么区别？的相关文章

矩阵求逆 R

我想求逆方形对称正定矩阵我知道有两个功能solve and chol2inv 在 R 中但他们的结果是不同的我需要知道为什么会发生这种情况谢谢以下是计算矩阵逆的几种方法包括solve and chol2inv gt A lt m
查找矩阵每行中 1 的列索引

我在 Matlab 中有以下矩阵 M 0 0 1 1 0 0 0 1 0 1 0 0 0 0 1 每行恰好有一个 1 我如何不循环确定列向量以便如果第二列中有 1 第一个元素是 2 如果第三列中有 1 第二个元素是 3 等等上面的例
网页抓取、屏幕抓取、数据挖掘技巧？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
R 矩阵可以包含不同的数据类型吗？这个被修改的列表矩阵有用吗？

我读了这些 https stackoverflow com a 5159049 1175496 https stackoverflow com a 5159049 1175496 Matrices are for data of the s
使用 R 查找包含最大值的行索引

给定以下矩阵假设我想找到第二列中的最大值 mat lt matrix c 1 3 7 9 4 6 byrow T nc 3 mat 1 2 3 1 1 2 3 2 7 8 9 3 4 5 6 I know max mat 2 将返回 8
RcppEigen - 从包中的内联函数到 .cpp 函数和“Map”

一切似乎都在我的包中工作但我想检查其步骤是否正确以及使用 Map 的内存使用情况这是一个简单的示例位于内联示例和fastLm 例子这是一个内联函数它取矩阵每一列的最大值 library Rcpp library inline li
给定焦点和相机主中心，如何创建透视投影矩阵

我设法使用 OpenCV 获取相机的内在和外在参数因此我有 fx fy cx 和 cy 我还有屏幕图像的宽度和高度但是如何根据这些参数创建 OpenGL 透视投影矩阵呢 glFrustum 展示了如何在给定 Z 近 Z 远以及图像宽度
在 Matlab 中生成加权随机布尔矩阵

我想生成一个5x5MatLab 中的矩阵仅由 1 和 0 组成但是我希望能够设置任何值为 1 的可能性我希望任何元素有 90 的机会为 1 而不是 0 然而我不希望总是有 90 的 1 和 10 的 0 我只是希望这种情况更有可能发生
Tensorflow 中的张量乘法

我正在尝试在 NumPy Tensorflow 中进行张量乘法我有 3 个张量 A M X h B h X N X s C s X T 我相信A X B X C应该产生一个张量D M X N X T 这是代码同时使用 numpy 和 t
如何在Matlab中计算两个矩阵之间的快速外积？

我有两个 n m 矩阵 A and B 我想创建一个新的矩阵C类似于 for i 1 n C C outerProduct A i B i end i e C是一个大小为 m x m 的矩阵即各行的所有外积之和A and B 有没有一种无
连接每第 n 行

我在矩阵中得到了一个数据集如下所示从 Excel 导入 matrix Cat1 1 2 3 4 Cat2 9 10 11 12 Cat3 17 18 19 20 Cat1 5 6 7 8 Cat2 13 14 15 16 Cat3 21
贪心聚类算法速度提升

我正在尝试在 python 中实现一个非常简单的贪婪聚类算法但很难优化它的速度该算法将采用距离矩阵找到具有最多小于预定距离截止值的分量的列并将行索引具有小于截止值的分量存储为簇的成员簇的质心是列索引然后从距离矩阵中删除每个
如何使用浮点数组中的数据初始化 cv::Mat

我需要创建一个cv Mat用我的数据初始化的变量float 大批这应该是基本的但我很难弄清楚我有代码 float matrixAB lt 120 floating point array created elsewhere gt cv
eigen(corr) 中的错误：制作“相关矩阵圆图”时“x”中存在无限值或缺失值

我想制作一个如下所示的相关矩阵然而 R一直告诉我 Error in eigen corr infinite or missing values in x 相关矩阵圆 http gallery r enthusiasts com graph
从矩阵中删除零行（优雅的方式）

我有一个包含一些零行的矩阵我想删除零行矩阵是Nx3 我所做的很简单我创造std vector其中每三个元素代表一行然后我将其转换为Eigen MatrixXd 有没有一种优雅的方法来删除零行 include
R：有没有一种简单有效的方法来获取分块对角矩阵的构建分块矩阵列表？

我正在寻找一个内置函数它通过以下方式有效地返回块对角矩阵的构建块列表而不是迭代插槽以手动获取列表 construct bdiag matrix library Matrix listElems lt list matrix 1 4
如何有效地对一个数组中某个值在另一个数组中的位置出现的次数求和

我正在寻找一种有效的 for 循环避免解决方案来解决我遇到的数组相关问题我想使用一个巨大的一维数组 A gt size 250 000 用于一维索引的 0 到 40 之间的值以及用于第二维索引的具有 0 到 9995 之间的值的相同大
在Matlab中将矩阵中的元素i,j设置为i*j

我想生成一个矩阵其中 i j 元素等于 i j 其中 i j e g 0 2 3 2 0 6 3 6 0 到目前为止我已经发现我可以使用这个索引矩阵访问非对角线元素 idx 1 eye 3 但我还没有弄清楚如何将矩阵单元的索引合并到计算
PHP 矩阵的逆矩阵

I saw 这个问题 https stackoverflow com questions 211160 python inverse of a matrix 并弹出这个想法 PHP 有没有一种有效的方法来做到这一点 EDIT 最好有演示你
如何对搜索引擎关键词进行聚类？

从 Google Analytics 中我有一个长关键字列表人们在搜索引擎中使用这些关键字来查找我的网站我想找到核心关键词假设的例子 java online training learning java scala train

随机推荐

如何从枚举对象的类型和值的名称创建枚举对象？

我有一个枚举类型 System Type 和一个包含要设置的枚举值的字符串例如给定 enum MyEnum A B C 我有 typeof MyEnum 和 B 如何创建设置为 MyEnum B 的 MyEnum 对象 MyEnum e
如何向清单文件中的应用程序标记添加两个 android:name 属性？

我的 Android 应用程序需要两个应用程序类一个是 volley AppController 另一个是 Analytics 类我很困惑如何一次添加这两个类请帮助我让我摆脱这个困境您需要实现多级继承来解决这种情况这是你的场景
是否存在与 Fortran 配合良好的 ncurses 或类似库？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 ncurses 库最初是用 C 语言开发的如果没记错的话是否有一个端口或者是否存在可以在 Wi
是否可以对用笔尖初始化的 WindowController 进行单元测试？

我有一个简单的 Mac OS 应用程序默认情况下MainMenu xib 在那里我有第二个窗口用于偏好设置和PreferencesWindowController 我想让以下测试工作 implementation TestPreferen
带有两个参数包的函数模板重载解析

考虑以下代码 include
Prop 和 Type 的不同归纳原理

我注意到 Coq 综合了关于 Prop 和 Type 等式的不同归纳原理有人对此有解释吗平等定义为 Inductive eq A Type x A A gt Prop eq refl x x 与之相关的归纳原理有以下类型 eq ind
JTextArea 更新为 DocumentListener

JTextArea area1 new JTextArea JTextArea area2 new JTextArea DocumentListener documentListener new DocumentListener publi
使用模块中的方法模拟类

我正在使用 PowerShell 2 0 无法升级并且正在编写一系列使用 Active Directory 中的一些信息的脚本来自 C 等 OOP 语言我想在 PowerShell 2 0 中模拟一个类但我知道它们只有class5
程序卡住，管道文件描述符何时不应该打开？

我正在创建一个可以读取命令的小 shell 当我运行我的程序并输入 cat file txt gt file2 txt 它创建了文件然后卡在了这一行 if execvp structVariables gt argv 0 argv lt
矩阵的滑动窗口求和

我有一个 50x50 矩阵我想对每个 10x10 或另一个设定大小值始终是正方形重叠网格中的值求和即为了清楚起见重叠的窗口仅以对角线显示我尝试做的第一个任务是定义每个窗口的坐标 win 10 start 1 10 1 10 f
PHP cURL，使用 CURLOPT_RETURNTRANSFER 时出现内存泄漏

下面的代码是在一个循环中每个循环都会将 URI 更改为新地址我的问题是每次传递都会占用越来越多的内存 ch curl init curl setopt ch CURLOPT URL URI curl setopt ch CURLOPT
MySQL 与 Sequelize：ER_BAD_DB_ERROR：未知数据库

我正在遵循教程下面是代码 var Sequelize require sequelize var sequelize new Sequelize basic mysql database mysql root password diale
如何在 Ruby 中执行相当于 's3cmd ls s3://some_bucket/foo/bar' 的操作？

如何在 Ruby 中执行相当于 s3cmd ls s3 some bucket foo bar 的操作我找到了适用于 Ruby 的 Amazon S3 gem 以及正确的 AWS S3 库但不知何故如何在 S3 文件夹之类的位置上执
MessageKit 不显示消息输入栏 Swift 5

这是控制器层次结构 tabBarController gt 一些控制器和聊天频道控制器并且这个聊天频道控制器也是一个导航控制器当我选择行时它会推送到 MessageViewController 类的聊天控制器我这里有两个问题一是小
为什么使用 Tiled 的 libgdx 游戏中出现线条？

我正在使用 LibGdx 和 Tiled 当在屏幕上移动时游戏上会出现水平线和垂直线如果需要的话我可以发布您需要的任何代码我怎样才能让这些线路停止这是一个 gfycat gif 的线条 http gfycat com FastUn
QML - MouseArea/MouseEvent 问题

下面的代码生成一个白色矩形其中包含一个红色矩形和一个灰色矩形每个矩形都有一个关联的 MouseArea 当鼠标在灰色矩形内单击时灰色矩形会变成蓝色当鼠标光标进入红色矩形内部时红色矩形会打印一条控制台消息当发出释放信号时会打印另
我如何比较“Bcrypt”Gem 解密的密码和加密的密码

我正在尝试对某些帖子的评论使用简单的身份验证用户使用即时 ID 和密码输入评论我使用 bcrypt gem 将密码存储在数据库中就像comments controller rb中这样 comment Comment new comme
Django 中子查询的查询

我正在尝试从另一个查询执行查询但 Django 说渲染时捕获数据库错误子查询返回超过 1 行我正在使用 PostGis my model class Place models Model coordinate models Poin
通过 .htaccess 文件为所有 PHP 脚本设置 HTTP 标头

我在我的一个项目中对所有 PHP 程序编写了相同的代码行是否可以在目录的 htaccess 中执行此操作如何 PHP 代码 Header Content Type application xhtml xml charset utf 8
混淆矩阵和列联表有什么区别？

我正在编写一段代码来评估我的聚类算法我发现每种评估方法都需要来自m n类似矩阵A aij where aij是属于类成员的数据点的数量ci和簇的元素kj 但似乎有两个这种类型的矩阵数据挖掘简介 Pang Ning Tan 等一个是混淆矩

混淆矩阵和列联表有什么区别？

混淆矩阵和列联表有什么区别？ 的相关文章

随机推荐

热门标签

混淆矩阵和列联表有什么区别？的相关文章