WEKA 的重采样过滤器 - 如何解释结果

2024-04-28

我目前正在努力解决机器学习问题，而我必须处理大量不平衡的数据集。也就是说，有六个类（'1'，'2'...'6'）。不幸的是有例如对于“1”类，有 150 个示例/实例；对于“2”，有 90 个实例；对于“3”类，只有 20 个实例。所有其他类都无法“训练”，因为这些类没有可用的实例。

到目前为止，我发现 WEKA（我正在使用的机器学习工具包）提供了这种受监督的“重新采样”过滤器。当我使用 'noReplacement'=false 和 'bialToUniformClass'=1.0 应用此过滤器时，这会产生一个数据集，其中实例的数量很好并且几乎相等（对于类 '1'..'3' 和其他类）留空）。

我现在的问题是：WEKA 和这个过滤器如何为不同的类生成“新”/附加实例。

预先非常感谢您的任何提示或建议。

干杯朱利安

事实并非如此。它正在对现有实例进行重新采样。如果您有一个 2 类实例，并要求以 1.0 的偏差进行重采样，则您可以预期该实例的 N 个副本以及已存在数据的每种其他类型的 N 个其他实例。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

WEKA 的重采样过滤器 - 如何解释结果的相关文章

没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y
用于多输入图像的 VGG16 网络

我正在尝试将 VGG16 网络用于多个输入图像使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc 大约 50 这就是为什么我想使用 VGG16 这样的既定模型进行尝试这是我尝试过的 imports from keras a
如果我使用不同数量的核心，XGBoost 会产生相同的结果吗？

我在两台机器上安装了完全相同版本的 XGBoost 0 4 两台机器之间的唯一区别是 RAM 和内核数量 8 与 16 使用完全相同的数据我无法重现相同的结果它们略有不同小数点后第四第五位种子保留为默认值它是高度特定于实现的但
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
caret::train：为 mlpWeightDecay（RSNNS 包）指定更多非调整参数

我在使用插入符号包和 RSNNS 包中的 mlpWeightDecay 方法指定学习率时遇到问题 mlpWeightDecay 的调整参数是大小和衰减将大小保持为 4 并在 c 0 0 0001 0 001 0 002 上调整衰减的示例
如何根据列表中的先前值过滤Haskell中的列表元素？

我正在努力在 Haskell 中创建一个函数该函数根据列表中前一个元素的条件过滤列表的数字 Example 前一个数字是 2 的倍数 myFunction 1 2 5 6 3 expected output 5 3 我知道如何申请filt
如何根据给定的过滤器返回并获取对象属性的总和？

我有以下对象 var data Name ABC Dept First FY 2016 Quarter 1 Month April Total 100 Name ABC Dept Second FY 2017 Quarter 2 Month
如何在java中的组合框之间使用过滤器？

我的数据库中有两个表分别是学期表和课程表学期表中有学期 ID 课程 ID 课程名称和 Sdepartment 部门名称课程表有课程 ID 和课程名称我的 jframe 有两个组合框第一个用于选择部门第二个用于选择课程我想选择所
混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”

我得到了 Classification metrics can t handle a mix of multilabel indicator and multiclass targets 当我尝试使用混淆矩阵时出错我正在做我的第一个深度学
如何在 k 均值中使用欧氏距离以外的不同距离公式

我正在处理纬度经度数据我必须根据两点之间的距离进行聚类现在两个不同点之间的距离是 ACOS SIN lat1 SIN lat2 COS lat1 COS lat2 COS lon2 lon1 6371 我想在 R 中使用 k 均值有什
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
JS中如何过滤多个字符串？ [复制]

这个问题在这里已经有答案了我希望能够过滤数组中的多个字符串类型例如我想过滤类型meat并输入fruit在下面的数据结构中我想要实现的是过滤数据对象 const data type meat food hamburger type f
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
一起使用“过滤”和“排序”的 Google 表格

这是我的第一个问题我希望一切都好我是使用谷歌表格的新手但我正在慢慢进步我正在尝试构建一个工作表其中包含工作表 1 中的所有数据在工作表 2 上我想过滤工作表 2 中 D 列中标有数字 1 的所有数据为此我正在使用 FILT

随机推荐

如何从 std::vector 自动删除已完成的 future

在下面的示例中 mEventExecutors 是一个std vector
从 xsl:template 传递字符串参数并在另一个 xsl 文件中使用它
在 Angular http Post 请求中获取完整响应

我正在尝试从 POST 请求获得完整响应我已经阅读了如何获得角度官方网站上提到的获取请求的完整响应角度 http https angular io guide http 它说的是添加 observe response 但这适用于get请
使用 PyGTK 的右键菜单（上下文菜单）

所以我对 Python 还很陌生并且已经学习了几个月了但我试图弄清楚的一件事是说你有一个基本的窗口 usr bin env python import sys os import pygtk gtk gobject class app
VS Code 中的输出窗口是不可编辑的，那么我们如何在程序要求时键入输入呢？

当我在输出窗口中输入任何内容时会显示错误 https i stack imgur com 7Lhu4 png 顾名思义输出窗口仅用于显示输出您似乎正在使用 VSCode Coderunner 扩展它默认在输出窗口中运行程序要将其更
Linux环境下串口数据转换为TCP/IP

我需要从Linux系统的串口获取数据并将其转换为TCP IP发送到服务器这很难做到吗我有一些基本的编程经验但对 Linux 的经验不多有没有开源应用程序可以做到这一点在 Linux 中您不需要编写程序来执行此操作只是pipe h
如何检测UITableView的滚动？

有一个与此类似的问题但答案非常笼统模糊检测 UITableView 滚动 https stackoverflow com questions 1587855 detecting uitableview scrolling 请不要驳回
如何阻止 Firefox 在按住 Ctrl 键的情况下在新选项卡中打开 gridview 标头排序回发链接

我试图让 ASP Net 中的 gridview 控件根据用户在尝试通过单击列名称进行排序时是否按下 Ctrl 键进行多重排序问题是当我使用 Firefox 时如果我按下 Ctrl 键单击列名称浏览器会尝试在新选项卡中打开 java
有没有java对象到对象映射的工具？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
SKPaymentTransaction：transactionDate 到底是什么？

在苹果的文档中transactionDate is 交易添加到 App Store 支付队列的日期只读我只是想澄清一下在以下情况下 transactionDate 是什么在时间 T1 购买了一些东西交易日期是 T1 在时间 T2 恢
在浮动元素周围放置边框

假设我有类似以下代码的内容我想在左右浮动的两个图像之间显示一些文本 img src testImage1 png alt Test Image 1 img src testImage2 png alt Test Image 2 p Tes
如何减少 MediaCodec 视频/avc 解码中的延迟

我执行了一些简单的计时电影播放器 java https github com google grafika blob master src com android grafika MoviePlayer java in the Grafik
Mongoose findOneAndUpdate 如何知道对象是否存在以及是否被修改

我在用findOneAndUpdate猫鼬的方法 function update one record Model unique constraint new updated values obj Model findOneAndUpdat
如何在 http POST 请求中发送 HTML 代码？

我正在从 Google Web Toolkit 应用程序向 php 脚本发送 HTTP POST 请求内容类型现在是 application x www form urlencoded 所以我可以将变量发送到 php 并使用 POST 在
使用斐波那契堆时 Dijkstra 是否更快？

使用斐波那契堆时 Dijkstra 是否比使用二进制堆更快我自己做了一些实现斐波那契堆的实验并在 Dijkstra 中使用它我还检查了 fibheap 库中现成的斐波那契堆但没有一个实现能够更快地找到使用以下命令的最短路径二进制堆
多列多对一

我有一个遗留数据库和两个表之间一对一的关系问题是关系使用两列而不是一列在 nhibernate 中是否有某种方法可以说当获取引用的实体时它在 join 语句中使用了两列而不是一列我有一个类似的表结构任务进度进度ID Tas
从纬度和经度获取 Windows TimeZoneInfo

在网络应用程序中我让人们输入他们的地址然后我使用Google 的地理编码 API获取他们的纬度和经度接下来我想得到他们的Windows 时区名称使用这些坐标这样我就可以处理夏令时正确通过 NetTimeZoneInfo objec
尝试使用 Redshift SQL 对累积不同实体进行计数

我正在尝试获取某个时间序列中 Redshift 中不同对象的累积计数最简单的事情就是使用COUNT DISTINCT myfield OVER ORDER BY timefield DESC ROWS UNBOUNDED PRECEDIN
我怎样才能残酷无情地中止 Java 中的任务？

我用 Java 编写了一个数独求解器作为作业目前我正在尝试找出它可能面临的有问题的输入以使其变得更好我已经生成了几千个数独网格David Bau 的数独生成器 http davidbau com archives 2006 09 04
WEKA 的重采样过滤器 - 如何解释结果

我目前正在努力解决机器学习问题而我必须处理大量不平衡的数据集也就是说有六个类 1 2 6 不幸的是有例如对于 1 类有 150 个示例实例对于 2 有 90 个实例对于 3 类只有 20 个实例所有其他类都无法训练因为

WEKA 的重采样过滤器 - 如何解释结果

WEKA 的重采样过滤器 - 如何解释结果 的相关文章

随机推荐

热门标签

WEKA 的重采样过滤器 - 如何解释结果的相关文章