Weka 标准化柱

2024-01-08

我有一个包含 14 个数字列的 ARFF 文件。我想分别对每列执行标准化,即将每列的值修改为 (actual_value - min(this_column)) / (max(this_column) - min(this_column))。因此,列中的所有值都将在范围内[0, 1]。一列的最小值和最大值可能与另一列的最小值和最大值不同。

如何使用 Weka 过滤器做到这一点?

Thanks


这可以使用以下方法完成

weka.filters.unsupervised.attribute.Normalize

应用此过滤器后,每列中的所有值都将在 [0, 1] 范围内

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Weka 标准化柱 的相关文章

  • Weka 中 ARFF 格式的属性过多

    我正在处理维度超过 10 000 的数据集 为了使用Weka 我需要将文本文件转换为ARFF格式 但是由于即使使用稀疏ARFF格式 属性也太多 文件大小太大 是否有与数据类似的方法来避免在 ARFF 文件头中写入如此多的属性标识符 例如 属
  • 设计城市、州、国家桌子的最佳方法是什么?

    我需要帮助设计我的国家 城市 州表格 我将提供表格中的示例数据 以便您可以更好地帮助我解决我的问题 这是我的国家 地区表 Country code name US United States SG Singapore GB United K
  • unicodedata.normalize(form, unistr) 如何工作?

    在 API 文档中 http docs python org 2 library unicodedata html unicodedata normalize http docs python org 2 library unicodeda
  • 尝试使用 Weka 将更多实例添加到训练集中时出现 IndexOutOfBoundsException

    我正在尝试向我的训练集添加更多实例并执行 10 倍交叉验证 我的实例采用字符串格式 因此我使用 StringToWordVector 过滤器将它们转换为数字 如果我不添加我想要的额外页面 事情就会顺利进行 但是当我添加命令时trainSet
  • Matplotlib imshow - 更改默认颜色标准化

    我在使用时一直遇到颜色图问题imshow 有些颜色似乎就变成了黑色 我终于意识到imshow默认情况下 似乎对我给出的浮点值矩阵进行标准化 我本来期望一个数组 例如 0 0 25 0 5 0 75 显示地图中对应于这些绝对值的适当颜色 但
  • 如何将文本文件转换为ARFF格式?

    我正在使用 WEKA 工具进行文本分类 并且必须将纯文本文件转换为 ARFF 格式 但是 我不知道该怎么做 谁能帮我将文本文件转换为 ARFF 格式 谢谢伦克劳夫的回复 我不明白这些要点 由于像记事本这样的文本编辑器只允许有限数量的列 因此
  • 对标准化数据的曲线拟合结果进行非标准化

    我正在拟合指数衰减函数lsqvurcefit in Matlab 为此 我首先正常化 http en wikipedia org wiki Standard score Standardizing in mathematical stati
  • 神经网络中的批量归一化

    我对 ANN 还很陌生 我刚刚阅读了批量归一化论文 http arxiv org pdf 1502 03167 pdf http arxiv org pdf 1502 03167 pdf 但我不确定我是否明白他们在做什么 更重要的是 为什么
  • 我是否过度设计了 MySQL 数据库(用户/公司/产品)?

    我是数据库设计新手 请就此给我建议 1 什么时候应该使用复合索引 https stackoverflow com questions 1823685 database when should i use a composite index
  • 如何在java中使用StringToWordVector(weka)?

    这是我的arff文件 relation hamspam attribute text string attribute class ham spam data good ham very good ham bad spam very bad
  • 创建数据模型的最佳实践[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 对于当前的项目 我正在创建一个数据模型 是否有任何来源可以找到良好数据模型的 最佳实践 好的意味着灵活
  • Weka:如何在 java 中获取测试实例的预测值?

    我已经成功训练了一个分类器 bayesnet 并构建了一个测试集 ARFF 格式 该测试集有一个实例 有一个缺失值 Evaluation eTest new Evaluation trainingInstance eTest evaluat
  • WEKA 中监督重采样和无监督重采样有什么区别?

    我想知道有什么区别weka filters supervised instance Resample and weka filters unsupervised instance Resample 在什么情况下我们应该使用每一种 监督重采样
  • 如何将两组 weka 实例合并在一起

    目前 我一次将一个实例从一个数据集复制到另一个数据集 有没有办法做到这一点 使字符串映射保持完整 mergeInstances 水平工作 是否有等效的垂直合并 这是我用来将多个 arff 文件中相同结构的数据集读取到一个大型数据集中的循环的
  • 更新 SQL“关系”表的有效方法

    假设我有三个正确标准化的表 一种人 一种资格 以及一种将人映射到资格的方法 People id Name 1 Alice 2 Bob Degrees id Name 1 PhD 2 MA 人与学位 person id degree id 1
  • 将关系 R 分解为 1NF 后最少存在多少张表?

    考虑具有以下属性类型的关系 R A B C D E F G 键总数 1 A 一组简单 或 原子 或 单值属性 B C 多值属性集 D E 复合属性集 F G 将关系 R 分解为 1NF 后 存在的表的最小数量是多少 A 3 B 2 C 4
  • WEKA 的重采样过滤器 - 如何解释结果

    我目前正在努力解决机器学习问题 而我必须处理大量不平衡的数据集 也就是说 有六个类 1 2 6 不幸的是有例如对于 1 类 有 150 个示例 实例 对于 2 有 90 个实例 对于 3 类 只有 20 个实例 所有其他类都无法 训练 因为
  • 如何从函数依赖中获取最小密钥?

    我需要一些帮助和指导 我有以下关系 R A B C D E F 以及函数依赖集 F AB gt C A gt D D gt AE E gt F R 的主键是什么 如果我应用推理规则 我会得到这些额外的函数依赖项 D gt A D gt E
  • R中的神经网络包出现大错误

    我正在尝试弄清楚如何使神经网络包发挥作用 我用我创建的数据及其结果 大约 50 行数据和三列 第四列是我想要的结果 它是通过简单的数学执行 如对其他三列求和 得出的 进行了一些测试 到目前为止一切顺利 然后我决定将这个包应用到真实数据上 我
  • 规范化且不可变的数据模型

    Haskell如何解决 规范化不可变数据结构 问题 例如 让我们考虑一个表示前女友 男友的数据结构 data Man Man name String exes Woman data Woman Woman name String exes

随机推荐