我想知道有什么区别weka.filters.supervised.instance.Resample
and weka.filters.unsupervised.instance.Resample
?
在什么情况下我们应该使用每一种?
监督重采样和无监督重采样的文档是相同的except该文档用于监督的重采样有附加句子:
可以使过滤器保持子样本中的类别分布,
或者使类别分布偏向均匀分布。
监督重采样还有额外的参数:
-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data
1 = uniform distribution.
(default 0)
因此,监督重采样仅适用于存在类变量的情况。当完全偏向输入分布 (B=0) 时,每个子样本都会复制整个数据集的类分布。 B=1 相当于无监督重采样,其中点是从整个总体中均匀抽取的,而不考虑类别。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)