- Is it because we have many features in our data sheet?
- 因为我们的数据表中有很多特征吗?
- Or is it because the feature list does not only contain numerical data but categorical data as well?
- 因为我们的特征里不仅包含数值数据还包含累呗数据吗?
- Or is it related to the data size of the dataset?
- 和数据集的大小有关系吗?
- Or is it because of data imbalance?
- 因为数据不平衡吗(即一个类别的数据数据多,另一个类别的数据数据少)
- Or because of the computation cost?
- 因为计算的复杂性吗?
- 有缺失数据吗
- 特征之间的相关性
- 有噪声数据吗,有的算法对噪声值敏感
- 有outlier吗?有异常值吗
未完待续。。。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)