我正在训练级联分类器以检测图像中的动物。不幸的是,我的误报率相当高(使用 Haar 和 LBP 超高,使用 HOG 可以接受)。我想知道如何改进我的分类器。
这是我的问题:
- 鲁棒检测所需的训练样本量是多少?我在某处读到需要 4000 个正样本和 800 个负样本。这是一个好的估计吗?
- 训练样本应该有多大不同?有没有办法量化图像差异以包含/排除可能的“重复”数据?
- 我该如何处理被遮挡的物体?我应该只训练动物可见的部分,还是应该选择我的投资回报率,以便平均投资回报率相当恒定?
- 重新遮挡的物体:动物有腿、手臂、尾巴、头等。由于某些身体部位经常被遮挡,选择“躯干”作为 ROI 是否有意义?
- 我应该尝试缩小图像尺寸并在较小的图像尺寸上进行训练吗?这可能会改善事情吗?
我愿意在这里接受任何指点!
- 4000 正 - 800 负是一个糟糕的比率。负样本的问题是你需要训练尽可能多的负样本,因为Adaboost 机器学习算法 http://youtu.be/WfdYYNamHZ8?t=22m55s-所有类似 haar 的特征选择过程的核心算法 - 高度依赖于它们。使用 4000 / 10000 将是一个很好的增强。
- 检测“动物”是一个难题。由于您的问题是一个决策过程,这已经是NP-hard http://en.wikipedia.org/wiki/NP-hard,您的分类范围正在增加复杂性。首先从猫开始。拥有一个检测猫的系统。然后将同样的方法应用到狗身上。比如说有 40 个系统,可以检测不同的动物,并在以后将它们用于您的目的。
- 对于训练,不要使用被遮挡的物体作为正样本。即,如果您想检测正面,则仅应用位置和方向变化来训练正面,而不包括其前面的任何其他对象。
- 缩小尺寸并不重要,因为 haar 分类器本身会将所有内容缩小到 24x24。当你有足够的时间时,观看整个中提琴琼斯的演示。
- 祝你好运。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)