我如何知道训练数据足以用于机器学习

2024-03-07

例如:如果我想训练一个分类器(也许是SVM),我需要收集多少样本?有没有一个测量方法呢?


知道需要收集多少样本并不容易。不过,您可以按照以下步骤操作:

解决典型的机器学习问题:

  1. 构建一个包含几个样本的数据集 a,有多少个?这取决于您遇到的问题类型,现在不要花太多时间。
  2. 将数据集拆分为训练、交叉、测试和构建模型。
  3. 现在您已经构建了 ML 模型,您需要评估它的好坏。计算您的测试误差
  4. 如果您的测试错误率低于您的预期,请收集新数据并重复步骤 1-3,直到达到您满意的测试错误率。

如果您的模型没有遭受“高偏差”,则此方法将起作用。

这段来自 Coursera 机器学习课程的视频对此进行了解释 https://www.youtube.com/watch?v=nMExAKDmcb0.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我如何知道训练数据足以用于机器学习 的相关文章

随机推荐