In this http://www.youtube.com/watch?v=qkcFRr7LqAw在 Sebastian Thrum 的视频中,他说监督学习适用于“标记”数据,无监督学习适用于“未标记”数据。他这话是什么意思?谷歌搜索“标记数据与未标记数据”会返回一堆关于该主题的学术论文。我只想知道基本的区别。
Labeled数据通常采用一组未标记的数据,并使用某种有意义的“标签”、“标签”或“类”来增强每条未标记的数据,这些“标签”、“标签”或“类”在某种程度上提供了信息或需要了解。例如,上述类型的未标记数据的标签可能是这张照片是否包含马或牛、这段录音中说出了哪些单词、这段视频中正在执行什么类型的动作、这篇新闻文章的主题是什么就是,这条推文的整体情绪是什么,这张 X 射线中的点是否是肿瘤,等等。