相信很多人都听过“机器学习”和“深度学习”,但是听过“强化学习”的人可能没有那么多,那么,什么是强化学习呢?强化学习是机器学习的一个子领域,它可以随着时间的推移自动学习到最优的策略。
在我们不断变化的纷繁复杂的世界里,从更广的角度来看,即使是单纯的静态的输入-输出型问题也会变成动态的问题。例如,对于一个简单的监督式学习任务——猫狗分类。你收集到了一些训练数据,然后用你最喜欢的深度学习框架写了一个分类网络进行训练,很快模型收敛,效果拔群,因此你将这个模型部署上线,过了一段时间一些狗的狗毛修剪方式发生了改变,并且有一大部分狗的图片模型不能正确识别,因此需要更新训练数据然后重新训练模型。
上面这个例子是为了说明即使最简单的机器学习问题也有一个隐藏的维度因素——时间,而时间这个维度经常被忽视,但很可能会对生产系统造成较大问题。
强化学习(Reinforcement Learning,RL)是一种将这种额外维度(通常是时间,但也不一定)融入学习的方法,比起机器学习中的其他领域,它更接近人们对人工智能的普遍认知,并且也是最接近人类学习的一种学习方式。下面就简要介绍一下机器学习中的几种学习方式。
学习——监督、非监督与强化
相信很多人都对监督学习很熟悉,它所需要解决的问题是:给定一组样例对,如何构建一个函数,将输入映射到输出?以下是一些监督学习的例子:
- 文本分类:这封邮件是不是垃圾邮件?
- 图像分类:这张图像中的是猫还是狗还是其他的什么?
- 回归问题:根据天气传感器提供的信息,明天的天气怎么样?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)