• 梯度下降的原理 梯度下降 普通梯度下降bgd的方法简单暴力 但是调整速度比较慢 如果不想等所有数据都计算完了才开始调整w 而是计算完数据的一部分 batch size 后就立即调整w 说白了就是在训练过程中进行权重的更新 这样就成了随机梯度