• 前言 因为研究工作的需要 要更改激活函数以适应自己的网络模型 但是单纯的函数替换会训练导致不能收敛 这里还有些不清楚为什么 希望有人可以给出解释 查了一些博客 发现了解决之道 下面将解决过程贴出来供大家指正 1 背景 之前听某位老师提到说t