• 目录 一 主题 3 1模型总览图 3 2 微调 二 实验部分 三 回顾总结 四 参考链接 一 主题 在模型的设计上 是尽可能的按照最原始的Transformer来做的 这样的一个好处是我们可以直接把NLP那边已经成功地Transformer