Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
序列模型(4)—— Scaling Laws
本文介绍 LLM 训练过程中重要的 Scaling Laws 这是一个 经验规律 指出了 固定训练成本 总计算量FLOPs C C C 时 如何调配模型规模 参数量 N N
LLM专题
论文理解
LLM
Sacaling Law
论文理解【Offline RL】——【BooT】Bootstrapped Transformer for Offline Reinforcement Learning
标题 Bootstrapped Transformer for Offline Reinforcement Learning 文章链接 Bootstrapped Transformer for Offline Reinforcement L
论文理解
Boot
Offline RL
离线强化学习
TT
论文理解【IL - IRL】 —— Deep Reinforcement Learning from Human Preferences
标题 Deep Reinforcement Learning from Human Preferences 文章链接 Deep Reinforcement Learning from Human Preferences blogpost L
论文理解
模仿学习
逆强化学习
论文分享
论文理解