Hugging Face开源库accelerate详解

2023-11-13

官网：https://huggingface.co/docs/accelerate/package_reference/accelerator

Accelerate使用步骤

初始化accelerate对象accelerator = Accelerator()
调用prepare方法对model、dataloader、optimizer、lr_schedluer进行预处理
删除掉代码中关于gpu的操作，比如.cuda()、.to(device)等，让accelerate自行判断硬件设备的分配
将loss.backbard()替换为accelerate.backward(loss)
当使用超过1片GPU进行分布式训练时，在主进程中使用gather方法收集其他几个进程的数据，然后在计算准确率等指标

Accelerator对象初始化参数

device_placement (bool, optional, defaults to True) — 是否让accelerate来确定tensor应该放在哪个device
split_batches (bool, optional, defaults to False) — 分布式训练时是否对dataloader产生的batch进行split，如果True，那么每个进程使用的batch size = batch size / GPU数量，如果是False，那么每个进程使用就是batch size，总的batch size = batch size * GPU数量
mixed_precision (str, optional) — 是否使用混合精度训练
gradient_accumulation_steps (int, optional, default to 1) — 梯度累加的步数，也可以使用GradientAccumulationPlugin插件进行详细配置
cpu (bool, optional) — 是否强制使用CPU执行
deepspeed_plugin (DeepSpeedPlugin, optional) — 使用此参数调整与DeepSpeed相关的参数，也可以使用accelerate config直接配置
fsdp_plugin (FullyShardedDataParallelPlugin, optional) — 使用此参数调整FSDP（Fully Sharded Data Parallel）相关参数，也可以使用accelerate config直接配置
megatron_lm_plugin (MegatronLMPlugin, optional) — 使用此参数调整与MegatronLM相关的参数，可以使用accelerate config直接配置
step_scheduler_with_optimizer (bool, *optional, defaults to True) – lr_scheduler是否和optimizer同步更新
gradient_accumulation_plugin (GradientAccumulationPlugin, optional) — 梯度累积插件

Accelerate常用高阶用法

accelerator.print()
当使用多片GPU训练时，打印每个进程的信息，替换python的print函数，这样在每个server上只打印一次，其实就是先使用is_local_main_process判断的print。
accelerator.is_local_main_process
可以当做装饰器使用，在一个具有多片GPU的server上只执行一次，local表示每台机器。与is_local_main_process对应的是is_main_process，is_local_main_process每个server上的主进程，is_main_process是所有server的主进程。
wait_for_everyone()
同步控制，确保在后续操作之前所有前提操作已完成
accelerator.save_model() / load_state_dict /
load_checkpoint_in_model
模型保存，自动去除掉由于分布式训练在模型上做的包装（调用unwrap_model），保存state_dict，并且可以对大模型文件进行分块存储。并加载保存的模型
Accelerate与Transformers库搭配使用进行模型保存
使用accelerator做梯度裁剪：
梯度累加gradient accumulation
尤其对于超大规模的模型，模型参数本来就已经很大了，如果再用很大的batch size进行训练，硬件资源吃不消，但是如果用很小的batch size训练的话模型稳定性很差，所以梯度累加gradient accumulation是一个这种的解决方案，其实就是连续执行多次forward前向过程，在多次执行期间不进行反向传播，每次都是很小的batch size，多次就累积成了比较大的batch size，然后在累积的结果上做反向传播。Accelerate在梯度累加期间暂停在不同GPU之间的梯度同步，进一步减少了通信数据量。

GradientAccumulationPlugin提供了更灵活梯度累加操作，除了能指定累加的步数，还能指定在累计过程中是否更新lr_scheduler调节器。
autocast混合精度训练
对处于with上下文管理中的模块使用混合精度训练
gather、gather_for_metrics
分布式训练时，在不同进程之间回收结果数据
Prepare
为分布式训练和混合精度做准备，然后以相同的顺序返回它们。
reduce：跨进程做tensor的reduce操作
save_state / load_state：保存、加载模型的状态数据
unscale_gradients：混合训练过程中不对梯度进行缩放
unwrap_model
去掉模型上由prepare加上的用于做分布式训练的包装层，在保存模型的时候比较有用

4、使用accelerate执行分布式训练

执行accelerate config根据提问和实际硬件情况设置配置文件
执行accelerate test --config_file path_to_config.yaml验证环境配置是否正常
执行进行命令进行分布式训练，accelerate launch --config_file path_to_config.yaml path_to_script.py --args_for_the_script

5、使用Accelerate在低资源环境下加载大的模型

参考：https://huggingface.co/docs/accelerate/usage_guides/big_modeling

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

accelerate

Hugging Face

DDP

分布式训练

Hugging Face开源库accelerate详解的相关文章

删除链表中重复的节点(Java实现)

问题描述在一个排序的链表中存在重复的结点请删除该链表中重复的结点重复的结点不保留返回链表头指针例如链表1 gt 2 gt 3 gt 3 gt 4 gt 4 gt 5 处理后为 1 gt 2 gt 5 解决方案注意边界即可代
UE4_UATHelper: Packaging (Windows (64-bit)): ERROR: Failed to copy

在项目中引用了开发的插件插件中引用了第三方库目录结构如下报错信息如下 UATHelper Packaging Windows 64 bit ERROR Failed to copy E Project WorkSpace KafkaD
知识图谱（Knowledge Graph）

这篇文章的目的就是给不了解知识图谱的人做一个简单的科普一什么是知识图谱知识图谱 Knowledge Graph 又称为科学知识图谱在图书情报界称为知识域可视化或知识领域映射地图是显示知识发展进程与结构关系的一系列各种不同的图形用

随机推荐

Sqlilabs-19

第 19 关跟第 18 关类似 User Agent 改成了 Referer 改造注入 Referer 浏览器向 WEB 服务器表明自己是从哪个网页 URL 获得点击当前请求中的网址 URL 同样的这一关对 usernanme 和 p
关闭占用某个端口的进程，例如8080

问题 Web server failed to start Port 8080 was already in use 办法一 1 查看端口号的进程号 netstat ano findstr 端口号 2 任务管理器关闭办法二使用命令关闭
定义栈的数据结构，请在该类型中实现一个能够得到栈中所含最小元素的min函数（时间复杂度应为O（1））。

题目定义栈的数据结构请在该类型中实现一个能够得到栈中所含最小元素的min函数时间复杂度应为O 1 分析使用双栈实现一个数据栈data 一个最小栈min 数据栈存正常入栈的元素最小栈永远存数据栈中当前最小值具体是依靠以下规则来实
分布式一致性与共识算法简介

在介绍Raft算法之前请考虑一下如果有机会你会怎么设计一个分布式系统注意这里所说的分布式系统是几台服务器组成的一个对外服务的系统比如分布式KV系统分布式数据库系统等如果是单机系统数据一般都在本地基本不需要与外部通信比如单
【ML】数据预处理

前言对于数据的预处理没有固定的步骤下文写的仅仅的常规的一些小步骤具体的预处理还需要根据数据以及需求来自行处理 Python STEP1 导入依赖包 import numpy as np import matplotlib pypl
docker gitlab安装

1 拉取gitlab镜像 gitlab ce为稳定版本后面不填写版本则默认pull最新latest版本 docker pull gitlab gitlab ce 若你想装中文版本 docker pull beginor gitlab ce
python-DRF_restful规范_APIView源码分析_Request类分析_序列化组件的使用及字段类型和字段参数_保存功能_字典校验_read_only和write_only

DRF Django rest framework 1 restful 1 什么是RESTful REST与技术无关代表的是一种软件架构风格 REST是Representational State Transfer的简称中文翻译为表征
element-ui中Notification 通知自定义样式、按钮及点击事件

Notification 通知用于悬浮出现在页面角落显示全局的通知提醒消息一自定义html页面 element ui官方文档中说明Notification 通知组件的message 属性支持传入 HTML 片段但是示例只展示了简单的
SQL数据库如何更改已建的表的数据类型

alter table 表名 alter column 列名类型长度数据类型
discuz二级、三级导航高亮，文章内容页跟随三级导航高亮的方法

查找改成
Flutter运行过程（一）：一文搞懂Widget更新机制

本系列将从Flutter框架runApp 运行开始结合框架源码分析flutter UI渲染更新机制布局绘制过程以及解析flutter主要的生命周期过程认真读完本系列读者一定会对Flutter运行过程了如指掌胸有成竹本系列
mysql数据库权限控制(权限级别、用户管理)

权限级别 Global level 系统级所有库所有表的权限 Database level 某个数据库中的所有表的权限 able level 库中的某个表的权限 Column level 表中的某个字段的权限 procs lev
Basic Level 1082 射击比赛 (20分)

题目本题目给出的射击比赛的规则非常简单谁打的弹洞距离靶心最近谁就是冠军谁差得最远谁就是菜鸟本题给出一系列弹洞的平面坐标 x y 请你编写程序找出冠军和菜鸟我们假设靶心在原点 0 0 输入格式输入在第一行中给出一个正整数 N
ant-design中textArea组件获取光标位置，插入表情之后自动将光标移至文本的最后

目前的需求是要设置一段文本但是文本里可以插入微信表情需要实现在插入表情之后光标位置自动移到当前文本的最后效果图实现代码 textArea组件
es查询列表如何去重？

SearchSourceBuilder builder new SearchSourceBuilder builder collapse new CollapseBuilder name keyword 在Elasticsearch中 bu
python面试总结

python面试题 python中is和的区别 Python中对象包含的三个基本要素分别是 id 身份标识 type 数据类型和value 值比较的是value值 is 比较的是id 简述read readline readline
解决pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool

解决pip vendor urllib3 exceptions ReadTimeoutError HTTPSConnectionPool host files pythonhosted org port 443 Read timed out
公众号（服务号）模板消息（个人通知）开发方案

公众号消息通知微信公众号开发文档公众号是以微信用户的一个联系人形式存在的消息会话是公众号与用户交互的基础目前公众号内主要有这样几类消息服务的类型分别用于不同的场景 1 群发消息公众号可以以一定频次订阅号为每天1次服务号为每月
windows下启动mysql服务的命令行启动和手动启动方法

今天遇到mysql服务无法启动上网一查很多人也遇到mysql服务器启动不了的问题所以就索性整理了windows下启动mysql服务的命令行启动和手动启动方法的文章以便各位遇到同类问题的朋友进行参考 1 图形界面下启动mysql服务在
Hugging Face开源库accelerate详解

官网 https huggingface co docs accelerate package reference accelerator Accelerate使用步骤初始化accelerate对象accelerator Accelera

Hugging Face开源库accelerate详解

官网：https://huggingface.co/docs/accelerate/package_reference/accelerator

Accelerate使用步骤

Accelerator对象初始化参数

Accelerate常用高阶用法

4、使用accelerate执行分布式训练

5、使用Accelerate在低资源环境下加载大的模型

Hugging Face开源库accelerate详解 的相关文章

随机推荐

热门标签

Hugging Face开源库accelerate详解的相关文章