Ubuntu20.04使用多卡训练HyperNetwork模型和LoRA模型全流程及疑难问题解决方案

2023-05-16

目录

一. LoRA模型多卡训练
- 1.1 安装xformer等库
- 1.2 设置路径
- 1.3 多卡训练
二. HyperNetwork模型多卡训练
- 2.1 HyperNetwork通过WebUI训练
疑难报错解决方案
- 多卡训练报错

软硬件配置：
CPU: AMD 5800 8core 16Thread
GPU: NVIDIA RTX 3090 *1
NVIDIA TITAN RTX *1
OS: Ubuntu20.04

一. LoRA模型多卡训练

1.1 安装xformer等库

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
git clone https://github.com/facebookresearch/xformers/
cd xformers
git submodule update --init --recursive
export FORCE_CUDA="1"
# 进入https://developer.nvidia.com/cuda-gpus#compute
# 设置所用显卡对应的Compute Capability，3090和A5000都是8.6
export TORCH_CUDA_ARCH_LIST=8.6
pip install -r requirements.txt
pip install -e .

下载训练代码：
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts.git

cd LoRA_Easy_Training_Scripts
git submodule init
git submodule update
cd sd_scripts
pip install  --upgrade -r requirements.txt

1.2 设置路径

一般来说需要设置三个路径，大模型路径，图片输入路径，图片输出路径:
在这里插入图片描述
接下来生成训练配置文件：

accelerate config

根据工作机的实际情况和训练策略，选择对应的配置

- This machine
- 1
- No
- NO
- NO
- NO
- 0,1
- fp16

配置结束后会自动生成一个训练配置文件。

1.3 多卡训练

accelerate launch main.py

同样的模型和配置，双卡训练用时为3：46, 而单卡则需要7：57, 可见双卡加速策略有效。
双卡时间：
在这里插入图片描述
单卡时间:

二. HyperNetwork模型多卡训练

2.1 HyperNetwork通过WebUI训练

首先选择预处理，然后选择HyperNetwork训练
在这里插入图片描述

疑难报错解决方案

多卡训练报错

在执行多卡训练命令accelerate launch main.py后，发生如下报错：
在这里插入图片描述
原因是xformer0.18.0对应的Pytorch版本为2.0.0,版本较高，应当降级到pytorch1.13.0，xformer0.16.0
并且不再使用xformer，即 self.xformers: bool = False 。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Ubuntu20

HyperNetwork

LoRa

使用多卡训练

模型全流程及疑难问题解决方案

Ubuntu20.04使用多卡训练HyperNetwork模型和LoRA模型全流程及疑难问题解决方案的相关文章

1.3安装Ubuntu20.4系统

在NUC小电脑上装乌班图Ubuntu系统的步骤 xff0c 在VMware虚拟机上安装Ubuntu系统也差不多是一样的安装Ubuntu20 4 xff08 用虚拟机的跳过此步骤 xff09 开机之前把U盘启动盘插在小电脑上 xff0c 否
Ubuntu20.04安装Cartographer_ros，conda环境X11问题

absl的解决 conda 环境的 X11 问题 xff1a conda span class token function install span c conda forge xorg libx11
Ubuntu20.04安装gazebo11报错

在这记录下安装gazebo11的报错解决方案 xff0c 本人遇到问题的过程 xff1a 我在安装gazebo11后又卸载了全部相关的东西 xff0c 然后用命令sudo apt upgrade升级了下Ubuntu20 04里的一些东西 x
Ubuntu20.04安装ROS Neotic修复依赖问题过程记录

出现的问题 xff1a 下列软件包有未满足的依赖关系 xff1a ros noetic desktop full 依赖 ros noetic desktop 但是它将不会被安装依赖 ros noetic perception 但是它将不会
Ubuntu20.4 休眠之后网络出现问题的解决方案

问题简介 Ubuntu20 04 在休眠之后 xff0c 如果网络出现了无法连接或者无法共享的各种问题 xff0c 只有重启才能解决 xff0c 那么以下操作可以让你不用重启电脑解决方案重启 network kernel modules
Ubuntu20.04 配置D435i相机

文章目录一安装使用 InterRealSenseD435i SDK21 注册服务器的公钥2 安装3 安装开发者和调试包4 测试SDK2 二安装realsense ros1 创建工作空间2 源码安装3 编译 xff1a 三安装kali
Ubuntu20.04 论文CCNet：语义分割的交叉注意力复现

Ubuntu20 04 论文CCNet 语义分割的交叉注意力复现一安装显卡驱动 1 1 源代码 1 2 驱动安装二环境配置 2 1 Anaconda3下创建新环境 2 2 安装CUDA10 2 2 3 安装cuDNN 三编译 3
解决ubuntu20.04虚拟机无法上网的问题

64 linux虚拟机无法正常上网前言刚建立好的linux虚拟机使用NAT方式可以连接外网 xff0c 系统重启几次 xff0c 系统无法上网 xff0c 这是什么问题导致的呢 xff1f 提示 xff1a 以下是本篇文章正文内容 xf
ubuntu20.04安装cmake详细教程

一命令行安装 xff08 这种直接安装cmake xff0c 其实安装的版本都太老了 xff0c 这种方式不推荐 xff09 sudo apt install cmake 二 Cmake源码编译安装 1 更新一下g 43 43 已经安装请
在ubuntu20.4下安装ardupilot 4.3.6

这次重新安装真的是遇到了好多坑啊 xff01 从github上靠过来按照之前的那篇文章流程做完之后 xff0c 还会有一些别的问题首先是module里面的包都没有拷过来 xff0c 所以需要用git add将文件都添加过来之后进行编译时
Ubuntu20.04 Firefox浏览器设置暗黑主题

Ubuntu20 04 Firefox浏览器设置暗黑主题浏览器右上角点击三横线 xff0c 选择扩展 xff0c 搜索Dark Reader 安装并启用即可
一文掌握Ubuntu20.04深度学习环境搭建（显卡驱动、CUDA、CUDNN、NCCL、Pytorch、PaddlePaddle）

目录一 Ubuntu系统安装1 1 制作U盘镜像并安装1 2 安装make g 43 43 cmake1 3 安装中文输入法1 4 安装VS Code 二深度学习环境安装2 1 切换Python版本2 2 安装英伟达显卡驱动2 3 明确
【Ubuntu】Ubuntu20.04安装GPU显卡驱动

一安装显卡驱动方式一 xff1a 图形界面安装等待安装即可方式二 xff1a 命令行安装 sudo apt get install nvidia driver 515 有些显卡只支持455 安装完成记得重启一下 xff0c 然后验证
【ORB_SLAM】Ubuntu20.04 配置ORB_SLAM3

本文主要记录基于Ubuntu20 04环境下 xff0c 对普通的ORB SLAM3和稠密版本的ORB SLAM3进行环境的配置一配置ORB SLAM3 lt 普通版本 gt 1 安装ROS开发环境这里采用鱼香ros的一键安装 xff
详细介绍如何在ubuntu20.04中安装ROS系统，以及安装过程中出现的常见错误的解决方法，填坑！！！

本篇文章写于2020 10 xff0c 经过很多小伙伴的验证 xff0c 文章所介绍的步骤是可以正常完成安装的 xff0c 现在是2021 10 xff0c 经过近期的探索 xff0c 我将安装步骤进行了进一步的优化 xff0c 使安装变得
lora模块学习一

LoRa TM 调制解调器采用扩频调制和前向纠错技术与传统的FSK或OOK调制技术相比这种技术不仅扩大了无线通讯链路的覆盖范围而且还提高了链路的鲁棒性在设计中可以通过调整扩频因子 SF 调制带宽 BW 和编码率 CR 三个关键设计
物联网LoRa系列-18：LoRa终端Sx1262芯片内部高频电信号到中频电信号的变换（混频和变频）

我们已经拆解了天线是如何发送和接收空中的高频无线电磁波信号拆解了无线终端如何对射频前端的高频电信号进行进一步处理的还拆解了无线终端的发送和接收如何分时复用天线的半双工模式我们还拆解无线终端是如何对高频射频电信号进行进一步的处理包括发
物联网LoRa系列-16：LoRa终端Sx1262芯片外部的射频前端电路设计

前言在全面拆解和构建5G物联网 15 图解详解无线终端的天线对无线电磁波的发送与接收中我们详细阐述了LoRa终端的天线本身是如何发送和接收高频无线电磁波信号的本文将借助和结合LoRa射频芯片Sx1262的射频前端电路设计进一步
物联网LoRa系列-30：LoRaWAN A类/C类终端的载波信道资源与时间资源上下行调度算法

前言本文将从频率时间这两个资源的角度来剖析LoRaWAN A类 C类终端的信道选择算法与代码实现示例不同的地区的频段有不同的规范要求算法有所差异本文将以中国区的470M频段为例进行拆解其他区域的频段以此类推不同的终端类型
通过 MQTT 将 LoRa 测量结果发送到 Fiware IOT 代理

我有 LoRa 传感器它使用 Cayenne LPP 格式有效负载发送测量值我的网关 LOrank8v1 捕获这些数据包并将其转换为 UDP 网关中有一个服务 lora gateway bridge 它将数据包从 UDP 转换为 TCP

随机推荐

p1593 因子和

因子和题目描述输入两个整数 a和 b xff0c 求 a b a b a b 的因子和由于结果太大 xff0c 只要输出它对 9901 取模的结果输入格式仅一行 xff0c 为两个整数 a 和 b 输出格式输出一行一个整数表示答
如何在指定文件夹下安装python的虚拟环境

1 什么是python中的虚拟环境之前我们安装python第三方库时 xff0c 都是直接通过 pip install xx 包名的方式进行安装的 xff0c 这样会使第三方库直接安装到Python系统环境中 xff0c 同时默认安装的
【求救】各位大侠，救救我吧！！！

在Sqlite数据库中 xff0c 向某整形或浮点型字段插入0 000005数值时数据库自动将该值转变成了科学计数法表示的数字 xff0c 即使插入0 000005字符串时 xff0c 情况也一样请问 xff1a 怎么阻止数据库的自动转
C# 字符提取和整數整除

C 字符提取和整数整除练习 xff08 Console xff09 用控制台应用程序实现下列功能 xff1a 从键盘接收一个大于100的整数 xff0c 然后分别输出该整数每一位的值 xff0c 并且输出这些为相加的结果要求分别用字符提取
蓝桥杯试题历届真题时间显示【第十二届】【省赛】【B组】java

蓝桥杯试题历届真题时间显示第十二届省赛 B组 java 问题描述 xff1a 小蓝要和朋友合作开发一个时间显示的网站在服务器上 xff0c 朋友已经获取了当前的时间 xff0c 用一个整数表示 xff0c 值为从 1970年 1
【无标题】

借个地方发个外链图片
最小m段和问题动态规划 c++含讲解

最小m段和问题给定n个整数组成的序列 xff0c 现在要求将序列分割为m段 xff0c 每段子序列中的数在原序列中连续排列如何分割才能使这m段子序列的和的最大值达到最小 xff1f 刚刚写了最大k乘积问题的分析 xff0c 再过来看这道
OpenCV 源码编译 + cuda + cuDNN（未成功）

目录安装 cuda cuDNN1 1 安装 cuda1 2 安装 cuDNN 重新编译 OpenCV 测试安装结果3 1 添加配置项3 2 OpenCV cuda 测试结果参考文章前言 xff1a 上篇文章搭建 OpenCV 环境的时
树莓派报错“Cannot currently show the desktop”的完美解决办法

最近在利用树莓派部署神经网络的时候出现了一些大大小小的问题 xff0c 很多问题都可以在网上直接或间接地找到答案 xff0c 但有个别问题即使按照网上的高赞博客说的去做了仍然没用笔者根据最近遇到的有关树莓派VNC win10远程桌面连接
汉字国标码、区位码和机内码三者的定义及联系

一三者的定义 1 汉字国标码 xff1a 创建于1980年 xff0c 目的为了使每个汉字有一个全国统一的代码而颁布了汉字编码的国家标准每个汉字有个二进制编码 xff0c 叫汉字国标码 2 区位码 xff1a 国标码是一个四位十六进制数
汇编语言程序设计实验(五)——嵌套循环打印ACSII表

目录实验目的及内容一单层循环实验1 斐波那契数列2 自然数累加和二嵌套循环实验1 冒泡排序法2 输出ACSII码表实验目的及内容理解循环程序结构的特点 xff0c 掌握循环结构程序的编写一单层循环实验 xff08 1 xff
logism电路仿真实验(三)——串行加减法器、先行进位加法器、阵列乘除法器、ALU运算器组成实验

目录实验说明1 多位串行加法器和多位可控加减电路的设计 xff08 1 xff09 设计完成8位串行加法器 xff08 2 xff09 设计完成8位可控加减法器 2 快速加法器的设计 xff08 1 xff09 设计4位先行进位电路 xf
计算机视觉(多目标跟踪)算法中卡尔曼滤波算法详解

目录一背景详解二卡尔曼滤波 Kalman 原理代码实践三总结参考文献一背景详解卡尔曼滤波 xff08 Kalman filter xff09 是一种高效的自回归滤波器 xff0c 它能在存在诸多不确定性情况的组合信息中估计动
结合AutoLayout实践iOS8上UITableViewCell高度的自适应

上一次写博客已经是4个月之前了 xff0c 不是不想写 xff0c 只是没找到太合适的题目 xff0c 本人秉着宁缺毋滥的原则好吧 xff0c 我承认是我懒惰了四个月 xff0c 虽然陆续提交了几个项目 xff0c 但是所学所用变化不大
正则表达式

概述 1 正则表达式功能非常强大 xff0c 但是学习难度也很大正则表达式是一套独立的语法 xff0c 和Python并没有任何相似和相关之处 xff0c 只不过是Python提供了对正则表达式的支持 2 正则表达式是编写网络爬虫提取特定
PaddleX 在windows10使用paddle_inference部署C#打包dll全教程

目录一基本环境配置1 1 Visual Studio2019安装1 2 CUDA10 2安装1 3 安装Cudnn1 4 下载PaddleX develop1 5 下载paddleinference1 6 下载opencv3 4 61
Jetson Nano Pytorch+TensorRT环境配置系统移植到另一张TF卡

PS 使用本文章中dd写入的方式可以用于备份TF卡 SD卡硬盘里操作系统环境变量和系统数据随时备份随时恢复内容完全一样目录 PS 使用本文章中dd写入的方式可以用于备份TF卡 SD卡硬盘里操作系统环境变量和系统数据随时
Stable Diffusion+ControlNet+Lora 指导AI+艺术设计的WebUI全流程使用教程

目录一背景知识1 1 Stable Diffusion背景知识1 2 ControlNet 背景知识二使用方法2 1 环境配置2 2 运行WebUI 三背景知识3 1 Stable Diffusion参数详解3 2 Control
Ubuntu20.04+Windows10双系统迁移新硬盘并解决引导损坏全流程总结

目录一备份原有系统1 1 压缩原系统的目录二安装新系统三迁移系统四引导修复4 1 Ubuntu引导修复4 2 Win10引导修复4 3 双系统grub修复因工作需要 xff0c 欲将Ubuntu系统迁移到一块全新SSD中 x
Ubuntu20.04使用多卡训练HyperNetwork模型和LoRA模型全流程及疑难问题解决方案

目录一 LoRA模型多卡训练1 1 安装xformer等库1 2 设置路径1 3 多卡训练二 HyperNetwork模型多卡训练2 1 HyperNetwork通过WebUI训练疑难报错解决方案多卡训练报错软硬件配置 xff1a

热门标签