Llama-1|Alpaca-LoRA 微调模型下载以及安装推理教程

2023-11-15

LLaMA|Alpaca-LoRA-openAI维基百科

Llama-1|Alpaca-LoRA 微调模型下载以及安装推理教程

经常玩AI的人应该对LoRA这一词并不陌生,尤其是在SD绘画领域,各种角色的LoRA模型层出不穷。那么语言领域是否存在LoRA呢?存在,且繁荣!

LoRA你可以理解为语言模型的一个角色,同绘画领域是一致的,是一个基于大模型所单独调教好的指定角色。比如Llama-1在泄漏之初的对话能力是极差的,仅能够通过排比式语句或其它方式引导其回复指定内容。这个时候LoRA技术的好处就体现了出来,我们如果直接对LLaMA大模型进行训练调整,这将是地狱级别的硬件消耗,然后我们可以冻结基础模型,通过嵌入式LoRA来对LLaMA进行微调,让其拥有指定的特殊功能强化。有点类似于你在SD中加载了刘亦菲,那么生成后的角色样貌总是和刘亦菲相似;又比如你基于官方模型SD-1.5大模型训练了一个李白,那么后生成的角色也都是围绕着李白的样貌。

项目描述

Alpaca模型是由坦福大学研发的LLM(Large Language Model大语言)开源模型,是一个在52K指令上从LLaMA 7B(Meta公司开源的7B)模型微调而来,具有70亿的模型参数(模型参数越大,模型的推理能力越强,当然随之训练模型的成本也就越高),而Alpaca-LoRA正是依托于此。

该代码库包含用于复现Stanford Alpaca使用低秩适应(LoRA)的结果的代码。我们提供了一个类似质量的Instruct模型,可以在树莓派上运行(用于研究),代码可以轻松扩展到 [其他模型] [此处可能缺少部分文本] text-davinci-003 13b 30b 65b

除了训练代码,在单个RTX 4090上运行数小时之外,我们还发布了一个用于下载基础模型和LoRA上进行推理的脚本,以及得到的LoRA权重本身。为了进行便宜高效的微调,我们使用了Hugging Face的PEFT以及Tim Dettmers的bitsandbytes

在没有超参数调整的情况下,LoRA模型产生的输出与Stanford Alpaca模型相当,进一步的调整可能能够获得更好的性能。

LLaMA|Alpaca-LoRA-openAI维基百科

#image_title

项目声明

该项目的所有模型都是基于LLaMA-1泄漏版本,现Meta官方已开源发布LLaMA-2版本,版本2拥有更好的推理与性能,为大家讲解LLaMA-1仅为给特殊需要的人使用。

关于LLaMA-2版本的教程,可以查阅以下教程,官方模型支持Chat聊天对话形式。

项目相关

斯坦福Alpaca:tatsu-lab/stanford_alpaca

Alpaca-LoRA:tloen/alpaca-lora: Instruct-tune LLaMA on consumer hardware (github.com)

论文地址:https://arxiv.org/pdf/2106.09685.pdf

安装教程

为了避免各个语言模型需要单独安装配置各种语言环境等复杂问题,站长推荐大家使用Text-Generation-WebUI来加载模型。

你可以将Text-Generation-WebUI理解为是一个通用的语言模型加载工具,在你部署成功之后,各主流的开源语言模型无需单独安装部署,仅需要将模型放置到Text-Generation-WebUI的模型路径下即可使用,非常方便。

关于Text-Generation-WebUI的安装部

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Llama-1|Alpaca-LoRA 微调模型下载以及安装推理教程 的相关文章

随机推荐

  • 华为OD机试 Python 【查字典】

    题目 描述 给你一个 头 就是词的开始部分 和一个单词清单 你需要找出哪些单词是以这个 头 开始的 输出 所有以这个 头 开始的单词 每个单词一行 如果一个都没有 输出 1 输入 abc 4 a ab abc abcd 输出 abc abc
  • centos发现网络连不上了,重启网络服务报错“systemctl status network.service” and “journalctl -xe” for details. [失败]

    打开虚拟机centos系统的时候发现网络连不上了 重启网络服务失败报错 Restarting network via systemctl Job for network service failed because the control
  • Android底部导航栏的四种实现

    现在大多数App都会用到底部导航栏 比如常见的聊天工具QQ 微信 购物App等等 有了底部导航栏 用户可以随时切换界面 查看不同的内容 它的实现方式也很多 以前大多使用TabHost来实现 但是现在我们有很多更好的选择 使用LinearLa
  • 查找学生信息(Java)

    主要是通过学生学号查找这个学生学生的所有信息 旨在强化对于ArrayList集合的理解 和他的常用方法如get add 等方法的熟练 和集合元素的遍历等等 是一个综合性较高的功能 首先创建学生类 public class Student p
  • npm WARN invalid config registry=“[https://registry.npm.taobao.org]“ set in C:\Users\liujieya\.npmrc

    错误如下 PS C Users liujieya Desktop Demo1 项目 vue manage gt npm run serve npm WARN invalid config registry https registry np
  • synopsys-SDC第二章——综合的基础知识

    synopsys SDC第二章 综合的基础知识 前言 一 综合是什么 二 时序约束在综合中的作用 1 优化 2 输入重排序 3 输入缓冲 三 综合中其它问题 前言 学习了FPGA和数字IC已经有一段时间了 但是对于SDC和STA整体性的学习
  • element-ui 解决 el-select 设置初始默认值后切换选项无效问题

    如何解决 el select 设置默认值后无法切换选项 在今天做项目的时候突然遇到一个问题 我给form表单里面的 el select下拉框设置一个默认值 但是当下拉框重新选择时 页面下拉框的值却不变 如图所示 原因 select 已经绑定
  • 企业补丁管理必备的11个关键步骤

    补丁管理是发布和部署软件更新的持续过程 最常见的是解决安全和功能问题 但要做好补丁管理 就必须具备一个详细的 可重复的过程 建立有效的补丁管理流程对于保持系统的安全和稳定至关重要 补丁解决可能被黑客利用的漏洞 漏洞修复用于纠正软件中的错误或
  • 操作系统内存管理——分区、页式、段式管理

    http blog csdn net hguisu article details 5713164 t0
  • python中re模块的group()和groups()

    group和groups是两个不同的函数 一般 m group N 返回第N组括号匹配的字符 而m group m group 0 所有匹配的字符 与括号无关 这个是API规定的 m groups 返回所有括号匹配的字符 以tuple格式
  • JMM概述

    文章目录 简介 什么是JMM JSR 133规范 JMM结构规范 主内存和本地内存结构 JMM的三个特征 原子性 Atomicity 可见性 有序性 关键词synchronized与volatile总结 重排序 处理器重排序与内存屏障指令
  • Angular4 数据请求 POST、GET

    创建项目 ng new OBJECT NAME 创建一个名为 httpRequest 的服务 ng generate service httpRequest 在app module ts 里面添加 providers HttpRequest
  • JAVA 正则表达式 (超详细) .

    在Sun的Java JDK 1 40版本中 Java自带了支持正则表达式的包 本文就抛砖引玉地介绍了如何使用java util regex包 可粗略估计一下 除了偶尔用Linux的外 其他Linu x用户都会遇到正则表达式 正则表达式是个极
  • java 交流学习微信群

    专注Java相关技术 SSM Spring全家桶 微服务 MySQL 集群 dubbo 分布式 中间件 Linux 网络 多线程 Jenkins Nexus Docker ELK等等 相关开发的兼职信息等 微信 18210730150 由于
  • SQL server基本的代码操作

    一 数据库相关操作 1 创建数据库 创建一个具有2个文件组的数据库test1 要求 1 主文件组包括文件test1 dat1 文件初始大小为20 MB 最大为60 MB 按5 MB增长 2 文件组test1 Group1包括文件test1
  • 智力题:砝码称重问题

    第一题 假设有280g食盐 有一架天平 有两个砝码 分别是14g 4g 请问能否在3次内将280g食盐分为100g和180g两堆 请详细描述你的解决方法 解法一 第一次 平分280g的食盐 140g 140g 目前重物 食盐 140g 14
  • java中的数组初始化赋初值

    方法一 int vis1 声明未初始化 vis1 new int 100 定义占用空间大小 100个int for int i 1 i lt 5 i vis1 i i 进行赋值 for int i 1 i lt 100 i System o
  • Ogre粒子编辑器ParticleUniverse

    最近需要使用粒子系统制作一些特效 由于没有美术人员的帮助 制作难度可想而知 在苦闷中 找到了ParticleUniverse 这也是Torchlight采用的粒子系统 ParticleUniverse包括Particle Universe
  • 配置跳转指定_http自动跳转https的配置方法

    这篇文章主要介绍了http自动跳转https的配置方法 需要的朋友可以参考下 IIs中实现Http自动转换到Https方法介绍 403跳转对SEO有一定影响 1 下载安装URL重写模块 Microsoft URL Rewrite Modul
  • Llama-1|Alpaca-LoRA 微调模型下载以及安装推理教程

    Llama 1 Alpaca LoRA 微调模型下载以及安装推理教程 经常玩AI的人应该对LoRA这一词并不陌生 尤其是在SD绘画领域 各种角色的LoRA模型层出不穷 那么语言领域是否存在LoRA呢 存在 且繁荣 LoRA你可以理解为语言模