大模型LLM-微调经验分享&总结

2023-11-03

模型越大对显卡的要求越高，目前主流对大模型进行微调方法有三种：Freeze方法、P-Tuning方法和Lora方法。笔者也通过这三种方法，在信息抽取任务上，对ChatGLM-6B大模型进行模型微调。liucongg/ChatGLM-Finetuning: 基于ChatGLM-6B模型，进行下游具体任务微调，涉及Freeze、Lora、P-tuning等 (github.com)https://github.com/liucongg/ChatGLM-Finetuning

１＞Ｆｒｅｅｚｅ

２＞Ｐ－ｔｕｎｉｎｇ

３＞Ｌｏｒａ

【NLP】LoRA——大模型的低成本微调方法 - 知乎 (zhihu.com)

(311条消息) 什么是LoRA模型，如何使用和训练LoRA模型？你想要的都在这！_yang7711的博客-CSDN博客 (311条消息) 大模型训练——PEFT与LORA介绍_常鸿宇的博客-CSDN博客//讲的特别好

DeepSpeed 是一个深度学习优化库，它可以使分布式训练变得容易、高效和有效。

microsoft/DeepSpeed: DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective. (github.com)

DeepSpeed超大规模模型训练工具 - 知乎 (zhihu.com)

简单经验之谈：

1.finetune在训练过程中改变了模型的参数，本质修改了下游任务代码，完成了BP修改网络的参数。而LangChain+LLM并没有，因为本质是prompt的介入，不存在模型内部参数调整。
2. ①Freeze：解冻一些层来训练，其他都层都冻结。
Lora微调
②Lora：技术原理简单，但真有奇效，需要注意rank大小的设置，是根据业务领域来的，领域垂直性越强，就要设置的越大，比较有意思的就是数据，看起来最没技术含量的事情，大家不愿意做，但其实是最难的，数据收集存在诸多问题，数据少且封闭，缺乏标注，垂直领域往往对结果要求很高。
另外，有一些内容（比如商品的售价）经常在变换，如何让模型快速响应这些内容，训练（微调）一次周期还挺长的，目前可以采取配知识库的方法（ChatGLM+LangChain+知识库）
注意：生成式模型的一系列审核机制，对用户的输入数据进行审核，防止输入一些有诱导性的问题，模型需要对回答输出进行审核。内容风控是上线前的重中之重。

参考资料：

大模型LLM-微调经验分享&总结 - 知乎 (zhihu.com)

预训练大语言模型的三种微调技术总结：fine-tuning、parameter-efficient fine-tuning和prompt-tuning的介绍和对比 - 知乎 (zhihu.com)

(310条消息) 【prompt】什么是 Soft Prompt 和 Hard Prompt ?_vector<>的博客-CSDN博客

软提示词和硬提示词（soft prompt & hard prompt）_赏月斋的技术博客_51CTO博客

(310条消息) 大模型训练——PEFT与LORA介绍_常鸿宇的博客-CSDN博客//讲的特别好

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LLM

人工智能

大语言模型微调

LoRa

低秩

大模型LLM-微调经验分享&总结的相关文章

AAAI 2024 一作讲者招募 | 持续报名中

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入我们诚挚地邀请您来AI TIME分享您发表在AAAI 2024的工作请您扫码填写以下问卷如内容合适我们将会与您沟通相关分享事宜 AAAI 2024预讲会计划时间 2024年1
【连续和自适应资源需求估计】通过不断应用在线优化、选择和估计，SARDE能够有效地适应在线跟踪，并使用得到的集成技术减少模型误差（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据文章
【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
深度好文：最全的大模型 RAG 技术概览

本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究对各种方法进行了系统性的梳理涉及了 RAG 流程中的数据拆分向量化查询重写查询路由等等在做 RAG 的小伙伴一定知道
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
基于java的ssh医院在线挂号系统设计与实现

基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机随着信息技术的迅速发展和应用医院在线挂号系统已成为医院管理的重要组成部分传统的挂号方式存在许多
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾

随机推荐

EDA14--DC脚本实例

这里写目录标题一示例1 同步设计 fifo1 二示例2 异步设计 fifo2 三具体操作 fifo1为例 DC的所有理论知识已经简单的概述完了包括 DC简介概念流程逻辑推断 DC脚本命令最后给出DC的两个示例下面是大的目录
18650锂电池充电方案及保护板电路构思

18650锂电池充电方案及保护板电路构思一电路参数 1 充电电源为USB电源额定电压为5V 2 蓄电池为18650锂电池 3 7V 容量2600mAh 3 负载电机参数二电路板功能要求 1 充电电压保护防止因选用错误的充电器过
JSONObject出现重复引用$ref

现象保存的时候红框里内容是一样的结果JSON toJSONString的时候第二个就变成了 ref 原因 JSONObject 默认开启引用检测重复引用对象时会被 ref代替返回的json对象出现 ref 对象地址值解决办法 S
PhpStorm 基本设置

更换皮肤 File gt Settings gt Appearance gt Theme 字体 File gt Settings gt Editor gt Colors Font gt font 点save as 然后再自定义 typo设置
oracle和sqlite区别,数据库sqlserver与sqlite的区别

sqlserver 与sqlite的区别 sqlserver是大型数据库常用于企业级应用的后台数据存储 sqlite 是轻量级数据库对小数据量的数据存储方便文件型数据库其语法区别大比如查询前10条数据 sqlserver SELE
聊聊Api接口优化的几个方法

转载聊聊Api接口优化的几个方法知乎作为记录用于学习
Vendor ID对照表（不定期更新）

Vendor ID对照表不定期更新可自行查询原网址 8086 Intel Corporation 0731 Jingjia Microelectronics Co Ltd 1DB7 Phytium Technology Co Ltd 1
归一化函数 normalized（）

1 归一化定义与作用归一化就是要把需要处理的数据经过处理后通过某种算法限制在你需要的一定范围内首先归一化是为了后面数据处理的方便其次是保证程序运行时收敛加快归一化的具体作用是归纳统一样本的统计分布性归一化在0 1之间是统计的概
攻防演练场景中的加密流量检测技术

lt 引言 gt 在对抗日益激烈加密手段逐渐成为主流的今天攻防演练场景中的加密流量也已逐渐成为主流对加密流量检测的技术变得愈发重要目前针对攻防演练场景的加密流量检测主要分为解密后检测和不解密检测两大类传统的解密检测拥有可以直接将加
文心一言#帮我生成一段1分钟的短视频AI脚本

视频标题旅行者的一天视频类型旅游视频时长 1分钟视频描述这是一个关于一个旅行者一天的故事他早上起床后先去了一家当地的早餐店品尝了美味的当地早餐接着他去了一家博物馆了解了当地的历史和文化中午他去了一家当地的餐厅品
ubuntu上redis安装启动和停止

在 Ubuntu 上操作 Redis 可以按照以下步骤进行安装 Redis 使用以下命令安装 Redis sudo apt get update sudo apt get install redis server 设置开机自动启动使用以
OOM Killer 持续更新中

虚拟地址空间的概念都门儿清 Linux 认为用户进程调用malloc申请了动态内存后不见得马上就会使用这段内存进行写读操作 Linux使用了拖到最后的分配机制用时分配机制但是即使是用时分配也不见得总有内存可分配当进程太多显得内存
kotlin与java实现混编基础看这篇就够了

前几年一直关注安卓想换个方向奔着移动端大步向前由于比较懒就一直停留在想法这不今天勤快点动手搞了一个基础的java和kotlin混编和大家总结分享一下首先需要了解什么事kotlin kotlin中文网上面有详细的讲解比如入门教
设计模式（二）- 代理模式

代理模式文章目录代理模式 1 代理模式 1 1介绍 1 2 应用实例 1 3 静态代理 1 4 动态代理 1 4 1 Java lang reflect Proxy类可以直接生成一个代理对象 1 4 2 InvocationHandle
java 数组合并_数组与链表

CPU L1缓存读写速度高出内存100倍左右缓存在加载地址的时候基于Locality of reference也会加载相邻的地址内容如果一个地址被访问那么它相邻的地址也极有可能之后被访问数组 1 2 3 4 数组使用连续的内存来存
K-均值聚类算法(K-Means)

简单介绍 k means聚类属于无监督学习的一种在没有给与labels的情况下将数据分成指定的K类它将相似的对象归到一个簇中将不相似的对象归到不同簇中相似这一概念取决于所选择的相似度计算方法 K means是发现给定数据集的K个
Windows安装使用Nacos并进行服务治理

Nacos简介 Nacos 致力于帮助您发现配置和管理微服务 Nacos 提供了一组简单易用的特性集帮助您快速实现动态服务发现服务配置服务元数据及流量管理 Nacos其实就是一个注册中心用来管理和注册微服务搭建Nacos环境安
java list 按float属性排序

前言项目需要对一个类的对象的list按照其中的一个float属性进行排序网上有很多关于关于对类的对象的列表的排序但看到的大都是整型或字符串类型的属性才能排序本文解决了按照float型属性排序的方法但感觉尚不是最好的解决方案故此记
【GDB调试动态库】

GDB调试动态库动态库编译的时候已经添加了 g但是设置断点还是不生效报如下错误动态库编译的时候已经添加了 g但是设置断点还是不生效报如下错误 warning Could not load shared library symbols f
大模型LLM-微调经验分享&总结

模型越大对显卡的要求越高目前主流对大模型进行微调方法有三种 Freeze方法 P Tuning方法和Lora方法笔者也通过这三种方法在信息抽取任务上对ChatGLM 6B大模型进行模型微调 liucongg ChatGLM Fine

大模型LLM-微调经验分享&总结

大模型LLM-微调经验分享&总结 的相关文章

随机推荐

热门标签

大模型LLM-微调经验分享&总结的相关文章