LLama Factory 安装部署实操记录（二）

2023-12-20

1. 项目地址

GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM) Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM) - GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM) https://github.com/hiyouga/LLaMA-Factory/ 2. 下载，最好是选择tag版本的源码，这里采用直接下载，clone网貌似有点问题。

wget https://github.com/hiyouga/LLaMA-Factory/archive/refs/tags/v0.4.0.tar.gz

解压：

tar -xzvf v0.4.0.tar.gz

3. 创建环境

conda create -n llama_0_4 python=3.10
cd LLaMA-Factory-0.4.0/
pip install -r requirements.txt

4.启动API，这里可以使用别的接口

CUDA_VISIBLE_DEVICES=1 python src/api_demo.py \
    --model_name_or_path $qwen14b_chat_path \
    --template default \
    --finetuning_type lora \
    --checkpoint_dir path_modle

修改API端口：src/api_demo.py中修改，参数如下所示

LLama Factory 实操记录（一）-CSDN博客

5.测试API接口的请求记录body， http://192.168.0.133:8000/v1/chat/completions

查看doc文档： http://192.168.0.133:8000/docs

{
  "model": "string",
  "messages": [
    {
      "role": "user",
      "content":  "问题"
    }
  ],
  "do_sample": true,
  "temperature": 0,
  "top_p": 0.5,
  "n":1,
  "max_tokens": 2048,
  "stream": false
}

6. 错误1

422 Unprocessable Entity

422 表现为请求格式错误，但出现了语义错误，以至于服务端无法响应。可以理解为服务端能理解请求资源类型 content-type，否则应该返回 415（Unsupported Media Type），也能理解请求实体内容，否则应该返回 400（Bad Request）

大概率是请求发的内容，要选择 json，并注意字段

7.错误2

API端口，报错RuntimeError: probability tensor contains either inf , nan or element < 0

推理的时候报 RuntimeError: 概率张量包含inf,nan或 element < 0

（1）一种说法是，原因是双卡推理，当前的确也出现该问题，A100上正常，双4090有问题。

Baichuan2合并lora后推理报错：RuntimeError: probability tensor contains either `inf`, `nan` or element < 0 · Issue #1618 · hiyouga/LLaMA-Factory · GitHub Reminder I have read the README and searched the existing issues. Reproduction 最新发现使用 api-for-llm来部署，同样会报一样的错误。看来不是这个框架的原因。模型基座是：Baichuan2-13B-Chat, 进行lora微调并合并，使用cli_demo.py 加载合并后的模型时，推理报错。报错信息如下。使用的是最新的代码。一个奇怪的现象，同样的导出合并后的模型，在A800... https://github.com/hiyouga/LLaMA-Factory/issues/1618

（2）另一种说法是，要更新代码，当前测试的是0.4.0版本的源码，未更新，大家有兴趣可以尝试一下，放在评论区

使用`web_demo.py`，部署网页端示例，报错`RuntimeError: probability tensor contains either `inf`, `nan` or element < 0` · Issue #1642 · hiyouga/LLaMA-Factory · GitHub Reminder I have read the README and searched the existing issues. Reproduction python src/web_demo.py \ --model_name_or_path ~/model/ChatGLM2-6B\ --template chatglm2 Expected behavior 希望正常运行，可以成功在多卡中成功运行 System Info transformers version:... https://github.com/hiyouga/LLaMA-Factory/issues/1642

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大模型探索

LLaMA

LLama Factory 安装部署实操记录（二）的相关文章

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA简介 xff1a 一个650亿参数的基础大型语言模型 PaperSetup其他资料作为 Meta 对开放科学承诺的一部分 xff0c 今天我们将公开发布 LLaMA 大型语言模型 Meta AI xff0c 这是一个最先进的大型
在矩池云使用Llama2-7B的具体方法

今天给大家分享如何在矩池云服务器使用 Llama2 7b模型硬件要求矩池云已经配置好了 Llama 2 Web UI 环境显存需要大于 8G 可以选择 A4000 P100 3090 以及更高配置的等显卡租用机器在矩池云主机市场
【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
【OJ比赛日历】快周末了，不来一场比赛吗？ #09.16-09.22 #12场

CompHub 1 实时聚合多平台的数据类 Kaggle 天池和OJ类 Leetcode 牛客比赛本账号会推送最新的比赛消息欢迎关注以下信息仅供参考以比赛官网为准目录 2023 09 16 周六 3场比赛 2023 09 17
Meta算力争夺演变成团队动荡！LLaMA、LLaMA2、OPT团队成员多位离职

据TheInformation报道原参与Llama项目的团队成员有多位已经辞职原因是Meta内部的OPT研究团队与Llama团队之间发生了一场关于计算资源的内部斗争看来不管是谷歌微软 OpenAI还是Meta 人才流失都是一个避不开
Code Llama系列教程之微调 CodeLlama 34B 以进行聊天（打造自己的代码AI）

虽然 Meta 的 Llama2 在 AI 领域引起了广泛关注但 34b 模型却缺席了相当长一段时间对于许多人来说这个 34b 模型是运行本地 LLM 的理想选择因为它与使用 4 位量化的单个 4090 GPU 兼容我一直在热切地
llama2模型下载

介绍 LLaMA 2 CHAT与OpenAI ChatGPT效果一样好 LLaMA 2与LLaMA 1架构相同 LLaMA 2训练数据是2000000000000个tokens 还是用了1000000个人类新标注的数据上下文长度由2048
Code Llama: Open Foundation Models for Code

Paper name Code Llama Open Foundation Models for Code Paper Reading Note Paper URL https ai meta com research publicatio
基于 LLM 的知识图谱另类实践

本文整理自社区用户陈卓见在夜谈 LLM 主题分享上的演讲主要包括以下内容利用大模型构建知识图谱利用大模型操作结构化数据利用大模型使用工具利用大模型构建知识图谱上图是之前我基于大语言模型构建知识图谱的成品图主要是将金融相关的
图技术在 LLM 下的应用：知识图谱驱动的大语言模型 Llama Index

LLM 如火如荼地发展了大半年各类大模型和相关框架也逐步成型可被大家应用到业务实际中在这个过程中我们可能会遇到一类问题是现有的哪些数据如何更好地与 LLM 对接上像是大家都在用的知识图谱现在的图谱该如何借助大模型发挥更大的
llama2本地CPU推理运行

介绍本教程使用C语言部署运行llama2模型可以高效地在CPU上进行推理主要包含的内容有 1 运行环境配置包括C python 2 原始llama2模型转换为二进制格式 3 使用C语言推理llama2 环境安装与配置项目下载 gi
【AI实战】llama.cpp 量化部署 llama-33B

AI实战 llama cpp 量化部署 llama 33B llama cpp 量化介绍环境配置安装 llama cpp 拉取 llama cpp 仓库代码编译llama cpp 生成量化版本模型模型准备将上述 pth模型权重转换
CodeLlama本地部署的实战方案

大家好我是herosunly 985院校硕士毕业现担任算法研究员一职热衷于机器学习算法研究与应用曾获得阿里云天池比赛第一名 CCF比赛第二名科大讯飞比赛第三名拥有多项发明专利对机器学习和深度学习拥有自己独到的见解曾经辅导过若
Meta推出Code Llama：编程的未来已来

今天 Meta推出了一项前沿技术 Code Llama 这是一款基于Llama 2构建的大型语言模型 LLM 专门用于生成和讨论代码这一创新技术的发布标志着编程领域的新时代 Code Llama的亮点先进的LLM Code Llama是
Alpaca构建方式探秘：低成本构造指令数据增强LLM

官方介绍 Alpaca A Strong Replicable Instruction Following Model github地址 https github com tatsu lab stanford alpaca Alpaca简介
llama.cpp试用

显存占用是真的低 13B vicuna int4量化 example chat 13B sh 正常问答交流不到2G的占用相比之下 vicuna7B原版int8量化 8G显卡下 cuda会OOM 原版不支持int4量化 chatglm6B
本地部署LLaMA-中文LoRA部署详细说明

在Ubuntu18 04 部署中文LLaMA模型环境准备硬件环境 AMD 5950X 128GB RAM RTX 3090 24G VRAM 操作系统 Ubuntu 18 04 编译环境可选 llama cpp 编译 cd llama
使用 Docker 和 Alpaca LoRA 对 LLaMA 65B 大模型进行 Fine-Tune

这篇文章中我们来聊聊如何使用两张显卡来进行 LLaMA 65B 大模型的微调工作以及如何在一张普通的 4090 家用显卡上只花几个小时就能够完成 7B 模型的微调写在前面在之前的几篇文章里我们介绍过三种方式运行 Meta 开源
Llama 架构分析

从代码角度进行Llama 架构分析 Llama 架构分析前言 Llama 架构分析分词网络主干 DecoderLayer
LLama Factory 安装部署实操记录（二）

1 项目地址 GitHub hiyouga LLaMA Factory Easy to use LLM fine tuning framework LLaMA BLOOM Mistral Baichuan Qwen ChatGLM Easy

随机推荐

测试开发 | 智能辅助在心理健康治疗中的革新：倾听、理解、支持的新时代

随着科技的迅速发展智能辅助技术正在逐渐渗透到心理健康治疗领域为个体提供更为智能个性化的支持这种创新性的结合为心理健康领域带来了新的可能性使治疗更加灵活高效并为患者提供了更全面的关怀 1 虚拟治疗环境智能辅助技术通过虚拟治疗环
航空港务数据大屏为航空港的可持续发展提供有力支撑！

随着经济的发展不断加建与扩建民用机场空港行业规模不断扩大在不断引进和消化发达国家先进技术的同时中国深入开展了对新技术和新材料的研究极大地丰富和发展了中国的机场建设技术且各项机场建设计划均已落实推进行业在经济发展的推动下欣欣向荣
在vue3的setup语法糖中为什么无法直接使用useRouter().currentRoute

在vue3的setup语法糖中为什么无法直接使用useRouter currentRoute 问题在setup语法糖中不能直接使用useRouter xx
测试开发 | 创业与人工智能的密切关系

随着科技的迅猛发展人工智能 AI 已经逐渐渗透到各个领域为创业者带来了前所未有的机遇与挑战在这个数字化转型的时代创业与人工智能的密切关系日益凸显成为推动创新和持续发展的关键因素 1 人工智能为创业提供新的商业模式人工智能技术的不
在spring boot项目引入mybatis plus后的的案例实践

前景提要 1 项目背景一个spring boot mybatis的项目分页一直是PageHelper 2 为什么要引入mybatis plus 1 简化单表的crud 2 对mybatis plus进行简单的设计以满足现有系统的规范
龙芯loongarch64服务器编译安装paddlepaddle

前言 PaddlePaddle Parallel Distributed Deep Learning 中文名飞桨是百度公司推出的开源易学习易使用的分布式深度学习平台现阶段各行各业均追求国产化软件行业也一样所有需要在龙芯服务器上编
Python+Pytest接口自动化之测试函数、测试类/测试方法的封装

前言在python pytest 接口自动化系列中我们之前的文章基本都没有将代码进行封装但实际编写自动化测试脚本中我们都需要将测试代码进行封装才能被测试框架识别执行例如单个接口的请求代码如下 import requests he
Amazon Toolkit — CodeWhisperer 使用

tFragment gt 官网 https aws amazon com cn codewhisperer trk cndc detail 最近学习了亚马逊云科技的代码工具感慨颇多下面是安装和使用的分享 CodeWhisperer
android 13.0 USB连接模式默认设为MTP

1 概述在13 0android系统产品开发中在通过otg连接设备的时候会弹出usb连接模式这时候会让客户选择当前连接电脑是哪种模式在项目开发中需要以mtp模式就是可以在电脑查看设备的内部存储的样式来设置otg连接电脑的模式
数据工作者最爱的AI功能，你知道吗～

在工作中难以避免的一项任务就是各种数据总结和汇报怎么分析总结以何种形式汇报都是具有一定的难点所以我要推荐的就是具有AI图表解析功能的可视化工具 Easyv数字孪生低代码可视化平台可实现对数据的可视化展示通过丰富的图表组件清晰展
CentOS7.9安装Mysql5.7-m14

简介本文介绍了Linux CentOS系统下Mysql5 7 m14的下载和安装方法环境 CentOS Linux release 7 9 2009 Core mysql Ver 14 14 Distrib 5 7 4 m14 for
EasyV+UE创造数字孪生可视化新篇章！

众所周知 UE是UNREAL ENGINE 虚幻引擎的简写由Epic开发是世界知名授权最广的游戏引擎之一 EasyV是一款数据可视化应用平台用户通过EasyV可以更高效的实现数据可视化项目搭建产品内有丰富的模版海量的组件简单的
智能辅助技术的未来前景：创新与便利的引领者

在数字化时代智能辅助技术正迅速崛起成为改善生活提升工作效率的关键因素这些技术通过结合人工智能机器学习和物联网等前沿技术为用户提供更加智能便捷的体验未来智能辅助技术有望在多个领域引领创新改变人们的生活方式 1 智能助理的个
使用 Amazon Fault Injection Service 演示多区域和多可用区应用程序弹性

文章作者 Jeff Amazon Fault Injection Service FIS 可帮助您将混沌工程大规模付诸实践今天我们推出了新的场景这些场景可以让您演示在亚马逊云科技可用区完全断电或从一个亚马逊云科技区域到另一个亚马逊
测试开发 | 物流与供应链中的智能优化

随着全球化的深入和商业环境的复杂化物流与供应链管理面临着前所未有的挑战然而随着人工智能 AI 和物联网 IoT 等技术的不断发展智能优化正成为推动物流与供应链行业变革的关键力量以下是智能优化在物流与供应链领域的一些关键应用 1 实
测试开发 |AI驱动的健康监测与管理：数字化时代的医疗创新

随着人工智能 AI 技术的飞速发展其在健康监测与管理领域的应用正日益成为医疗领域的重要变革力量 AI不仅提供了更精准高效的医学诊断手段还为个体化的健康管理提供了全新的可能性以下是AI驱动的健康监测与管理在数字化时代的一些关键应用 1
测试开发 | 游戏开发中的人工智能创新：探索数字娱乐的未来

随着科技的不断进步人工智能 AI 在游戏开发领域展现出巨大的潜力为游戏行业带来了前所未有的创新以下是游戏开发中人工智能创新的一些关键方面 1 智能敌对角色和游戏对抗性传统游戏中的敌对角色往往遵循固定的模式和策略容易被玩家预测通过
跟着野火学FreeRTOS：第一段（任务定义，切换以及临界段）

在裸机系统中系统的主体就是 C P U CPU CP U 按照预先设定的程序逻辑在 m a i n
git命令github拉取推送代码超时报错

背景使用魔法科学上网之后 github的页面可以正常访问但是拉取代码和推送代码还是一直报错报错信息内容 Failed to connect to github com port 443 Timed out 其实本质是因为代理设置的不正
LLama Factory 安装部署实操记录（二）

1 项目地址 GitHub hiyouga LLaMA Factory Easy to use LLM fine tuning framework LLaMA BLOOM Mistral Baichuan Qwen ChatGLM Easy

LLama Factory 安装部署实操记录（二）

LLama Factory 安装部署实操记录（二） 的相关文章

随机推荐

热门标签

LLama Factory 安装部署实操记录（二）的相关文章