阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM

2023-11-10

1.ChatGLM2-6B 部署

更新系统

apt-get update

安装git

apt-get install git-lfs
git init
git lfs install

克隆 ChatGLM2-6B 源码

git clone https://github.com/THUDM/ChatGLM2-6B.git

克隆 chatglm2-6b 模型

#进入目录
cd ChatGLM2-6B
#创建目录
mkdir model
#进入目录
cd model
#克隆
git clone https://huggingface.co/THUDM/chatglm2-6b

安装 ChatGLM2-6B 依赖

cd ../
pip install -r requirements.txt

修改模型的路径

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).cuda()

修改成

tokenizer = AutoTokenizer.from_pretrained("model/chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("model/chatglm2-6b", trust_remote_code=True).cuda()

启动服务

python web_demo.py

启动成功后

2.langchain+chatGLM 部署

克隆 langchain-ChatGLM 源码

git clone https://github.com/imClumsyPanda/langchain-ChatGLM.git

克隆模型

#进入目录
cd langchain-ChatGLM
#创建目录
mkdir text2vec-large-chinese
#进入目录
cd text2vec-large-chinese
#克隆
git clone https://huggingface.co/GanymedeNil/text2vec-large-chinese

安装 langchain-ChatGLM 依赖

cd ../
pip install -r requirements.txt

修改配置

修改一

"text2vec": "GanymedeNil/text2vec-large-chinese"

修改成

"text2vec": "text2vec-large-chinese/text2vec-large-chinese"

修改二

"pretrained_model_name": "THUDM/chatglm2-6b"

修改成

"pretrained_model_name": "../ChatGLM2-6B/model/chatglm2-6b"

修改三

# LLM 名称
LLM_MODEL = "chatglm-6b"
# 量化加载8bit 模型
LOAD_IN_8BIT = False

修改成

# LLM 名称
LLM_MODEL = "chatglm2-6b"
# 量化加载8bit 模型
LOAD_IN_8BIT = True

安装依赖 (启动langchain+chatGLM时，报错提示要安装的依赖)

pip install accelerate
pip install bitsandbytes

启动服务

python webui.py

启动成功后

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

langchain

阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM 的相关文章

LangChain（6）构建用户自己的Agent

构建用户自己的Agent 编写简单的计算工具编写有多个参数的工具其它更高级的工具 LangChain 中有一些可用的Agent内置工具但在实际应用中我们可能需要编写自己的Agent 编写简单的计算工具 pip install qU l
langchain包下载安装以及基本使用的注意事项

当我们使用import langchain导入包是需要先下载langchain这个包注意事项我们的python版本必须大于等于3 8 1 否者将会导致 cannot import name RecursiveCharacterTextS
window零基础部署langchain-ChatGLM

一介绍从0开始安装运行langchain ChatGLM 6b int4模型主要是版本要配套不然特别容易报错我的机器配置CPU是Intel Core i7 7700HQ CPU 2 80GHz 2 80 GHz GPU8G 二相关
LangChain 手记 Conclusion结语

整理并翻译自DeepLearning AI LangChain的官方课程 Conclusion Conclusion 结语本系列短课展示了大量使用LangChain构建的大语言模型应用包括处理用户反馈文档上的问答系统甚至使用LLM来决
LLM+LangChain+web UI的架构解析——预备知识、工具篇

目录一 LLM的低资源模型微调二向量数据库 1 Milvus v2 1 4 云原生自托管向量数据库 Ubuntu下 1 安装 Docker Compose方式 2 管理工具仅支持Milvus 2 0 之后的 3 python操作基
吴恩达ChatGPT《LangChain for LLM Application Development》笔记

基于 LangChain 的 LLM 应用开发 1 介绍现在使用 Prompt 可以快速开发一个应用程序但是一个应用程序可能需要多次写Prompt 并对 LLM 的输出结果进行解析因此需要编写很多胶水代码 Harrison Cha
LangChain 中的嵌入

在自然语言处理 NLP 领域嵌入已经成为游戏规则的改变者它们使我们能够将单词和文档转换为计算机可以理解的数字这些数字表示称为嵌入对于理解文本分析情感和翻译语言等任务至关重要本文探讨了LangChain中的嵌入这是一个用于创建
LangChain 的聊天模型

各位人工智能爱好者大家好今天我们就来详细了解一下 LangChain 聊天模型 LangChain是一个很棒的工具它提供了与各种语言模型交互的标准接口包括基于文本的大型语言模型 LLM 和聊天模型 LangChain模型的概念模
如何快速选择合适的模型和prompt，langchain来帮你

构建您的语言模型应用程序可能需要在多种提示模型甚至Chain 这是Langchain的概念之间进行选择在这个过程中您需要以简单灵活且直观的方式比较不同选项在不同输入上的表现 LangChain提供了一个名为ModelLaborat
[Agent]开发---csvAgent开发

资料 https python langchain com docs integrations toolkits csv csvagent需要csv文件和模型该方法在后台使用pandas方法去处理该文件然后调用LLM去回答问题我们使用
用 LangChain 构建基于资料库的问答机器人（二）：从资料源中提取文本信息

大家好我是学生大使 Jambo 这个系列的目标是做出一个根据资料回答问题的机器人那么从资料源中提取文本信息就是一件必要的事但我们的资料源格式是多样的比如 PDF Word HTML PPT 等等甚至有的资料源来自于网络这些格式都
软件测试/人工智能丨大语言模型LangChain

LangChain是一个用于开发基于语言模型的应用程序的开发框架以下是LangChain的详细介绍项目介绍 LangChain是一个链接面向用户程序和LLM之间的中间层它旨在轻松管理与语言模型的交互将多个组件链接在一起并集成额外的
用通俗易懂的方式讲解：大模型 RAG 在 LangChain 中的应用实战

Retrieval Augmented Generation RAG 是一种强大的技术能够提高大型语言模型 LLM 的性能使其能够从外部知识源中检索信息以生成更准确具有上下文的回答本文将详细介绍 RAG 在 LangChain 中的
用通俗易懂的方式讲解：内容讲解+代码案例，轻松掌握大模型应用框架 LangChain

本文介绍了 LangChain 框架它能够将大型语言模型与其他计算或知识来源相结合从而实现功能更加强大的应用接着对LangChain的关键概念进行了详细说明并基于该框架进行了一些案例尝试旨在帮助读者更轻松地理解 LangChai
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
有没有办法在langchain中加载通过VectorstoreIndexCreator创建的索引？它是如何工作的？

我正在尝试 langchains 及其应用程序但作为一个新手我无法理解嵌入和索引如何在这里真正协同工作我知道这两个是什么但我无法找到使用我创建和保存的索引的方法persist directory 我使用以下代码成功保存了 Vecto
使用 Flask 和 LangChain 流式传输 ChatGPT 的结果

基本上我想用 Flask 和 LangChain 来实现这一点 https www youtube com watch v x8uwwLNxqis https www youtube com watch v x8uwwLNxqis 我正在构
如何向pandas工具包代理添加会话记忆？

我想添加一个ConversationBufferMemory to pandas dataframe agent但到目前为止我还没有成功我尝试通过构造函数添加内存 create pandas dataframe agent llm df
使用 FastAPI 传输 LangChain OpenAI 响应 [重复]

这个问题在这里已经有答案了我想将 OpenAI 的响应直接传输到 FastAPI 的端点 Code 在我的threads handler py 位于单独的文件夹中中我有以下函数askQuestion def askQuestion s

随机推荐

Labelme安装及使用教程

Labelme安装教程基于anaconda 1 创建anaconda虚拟环境labelme conda create n labelme python 3 6 完成之后如图所示由于我已经创建了labelme故这里用labelme1代替
产品思维用户思维

用户思维是一种关注用户需求体验和价值的思维方式将用户放在产品设计开发和提供服务的核心位置它强调了理解用户在不同场景下的需求提供与之相匹配的解决方案从而帮助用户实现他们的目标描述一个用户时可以从不同角度来考虑按人口属性描述用
什么是搜索引擎？

搜索引擎搜索引擎是指根据一定的策略运用特定的计算机程序从互联网上搜集信息在对信息进行组织和处理后为用户提供检索服务将用户检索相关的信息展示给用户的系统搜索引擎包括全文索引目录索引元搜索引擎垂直搜索引擎集合式搜索引擎门户
排序算法-选择排序

属性基本思想每一次从待排序的数据元素中选出最小或最大的一个元素存放在序列的起始位置直到全部待排序的数据元素排完过程在元素集合array i array n 1 中选择关键码最大小的数据元素若它不是这组元素中的最后一个
刷脸支付完全融入了我们的日常生活

现金支付的假币丢失等问题层出不穷随着现金交易出现的不便银行卡的出现成为人们支付方式的一大转变智能手机的发展和网络科技的进步催生了网络支付方式 AI智能技术的不断发展又让人们迎来了一场刷脸支付的新革命刷脸支付是指用户在购物后的支付认
rabbitmq 连接报错 An unexpected connection driver error occured(亲测)

在服务器上安装了一个RabbitMq 并新创建了一个用户授予了管理员角色登录控制台查看一切正常兴高采烈启动项目进行连接结果一盆冷水下来报如下错误 o s a r l SimpleMessageListenerContainer Fa
git中format-patch和chery-pick的区别和联系

chery pick 把其他分支的一次或多次commit 在当前分支上重演典型的使用场景其他分支有很多提交但是你只对其中的一部分感兴趣这时候可以使用chery pick 只挑选其他分支感兴趣的commit 合并到自己的分支中 for
mybatis if-else(写法)
Debian GNU/Linux 中以源码方式安装Odoo 14（社区版）

Odoo是一种流行的开源商务应用程序套件可帮助公司管理和运营其业务也可用于在线教学它包括广泛的应用程序 Debian GNU Linux 是社区版服务器的代表本文将介绍如何在Debian GNU Linux中以源码方式安装和部署Od
垃圾回收之CMS GC

一六个阶段阶段 1 Initial Mark 初始标记这个阶段伴随着 STW 暂停初始标记的目标是标记所有的根对象包括根对象直接引用的对象以及被年轻代中所有存活对象所引用的对象老年代单独回收阶段 2 Concurrent
剑指 Offer 57. 和为s的两个数字(java+python)

输入一个递增排序的数组和一个数字s 在数组中查找两个数使得它们的和正好是s 如果有多对数字的和等于s 则输出任意一对即可示例 1 输入 nums 2 7 11 15 target 9 输出 2 7 或者 7 2 示例 2 输入 nums
MyBatis快速入门

Mybatis概述 Mybatis概念 MyBatis 是一款优秀的持久层框架用于简化 JDBC 开发 MyBatis 本是 Apache 的一个开源项目iBatis 2010年这个项目由apache software foundatio
show process cpu

Router show proc cpu CPU utilization for five seconds 63 50 one minute 58 five minutes 58 PID Runtime ms Invoked uSecs 5
NVM在windows下切换node版本

如果您很忙或者很急请直接阅读三步骤一问题背景生活里偶尔穿梭在大街小巷中工作中时常并行于多项目任务里当多个项目并行时由于创建的时间或人为选择等因素各个项目里有着差异的node版本这样我们在不同的项目里需要切换不同版本的N
Linux软链接与硬链接区别

一背景链接是一种在共享文件和访问它的用户的若干目录项之间建立联系的一种方法 Linux中包括两种链接硬链接 Hard Link 和软链接 Soft Link 软链接又称为符号链接 Symbolic link 要了解链接我们首先得了
vscode 问题解决：“检测到 #include 错误，请更新 includePath”

当我们在使用vscode进行编辑代码时往往会遇到以下警告这表明在我们的代码中无法找到对应的头文件但问题在于阅读和编辑代码需要保证代码的统一性所以我们需要知道这个头文件到底在哪我们也需要让vscode通过点击该头文件名就可以
EI、Scopus双检索

会议简介 Brief Introduction 2023年第四届自动化机械与设计工程国际会议 SAMDE 2023 会议时间 2023年12月8 10日召开地点中国南京大会官网 www samde org 机械设计制造及其自动化学
python第三方库集锦

环境管理管理 Python 版本和环境的工具 p 非常简单的交互式 python 版本管理工具 pyenv 简单的 Python 版本管理工具 Vex 可以在虚拟环境中执行命令 virtualenv 创建独立 Python 环境的工具 vi
Qt ： d指针和q指针？

目录一什么是d指针和q指针 1 d指针 2 q 指针二 d指针和q指针的作用三 d指针和q指针的使用 demo 一什么是d指针和q指针在Qt的源码中我们看到大量的Q D 和Q P 宏的调用查看代码时在一定程度上增加了复杂度
阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM

1 ChatGLM2 6B 部署更新系统 apt get update 安装git apt get install git lfs git init git lfs install 克隆 ChatGLM2 6B 源码 git clone

阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM

1.ChatGLM2-6B 部署

2.langchain+chatGLM 部署

阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM 的相关文章

随机推荐

热门标签