ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

2023-12-20

ChatGLM3-6B 是一个语言大模型，最近在评估这个模型，但发现它的文档有限，只能从demo代码中猜测调用的参数的含义，准确度是有限的；于是，通过查看源代码来研究，目前整理笔记如下：

ChatGLM3-6B 的调用接口有两个，一个是chat接口，一个是stream_chat接口

接口函数的实现位于代码 chatglm3-6b/blob/main/modeling_chatglm.py 中

一、chat接口

chat接口的原型如下：

def chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",
             max_length: int = 8192, num_beams=1, do_sample=True, top_p=0.8, temperature=0.8, logits_processor=None,
             **kwargs):

参数说明如下：

参数名	参数含义	默认值
tokenizer	用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
query	str 类型，用户输入的任何文本
history	List[Dict]，可选参数；对话历史，每一项都是一个字典，包含角色（'role'）和内容（'content'）。	None
role	str, 可选参数；输入文本的角色，可以是'user'或者'assistant'。	user
max_length	int, 可选；生成文本的最大长度。	8192
num_beams	int, 可选；Beam搜索的宽度，如果值大于1，则使用Beam搜索	1
do_sample	bool, 可选；是否从预测分布中进行采样，如果为True，则使用采样策略生成回复。	True
top_p	float, 可选；用于控制生成回复的多样性	0.8
temperature	float, 可选；控制生成文本的随机性的参数	0.8
logits_processor	LogitsProcessorList, 可选；用于处理和修改生成步骤中的logits的对象	None
**kwargs	其他传递给模型生成函数的参数

返回值：

response (str) : 模型的响应文本。
history (List[Dict]) : 更新后的对话历史。

二、stream_chat 接口

流式聊天函数，接受一段文本查询，返回模型的响应。这个函数返回的是一个生成器，可以在流式处理中使用。

该接口函数的原型定义如下：

def stream_chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",
                    past_key_values=None,max_length: int = 8192, do_sample=True, top_p=0.8, temperature=0.8,
                    logits_processor=None, return_past_key_values=False, **kwargs):

参数说明如下：

参数名	参数含义	默认值
tokenizer	用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
query	str，必须参数；用户输入的任何聊天文本。
history	List[Dict], 可选；对话历史，每一项都是一个字典，包含角色（'role'）和内容（'content'）。	None
role	str, 可选: 输入文本的角色，可以是'user'或者'assistant'。	user
past_key_values	List[Tensor], 可选；用于transformer模型的过去的键值对	None
max_length	int, 可选: 生成文本的最大长度.	8192
do_sample	bool, 可选;是否从预测分布中进行采样	True
top_p	float, 可选: 用于控制生成回复的多样性。	0.8
temperature	float, 可选;控制生成文本的随机性的参数	0.8
logits_processor	LogitsProcessorList, 可选;用于处理和修改生成步骤中的logits的对象。	None
return_past_key_values	bool, 可选): 是否返回过去的键值对，用于下一步的生成。	False
**kwargs	其他传递给模型生成函数的参数。

返回值：

response (str) : 模型的响应文本。
history (List[Dict]): 更新后的对话历史。
past_key_values (List[Tensor], 可选): 如果return_past_key_values为True，返回用于下一步生成的过去的键值对。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

ChatGLM6B

modelchat

开发语言

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明的相关文章

Django：导入错误：无法导入名称接收者

非常基本的 django 应用程序当我尝试执行任何操作 runserver syncdb 时它会为我提供以下内容想法如果我的其中一个文件有问题您能帮我指导一下问题可能是什么吗 File Library Python 2 7 sit
使用 pip 或 conda 来管理包？ [复制]

这个问题在这里已经有答案了我已经使用 matlab 进行机器学习很长一段时间了最近切换到 python 并使用其包管理器 pip 安装某些包并成功安装了许多包几天前我开始使用 conda 我以前安装的所有软件包都被覆盖我真的很想
用户警告：MovieWriter ffmpeg 不可用

尝试在 google colab 上制作动画收到此警告用户警告 MovieWriter ffmpeg 不可用 warnings warn MovieWriter s 不可用 writer did pip 安装 ffmpeg 标准化但没有
如何在 Python 中使这个随机文本生成器更加高效？

我正在研究一个随机文本生成器不使用马尔可夫链目前它的工作没有太多问题首先这是我的代码流程输入一个句子作为输入这称为触发字符串被分配给一个变量获取触发字符串中最长的单词在所有古腾堡计划数据库中搜索包含该单词的句子无论大写还
使用 pycharm 进行交互式 shell 调试

我是 PyCharm 新手我已经使用 IDLE 很长时间了在IDLE中执行脚本后使用Python对象非常方便有没有办法在使用 PyCharm 与交互式 python shell 执行后使用脚本对象例如我们有一个测试项目其中包
有没有纯Python的表类？

我正在构建一个需要分析表格数据的应用程序我想执行一些列操作例如重命名列删除列以及根据现有列的值计算新列的能力我的第一选择是 Pandas 之类的东西但是一个限制是这个项目必须是跨平台的并且非常容易在 virtualenv 中部署
表单输入框不显示

我正在尝试使用 Django 显示一个简单的表单输入文本框我正在亚马逊 AWS 上部署该网站在不同的服务器 pythonanywhere 上运行良好但在 AWS 上存在主要问题具体来说输入框没有被显示我使用的模板如下首页 ht
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
调整pandas read_sql_query NULL值处理？

当我做 from sqlalchemy import create engine import pandas as pd engine create engine sqlite conn engine connect conn execut
解码来自 S60 设备的 WBXML SyncML 消息

我正在尝试解码来自诺基亚 N95 的 WBXML 编码的 SyncML 消息我的第一次尝试是使用 python pywbxml 模块它包装了对 libwbxml 的调用用此方法解码消息会得到许多标签以及标签内的一大块二进制文件我
使用Python处理Sqlite数据库中的换行符“\n”？

我有一个名为 test db 的 Sqlite 数据库其中包含两个表其结构如下表 1 ID 整数主键自动增量名称 varchar 500 颜色 varchar 500 表2 ID INTEGER PRIMARY KEY AUTOIN
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
如何在pandas中分组后从每组中选择前n行？ [复制]

这个问题在这里已经有答案了我有一个具有以下形状的 pandas 数据框 open year open month type col1 col2 我想找到每个年月中的顶级类型所以我首先找到每个年月中每种类型的计数 freq d
将 tf.contrib.layers.xavier_initializer() 更改为 2.0.0

我该如何改变 tf contrib layers xavier initializer tf 版本 gt 2 0 0 所有代码 W1 tf get variable W1 shape self input size h size initi
使用 matplotlib 在 python3 中对多个形状进行动画处理

尝试在 python3 中使用 matplotlib 动画函数同时对多个对象进行动画处理下面写的代码是我到目前为止的位置我能够创建多个对象并将它们显示在图中我通过使用包含矩形补丁函数的 for 循环来完成此操作从这里开始我希望通过
适用于 Python 的 GitLab CI 共享 Windows 运行器

我在 GitLab 中有一个 python 项目仓库我看到 GitLab 共享了可用的测试版 Windows 运行程序请参阅this https about gitlab com blog 2020 01 21 windows shar
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
python webdriver_manager chrome 自定义配置文件

如何使 webdriver manager chrome 使用自定义 chrome 用户配置文件我知道对于 selenium webdriver 我可以这样指定 options Options options add argument f
加入语音频道（discord.py）

当我尝试让我的机器人加入我的语音频道时出现以下错误 await client join voice channel voice channel 产生错误的行 Traceback most recent call last File usr
pandas - 组合行的字符串

我有一个像这样的数据框 id text 1 DM HTN Enlarged prostate 2 hypertensive and on regular treatment 2 LBP 3 DM HTN Enlarged prostate

随机推荐

英语学习（看病篇）

一预约医生 1 基本病症 1 I feel terrible 我感觉不舒服 2 I ve been vomiting all night 我昨天吐了一晚上 3 I have diarrhea 我腹泻 4 使用医疗词汇搭配动词 have
为什么要编写测试用例，测试用例写给谁看？

为什么要编写测试用例测试用例写给谁看这个问题看似简单但却涵盖了一系列复杂的考虑因素并不太好回答为了向各位学测试的同学们解释清楚为什么编写测试用例是至关重要的我将通过以下5个方面进行展开 1 为什么要写测试用例 2 测试用例写给
石磊：BANI时代下，企业人才管理破局之道

以下内容根据用友网络副总裁用友大易联合创始人石磊于2023人才管理与HR数智化年度论坛的演讲内容整理而成过去一段时期我们会说我们生活在一个VUCA时代如今无论是全球经济环境的加速变化还是前沿技术的快速更迭我们似乎面临着更大的挑战
浅谈埃塞俄比亚阿达玛工业园区项目电力监控系统的研究与应用

摘要介绍阿达玛工业园区项目采用智能电力仪表采集配电现场的各种电参量和开关信号系统采用现场就地组网的方式组网后通过现场总线通讯并远传至后台通过Acrel 2000型电力监控系统实现配电室配电回路用电的实时监控和管理 Abstrac
Apipost：一键生成接口文档

你是否经常遇到接口开发过程中的各种问题或许你曾为接口测试与调试的繁琐流程而烦恼不要担心今天我将向大家介绍一款功能强大易于上手的接口测试工具 Apipost 并带你深入了解如何玩转它轻松实现接口测试与调试什么是Apipost Ap
全面解析找不到xinput1_3.dll无法继续执行代码的多种解决方案（实用教程）

xinput1 3 dll文件是什么 xinput1 3 dll是一个动态链接库文件它是DirectInput的组件之一 DirectInput是微软公司开发的一种输入设备驱动程序用于处理游戏控制器键盘鼠标等输入设备的信号 xinp
用户管理第2节课-idea 2023.2 后端--删除表，从零开始

一鱼皮清空model文件夹下二鱼皮清空mapper文件夹下三删除 test 测试类下的部分代码 3 1删除SampleTest 3 2删除部分代码 UserCenterApplicationTests
计算机提示vcruntime140.dll丢失的解决方法,多种修复教程分享

vcruntime140 dll是一个非常重要的动态链接库文件它包含了许多运行时的函数和类然而有时候我们可能会遇到vcruntime140 dll无法继续执行代码的问题这会给我们带来很大的困扰那么这个问题是什么原因导致的呢又应
冒泡排序/选择排序/插入排序/快速排序/归并排序/桶排序/堆排序/希尔排序/计数排序/基数排序/二分查找/广度优先搜索/深度优先搜索

排序算法冒泡排序 Bubble Sort 通过重复地比较相邻的元素并交换它们使得最大或最小的元素逐渐移动到列表的一端从而实现排序选择排序 Selection Sort 在未排序的部分中选择最小或最大的元素并将其放置在已排
使用 Helm Chart 部署分布式 GreptimeDB

GreptimeDB 作为云时代基础设施的时序数据库从第一天开始就积极拥抱云原生技术将数据库部署在 Kubernetes 上可以提供可伸缩性自愈能力和简化的部署和管理从而为应用程序提供了强大的弹性和可靠性 Helm 是一个用于管理
解决IOS上架App Store后显示语言为英文的问题

文章目录问题网页端App Store显示 PC端App Store 手机端App Store 解决方法 Flutter中配置 IOS中配置
STS、CTS、GTS、VTS测试指南

Android Security Test Suite STS 是谷歌关于android安全补丁安装情况的一个测试套件STS和security patch相关的是CTS测试新增加一项安全测试套件 STS是201808才开始测试的 Secu
网站被攻击了怎么恢复？如何在被攻击后第一时间接入高防恢复正常访问?

网站受到攻击的原因是多种多样的包括技术漏洞人为疏忽社会工程学等各种因素保护网站的安全需要综合运用技术手段当网站遭到攻击时以下几个步骤可以帮助恢复网站的正常运行 1 分析攻击首先要确认网站被攻击的类型和程度以确定所需的恢复步骤
IDEA中也能用Postman了，这款插件平替

Postman是大家最常用的API调试工具那么有没有一种方法可以不用手动写入接口到Postman 即可进行接口调试操作今天给大家推荐一款IDEA插件 Apipost Helper 写完代码就可以调试接口并一键生成接口文档而且还可以根据
服务器数据恢复-昆腾存储StorNext文件系统下raid5数据恢复案例

服务器数据恢复环境昆腾某型号存储 StorNext文件存储系统共有9个分别配置了24块磁盘的磁盘柜其中8个磁盘柜存放普通数据 1个磁盘柜存放元数据存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列还
基于PySide6的简易单位转换器

制作一个简易的长度和重量单位转换器在qtdesigner中设计如下的界面下图为全部控件和整体布局也可以直接复制下面代码下面是整个ui界面的 ui文件将其在vscode中新建后使用工具进行编译生成py文件即可由于上面控件中计算按钮
C++ AVL树(四种旋转,插入)

C AVL树四种旋转插入一 AVL树的概念及性质二我们要实现的大致框架 1 AVL树的节点定义 2 AVL树的大致框架三插入 1 插入逻辑跟BST相同的那一部分 2 修改平衡因子
在scrapy 使用selenium模拟登录获取cookie

前言最近有一点点爬虫需求想总结一下scrapy框架的一些基本使用方法加深印象自己一直习惯使用一些脚本文件运行爬虫面对数据量非常大稳定性要求比较高的效率需求比较高的情况下还是用scrapy较为合适 scrapy是一个异步的框架
【转载】【有用】gitee 拉取或push 代码https 协议的地址发生证书错误的解决（server certificate verification failed. CAfile: /etc/s）

问题描述从GitHub地址下载内容提示服务器证书验证失败没有CRLfile curl 60 server certificate verification failed CAfile etc ssl certs ca certific
ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

ChatGLM3 6B 是一个语言大模型最近在评估这个模型但发现它的文档有限只能从demo代码中猜测调用的参数的含义准确度是有限的于是通过查看源代码来研究目前整理笔记如下 ChatGLM3 6B 的调用接口有两个一个是cha

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

一、chat接口

二、stream_chat 接口

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明 的相关文章

随机推荐

热门标签

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明的相关文章