Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models

2023-11-19

本文是LLM系列文章，针对《Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models》的翻译。

递归总结在大型语言模型中实现长期对话记忆

摘要
1 引言
2 任务定义
3 方法
4 实验
5 主要结果
6 分析
7 结论
局限性

摘要

大多数开放领域对话系统都会忘记重要信息，尤其是在长期对话中。现有的工作通常训练特定的检索器或汇总器从过去获得关键信息，这是耗时的，并且高度依赖于标记数据的质量。为了缓解这个问题，我们建议使用大型语言模型（LLM）递归生成摘要/内存，以增强长期记忆能力。具体来说，我们的方法首先刺激LLM记忆小的对话上下文，然后使用以前的记忆和下面的上下文递归地产生新的记忆。最后，LLM可以在最新内存的帮助下轻松生成高度一致的响应。我们使用ChatGPT和text-davinci-003评估了我们的方法，在广泛使用的公共数据集上的实验表明，我们的方法可以在长上下文对话中产生更一致的响应。值得注意的是，我们的方法是一种潜在的解决方案，可以使LLM对超长上下文进行建模。稍后将发布代码和脚本。

1 引言

2 任务定义

3 方法

4 实验

5 主要结果

6 分析

7 结论

在本文中，我们提出了一种简单有效的策略，通过递归总结来提高LLM中的长期对话能力。实验结果表明了该方法的有效性和通用性。额外的分析表明，该方法可以通过上下文学习得到进一步的增强。
未来的工作包括1）探索我们的方法对更长上下文任务（例如故事生成）的长上下文建模效果，以及2）使用本地监督的微调LLM而不是使用昂贵的在线API来优化摘要性能。

局限性

我们将我们的方法的局限性归纳为两个方面。首先，我们只使用自动度量来评估所提出的方法，这可能不是开放域聊天机器人的最佳评估方法。其次，我们的方法没有考虑调用大型模型的成本，但在实际应用中不能忽视这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LLM

语言模型

人工智能

自然语言处理

Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models 的相关文章

【连续和自适应资源需求估计】通过不断应用在线优化、选择和估计，SARDE能够有效地适应在线跟踪，并使用得到的集成技术减少模型误差（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据文章
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

近日权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点报道指出波场TRON网络在2023年取得了一系列的发展和合作提升了其在Web3领域的地位其中波场TRON网络账户数量增加了 54
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
性能大减80%，英伟达芯片在华“遇冷”，我方霸气回应：不强求

中国这么大一块市场谁看了不眼馋在科技实力大于一切的今天高端芯片的重要性不言而喻作为半导体产业发展过程中不可或缺的一环芯片技术也一直是我国技术发展的一大心病在美西方等国的联手压制下我国芯片技术发展处处受阻至今也未能在高端芯片
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩

随机推荐

[491]pywin32模拟鼠标键盘操作

keybd event bVk bScan dwFlags dwExtraInfo 第一个参数虚拟键码键盘键码对照表见附录第二个参数硬件扫描码一般设置为0即可第三个参数函数操作的一个标志位如果值为KEYEVENTF EXTE
Unable to cast COM object of type Microsoft.Office.Interop.Excel.ApplicationClass' ...

问题描述这个问题产生的原因与 office 的安装有关参考 How to solve Unable to cast COM object of type Microsoft Office Interop Excel Applicati
arm鲲鹏服务器和x86区别

华为云服务器x86计算和鲲鹏计算的区别是什么 X86和鲲鹏指的是两个系列的中央处理器架构 x86采用复杂指令集 CISC 鲲鹏采用精简指令集 RISC pc6a学习分享小白详细说明一下这2种服务器的差别一鲲鹏和X86处理器架构对比 1
R语言期末

一单项选择题答题说明每题均有 A B C D 四个备选答案其中只有一个正确答案将其选出并写在答题纸上 1 R 语言软件是被用于统计计算和绘图工作的一套语言和环境是一套开源的数据分析解决方案最早 1995 年是由 B
代码走查(codereview)如何执行才能提升代码质量

成功上岸进入华为之前花5W买的JAVA课程合集整整420集拿走不谢公粮上交手把手教学学完即可就业哔哩哔哩 bilibili 作为一名开发工程师如何提升个人能力减少bug的发生是一件非常重要的事情它直接关系到了领导及项目
Cesium三维地球上添加点、线、面、文字、图标（图片）、模型等标绘

添加标绘之前要明白一点 Cesium Entity是可以与样式化图形表示配对并定位在空间和时间上的数据对象或者说Cesium 提供 Entity API 来绘制控件数据所以我们添加的所有标绘都是entity Entity API简介 C
【DDR3 控制器设计】（3）DDR3 的写操作设计

写在前面本系列为 DDR3 控制器设计总结此系列包含 DDR3 控制器相关设计认识 MIG 初始化读写操作 FIFO 接口等通过此系列的学习可以加深对 DDR3 读写时序的理解以及 FIFO 接口设计等附上汇总博客直达链接 DD
2022年数字化转型的三大基于云的驱动因素

未来一年将标志着企业品牌工作和生活创新的最大重置文章来源 Venture Beat Google Cloud CTO Will Grannis 数字技术一直是并将持续是公司应对新冠疫情的背后推动力从购物和供应链到儿童保育和工作一切都
服务器访问系统盘数据盘,云服务器系统盘数据盘

云服务器系统盘数据盘内容精选换一换当服务器中的磁盘发生故障或者由于人为误操作导致服务器数据丢失时可以使用已经创建成功的备份恢复服务器云服务器备份仅支持将服务器中的所有云硬盘作为整体进行备份和恢复不支持对服务器中的部分云硬盘进行
【Linux】网络编程 - Socket套接字/基于UDP的网络通信

目录一套接字 1 什么是套接字 Socket套接字 2 套接字的分类 3 Socket套接字的常见API 二网络字节序 1 什么是网络字节序 2 网络字节序和主机字节序的转换接口三 IP地址形式上的转换四客户端的套接字不由程序员
Verilog HDL——Modelsim仿真

常用testbench语法 finish 和 stop finish任务用于终止仿真并跳出仿真器 stop任务则用于中止仿真 timescale time unit time precision time unit指定计时和延时的测量单位
v-for中遍历多个el-select时，下拉选择框同步选择问题

好久没写博客了今天记录下遇到的问题需求就是遍历生成了多个el select下拉框但是这时候v model绑定值却出现了问题问题复现代码如下
The Linux Networking Architecture

The Linux Networking Architecture Design and Implementation of Network Protocols in the Linux Kernel 这本书比较老了写kernel2 4的
HTTP协议简介，数据安全如何保证http传输安全性，http与https区别

目前大多数网站和app的接口都是采用http协议但是http协议很容易就通过抓包工具监听到内容甚至可以篡改内容为了保证数据不被别人看到和修改可以通过以下几个方面避免重要的数据要加密比如用户名密码我们需要加密这样即使被抓包监
git不能提交子文件夹？

空目录无法add 在最里面的目录下加上随便加上一个txt就可以了
《编写高质量代码：改善Java程序的151个建议》读书笔记

编写高质量代码改善Java程序的151个建议秦小波 67个笔记前言本书附带有大量的源码下载地址见华章网站www hzbook com 建议11 养成良好习惯显式声明UID SerialVersionUID 也叫做流标识符 Str
机器学习课程总结3--基本卷积神经网络+评价指标+目标检测与Yolo网络

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档目录一基本卷积神经网络 1 AlexNet 2 VGG 16 3 残差网络二常用数据集与评价指标 1 数据集 2 评价指标三目标检测 YOLO 1 1 目标检测问
Python实现评分函数算法——打造高效智能评估系统

Python实现评分函数算法打造高效智能评估系统在众多的机器学习应用场景中评估模型表现的工作至关重要评分函数算法对于评估预测结果的好坏以及对于相应优化算法的使用具有非常重要的作用本文将介绍如何使用Python实现评分函数算法并
C语言经典100例题（31）--请输入星期几的第一个字母来判断一下是星期几，如果第一个字母一样，则继续判断第二个字母。

目录题目问题分析代码测试如果错误分析题目请输入星期几的第一个字母来判断一下是星期几如果第一个字母一样则继续判断第二个字母问题分析 1 星期日 Sunday 缩写Sun 2 星期一 Monday 缩写Mon 3 星期二 T
Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models

本文是LLM系列文章针对 Recursively Summarizing Enables Long Term Dialogue Memory in Large Language Models 的翻译递归总结在大型语言模型中实现长期对话记

热门标签