大语言模型能否替换传统多轮任务型问答系统?

2023-11-03

语言模型能否替换传统多轮任务型问答系统?

以下文章来源于无数据不智能 ,作者森本悟

概述

本论文(Are LLMs All You Need for Task-Oriented Dialogue?)的研究背景是,大型语言模型(LLMs)由于其对话交互的能力在最近变得越来越受欢迎。因此,本文旨在研究LLMs在任务导向型对话中的表现

以往的方法中,专门针对任务的模型在处理数据实体上表现更好。通过本文的评价,LLMs的表现不如这些自定义模型。但是,LLMs在给定正确的槽位值的情况下,有引导对话进入成功结束的能力。另外,用户提供的实体数据模型预测的槽位之间的差异越小,模型表现越好。本文的研究方法和解决问题的动机均合适

本文提出了一种针对任务导向型对话的方法,其中将LLMs用于上下文状态提取和生成目标响应。此外,本文还提出了基于真实槽位分布或指定领域中的示例数据的联合训练方法以提高模型的性能。

本文的研究任务在任务导向型对话中处理多轮会话的数据实体。LLMs在明确的状态跟踪方面的表现不如特定的任务模型,但在给定正确的槽位值的情况下,它们仍然可以为对话提供引导,提高了对话成功的概率。联合训练方法可以进一步提高模型的性能。

图片

图片

重要问题探讨

  1. 在对话系统中,如何提高预测准确率?

作者在本文中提出了一种方法,即使用上下文存储库,通过类似的对话历史记录进行训练。此外,他们还通过给出正面和负面抽取的例子,来轻松地完成上下文的存储,以便于中等程度的训练。他们还介绍了一种新的零样本对话状态追踪的架构,如何在零样本场景下处理这些问题?

2. 对话状态实时跟踪中怎样提高精度和速度?

作者在本文中描述了一个基于BERT的上下文感知联合模型(CA-Joint)。CA-Joint模型可以结合上下文信息和BERT编码器来生成更加丰富的隐含表示形式,以提高状态追踪的精度和速度。该模型在性能上优于现有方法。

3. 自从许多最新的对话系统处理技术被提出后,如何进行多领域的训练?

作者在本文中使用了Schema Guided和MultiWOZ 2.2两个多领域数据集进行实验研究。Schema Guided包含18个领域和145个指南,MultiWOZ 2.2包含7个领域和29个指南。使用这些多领域数据集进行实验可以使研究人员更好地评估不同技术的性能。

4. 在领域识别中,使用了什么技术来提高系统对话的成功率?

对于每一个多领域的对话,作者构建了一个相应的上下文仓库。使用此仓库中的对话历史记录来识别当前对话的领域。本文中,作者采用了统计学方法来进行领域识别,但可以将此项工作扩展到深度学习中。

5. 在对话状态追踪方面,如何应对常见的问题?

在本文中,作者在对话状态追踪方面采用了基于BERT的上下文感知联合模型(CA-Joint),这种模型可以更好地处理多领域对话中的常见问题。同时,作者还使用数据存储库来提供多个对话历史记录,以对对话状态进行精准的跟踪。

6. 在对话响应生成方面,如何处理信息的不完整性

对于缺失某些特定数据的情况,作者采用了delexicalized方法,即使用占位符代替缺失的信息。这种做法可以在信息不完整的情况下生成可靠的响应。然而,这种方法在某些场景下可能会导致困难,例如当数据缺失时。因此,对于特定的应用场景,需要找到一个有效的方法以平衡信息完整性和响应生成的准确性。

论文链接:https://arxiv.org/abs/2304.06556.pdf

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

大语言模型能否替换传统多轮任务型问答系统? 的相关文章

随机推荐

  • WPF TextBlock IsTextTrimmed 判断文本是否超出

    原文 WPF TextBlock IsTextTrimmed 判断文本是否超出 WPF TextBlock 设置TextTrimming情况下 判断 isTextTrimmed Text 文本是否超出 是否出现了省略号 private bo
  • flutter json工厂模式

    请求到的JSON a aa b ba b1111 bb b2222 ba b3333 bb b4444 c ca c111 cb c222 对JSON进行工厂模式 class NameModel String a List b b b
  • unity常用快捷键

    Unity常用快捷键 1 Q 抓手工具 W 移动工具 E 旋转工具 R 缩放工具 T 横切面工具 对物体沿着横切面进行缩放 2 Z 轴点模式切换 Pivot 与 Center X 轴点旋转切换 Global 与 Local 3 在场景中点击
  • 配置pytorch_geometric

    pytorch geometric是一个图神经网络的库 如果直接通过pip安装在运行时会显示依赖库 如torch sparse 没安装 在安装这些依赖库通过pip安装不上 需要去官网 https pytorch geometric com
  • 关于C++ primer 15.5节访问与继承控制的理解

    关于C primer 15 5节访问与继承控制的理解 第一次阅读时 对P543第一节 受保护的成员 感到有点难以理解 后来发现是阅读过程中对第二条和第三条特性产生了歧义 最后浪费了蛮多时间 知乎上也有对这个问题的讨论链接 有一些回答也做出了
  • Win10(Win7)局域网设置共享文件夹,超全面步骤。

    首先 计算机要设置 登录密码 否则 同局域网内的其他计算机不能正常访问本机 其次 假设本机名称为 LAPTOP ABC 用户名为 user123 本机IP地址为192 168 1 100 1 打开控制面板 选择大图标 点击 网络和共享中心
  • VCS中的覆盖率分析介绍

    VCS在仿真过程中 也可以收集Coverage Metric 其中覆盖率类型有 1 Code Coverage 包括control flow和value两部分的coverage line coverage branch coverage t
  • TVM设备添加以及代码生成

    因为要添加的设备是一种类似于GPU的加速卡 TVM中提供了对GPU编译器的各种支持 有openCl OpenGL和CUDA等 这里我们选取比较熟悉的CUDA进行模仿生成 从总体上来看 TVM是一个多层的结构 从上一个文档 TVM调试 中 基
  • ADC0809的使用

    一 前言介绍 使用ADC0809对一个模拟电压进行转换 转换后的电压使用数码管显示出来 二 ADC0809的介绍 1 ADC0809简介 ADC0809是采用COMS工艺制造的双列直插式单片8位A D转换器 分辨率8位 精度7位 带8个模拟
  • Ubuntu 20网络和DNS设置

    问题 Ubuntu 20 DNS 被自动覆盖成127 0 0 53 在界面环境下设置的静态IP地址 然后可以ping通IP 但是无法访问网页 初步判断是DNS问题 查看sudo cat etc resolv conf内容发现是127 0 0
  • github上好的网站

    https github com Trinea android open project
  • vue搭建后台管理页面(点击左侧导航,切换右侧内容)

    home vue页面
  • 不打无准备之战,Python100道经典题目,参考学习(附答案)

    近年来 Python在编程语言界里赚足了风头 无论是受欢迎程度 还是薪资待遇 都非常可观 相应的 Python岗位要求也越来越高 无论你是零基础还是老前辈 在Python面试中都不能轻视 不打无准备之战 在平时我们就需要多积累 今天就给大家
  • 统计学习第二弹--描述性统计(理论公式)

    思维导图 目录结构 集中趋势 众数 一组数据中出现频数最多的数值 常用用Mo表示 求众数 def Max number nums res for num in nums res setdefault num 0 res num 1 res
  • 用IO流实现用户的相关设置

    文章目录 用IO流实现用户的相关设置 一 目录 二 实例代码 2 1userDao 2 2UserServlet 三 演示代码 用IO流实现用户的相关设置 一 目录 二 实例代码 2 1userDao 建立一个Dao的包 在创建一个user
  • 零基础的Java小白如何准备初级开发的面试

    对于各位Java程序员来说 只要能有实践的机会 哪怕工资再低 公司情况再一般 只要自己上心努力 就可能在短时间内快速提升 甚至在工作2年后进大厂都有希望 因为项目里真实的开发实践环境是平时学习不能模拟的 所以很多想从事Java开发的同学其实
  • VirtualBox 无法使用usb2.0及3.0问题

    环境为ubuntu下安装的VirtualBox 虚拟机是win7 1 VirtualBox共享usb需要先添加用户组 查看用户组状态命令 cat etc group vboxusers 127 user usbfs 1001 user us
  • win10 + CUDA10.0 + cuDNN7.6.5 + Pytorch 安装教程

    CUDA10 0 cuDNN 7 6 5 安装可自行百度 教程很多 conda create name pytracking python 3 7 conda activate pytracking conda install pytorc
  • 【源码+文档】基于scrapy-redis的分布式网络爬虫

    第1章 引言 分布式是大数据时代流行的一个词 比如常见的分布式计算 分布式存储 分布式爬虫等等 分布式爬虫 从字面的意义上来说是集群爬虫 就是将爬虫任务分配给多台机器同时进行处理 与之对应的是单机爬虫 单点部署 单点操作 分布式爬虫相当于将
  • 大语言模型能否替换传统多轮任务型问答系统?

    语言模型能否替换传统多轮任务型问答系统 以下文章来源于无数据不智能 作者森本悟 概述 本论文 Are LLMs All You Need for Task Oriented Dialogue 的研究背景是 大型语言模型 LLMs 由于其对话