读论文(五)MedDialog【参考性大】【可复现】

2023-11-13

Abstract

         医疗对话系统有望帮助远程医疗增加医疗保健服务的可及性,提高患者护理质量并降低医疗成本。为促进医学对话系统的研发,我们构建了大规模的医学对话数据集——MedDialog,其中包含中文数据集340万条医患对话,英文数据集120条对话。

       MedDialog 是迄今为止最大的医学对话数据集。我们在中文 MedDialog 数据集上预训练了几个对话生成模型,包括 Transformer、GPT、BERT-GPT,并比较了它们的性能。结果表明,在 MedDialog 上训练的模型能够生成临床上正确且类似于人类的医学对话。

我们还研究了在 MedDialog 上训练的模型对低资源医学对话生成任务的可迁移性。结果表明,通过对在 MedDialog 上预训练的模型进行微调的迁移学习,可以大大提高具有小数据集的医学对话生成任务的性能,如人工评估和自动评估所示。

Introduction

         作为在医院和诊所进行的传统面对面医疗的重要补充,远程医疗具有许多优势。首先,它增加了获得护理的机会。其次,它降低了医疗保健成本。第三,远程医疗可以提高护理质量。

        它也有一些缺点;增加了医生的负担。其次,与住院患者不同,临床医生可以轻松跟踪其病情进展,远程患者难以跟踪和监测。(提出了问题) 

        为了解决这些问题,人们越来越关注开发人工智能 (AI) 方法来协助远程医疗。特别是,正在开发医疗对话系统以充当“虚拟医生”。这些“虚拟医生”旨在通过自然对话与患者互动,询问患者的医疗状况和病史,并提供临床建议。他们还可以主动与患者联系,询问患者病情的进展并及时提供干预措施。

        为了建立医疗对话系统,需要大量患者和医生之间的对话作为训练数据。由于数据隐私问题,此类数据难以获取。为了解决现有数据集的局限性,我们构建MedDialog,数据集几乎涵盖了从内科到家庭医学的所有医学专业,涵盖了广泛的疾病,包括癌症、肺炎等。据我们所知,它们是迄今为止最大的中英文医学对话数据集。

        每次咨询都以描述医疗状况和病史开始,然后是医生和患者之间的对话。在某些会诊中,医生会做出诊断结论并给出治疗建议。对话有多个轮回。

       我们在中文 MedDialog 数据集上预训练了几个对话生成模型,包括 Transformer、BERT-GPT 和 GPT,

        BERT-GPT是一种预训练模型,其中编码器使用 BERT 进行预训练,解码器使用 GPT进行预训练。 GPT  是一种基于 Transformer 解码器的预训练语言模型。

        如果直接在小规模数据集上训练大型神经模型,则该数据集的小尺寸会导致过度拟合的高风险。为了减轻这种风险,我们采用在大规模数据集上预训练的对话生成模型的权重,然后再应用到小规模数据集上,效果也很好。

第 2 节和第 3 节介绍了数据集和对话生成模型(DGM)。第 4 节给出了在 Chinese MedDialog 上开发 DGM 的实验结果,并研究了在 MedDialog-CN 上训练的 DGM 对其他低资源医学对话生成任务的可迁移性。第 5 节回顾了相关工作,第 6 节总结了论文。

在训练期间,给定一个包含患者和医生之间交替话语序列的对话,我们将其处理成一组对 {(si, ti)},其中目标 ti 是来自医生的响应,源 si 是连接ti 之前的所有话语(来自患者和医生)。 

建模(略)

预训练 

         在 MedDialog-CN 数据集上训练 Transformer 和 GPT 之前,我们可以先在比 MedDialog-CN 大得多的通用域文本数据集上对它们进行预训练,以获得权重参数的良好初始化。

 Experiments

首先,BERT-GPT 实现了比 Transformer 更低的困惑度。这是因为 BERT-GPT 在大量语料库上进行了预训练,然后在 MedDialog-CN 上进行了微调。预训练使模型能够更好地捕捉单词之间的语言结构,从而降低困惑度。GPT的perplexity最高。

其次,在 NIST-4、BLEU-2、BLEU-4 和 METEOR 等机器翻译指标上,BERT-GPT 的表现比 Transformer 差。

模型的示例

Conclusions and Future Works

         我们在 MedDialog-CN 上预训练 Transformer、GPT 和 BERT-GPT。结果表明,这些预训练模型生成的对话具有临床意义且类似于人类。我们使用迁移学习将这些预训练模型应用于低资源对话生成。在数据集较小的 COVID19 对话生成任务中,人工评估和自动评估表明,在 MedDialog-CN 上预训练的模型可以有效提高生成响应的质量。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读论文(五)MedDialog【参考性大】【可复现】 的相关文章

  • SpringBoot八种bean的加载方式

    目录 第一种bean的加载方式 配置文件 第二种加载bean方式 注解和扫描 创建第三方的bean对象 第三种加载bean方式 不使用配置文件 扩展 bean的加载方式扩展FactoryBean lt gt 扩展 ImportResourc
  • Python:实现多个txt文本的简单合并,亲测简单好用,保姆教程

    声明 非原创 我是python废废 原博客连接为 Python批量合并多个txt文件 自由的小白的博客 CSDN博客 python 合并多个txt 我在这里只做分享 好博客要更多人看到嘛 一 成果展示 我希望实现简单的txt文本合并 合并前
  • windows下apache开启FastCGI

    1 在此链接下载一个合适的mod fcgid 文件 64位下载第一个 32位第二个 http www apachelounge com download 2 将解压后将文件中的 mod fcgid so 复制到apache的modules目
  • 【python总结】python学习框架梳理

    目录 基础 注释与变量名等基本规则 关键字 操作符 数字 流程控制 序列 文本序列 字符串 二进制序列 字节 列表 元组 映射 字典 集合 函数 面向对象编程 错误和异常 模块 数据结构与算法 数组 字符串 链表 二分查找 排序 栈 队列
  • IDEA中Translation插件无法使用怎么办?

    昨天一个小偷 来我家偷钱 我们一起找了一晚上 问题 谷歌翻译退出中国了 导致我的 IDEA 翻译插件 Translation 也不能用了 会出现这样的错误 更新 TKK 失败 请检查网络连接 解决办法 使用百度翻译 很多翻译都收费 百度翻译
  • 树莓派安装卸载软件命令apt-get

    apt get命令用法 1 安装软件 apt get install 软件名 2 卸载软件但不删除配置 apt get remove 软件名 3 卸载软件并且删除相关配置 apt get purge 软件名 4 更新数据库 apt get
  • Ubuntu操作遇到的报错解决方法汇总(持续更新)

    1 在anaconda中创建了虚拟环境并安装了pytorch 但是编译过程中仍然报没有torch的错误 CMake Error at crawler crane crane tutorials CMakeLists txt 23 find
  • Kibana在Centos上开机启动

    1 需要下载kibana 去官网下 2 解压到自己指定的目录下 我是放到了 usr local下 3 执行 vi usr lib systemd system kibana service 插入下面内容 Unit Description k
  • 先电2.4版本iaas搭建部分(vm中模拟,比赛使用服务器)

    改革 由于2020年云计算改革由团队比赛变成个人比赛 原本由三个人 iaas和pass bigdata 云应用开发都变成一个人 所有脚本都在 usr local bin 今天刚拿到镜像和文档 先进行搭建 预先准备 配置两个网卡的ip 一共两
  • vs2019+QT5.12.0打不开现有文件,提示This application failed to start because no Qt platform plugin问题

    按照要求配置好vs2019和QT5 12 0后 qt addin插件仍然不能使用 已经尝试更换了2 8 0 2 6 0 2 5 0版本的qt development releases vsaddin 仍旧报错 出现以下问题 后来找方法 在电
  • IDEA2021中VUE代码爆红解决方案

    1 在IDEA中安装vue js插件 找到vue js安装即可 之后点击apply gt OK 2 安装完成后打开cmd 输入npm v npm命令集成在node js里面 如果这条命令失败则前往node js进行相关的安装 3 爆红的主要
  • 小白的成长轨迹(二):披荆斩棘,未来可期

    大家好 我是孤焰 一名双非本科的大四学生 又是一年的1024 我坚持撰写博客已经为期一年 很感谢大家一直以来的支持 在这一年期间这位名为 孤焰 的少年又有哪些成长呢 下面便请细听分说 希望这些成长经历可以对正在看这篇文章的小可爱们有一些帮助
  • 计算机网络体系结构 - 运输层

    一 运输层协议概述 运输层为应用进程之间提供端到端的逻辑通信 二 运输层的端口 端口 port 也称为协议端口号 protocol port number 对上层的应用进程进行标识 端口用一个16位端口号进行标志 端口号只具有本地意义 端口
  • 5V转±12V无变压器双boost电路

    最近有个新项目 需要 10V范围的模拟量输出 非隔离 对于5V以下供电的控制板而言单端输出绝对没问题 可现在需要有正负输出 是少不了正负电源的 因此准备设计一个5V转 12V的电源 然后选择一个双向供电的运放 来实现单端模拟量信号向双向模拟
  • 什么是protocol分层,垂直service??计算机网络详解【计算机网络养成】

    内容导航 分组丢失和延时 发生原因 四种分组延时 节点处理延迟 排队延迟 传输延时 Transmission 传播延时 Propagation 使用cmd命令tracert 和 tracerert 来检查延迟 分组丢失 吞吐量 有效的数据量
  • 一步步实现扫雷

    扫雷 首先去建立三个文件 头文件 game h 用于存放每个函数的声明 源文件1 game c 用于放置每个函数的定义 源文件2 test c 用于实现扫雷的整体逻辑 关于扫雷的实现 首先需要定义棋盘 这里我们实现9 9的棋盘 但是面对用户
  • DES加密算法详解——看这一篇就够了!

    目录 一 DES简介 二 DES算法入参 三 DES加密算法步骤解析 1 IP置换 M gt M0 2 密钥K控制的16轮运算 M0 K1 K16 gt M16 2 1 子密钥Kn的计算 2 1 1 PC 1置换 2 1 2 循环左移运算
  • 运行游戏找不到x3daudio1_7.dll怎么解决?教你如何快速修复的教程

    在计算机使用过程中 我们经常会遇到一些错误提示 其中之一就是 x3daudio1 7 dll丢失 这个错误提示可能让我们感到困惑和烦恼 但是不用担心 本文将为您介绍x3daudio1 7 dll丢失的原因以及五种修复方法 帮助您解决这个问题
  • 【网安入门】怎样花3个月零基础入门网络安全?

    写这篇教程的初衷是很多朋友都想了解如何入门 转行网络安全 实现自己的 黑客梦 文章的宗旨是 1 指出一些自学的误区 2 提供客观可行的学习表 3 推荐我认为适合小白学习的资源 大佬绕道哈 一 自学网络安全学习的误区和陷阱 1 不要试图先成为
  • 精品Nodejs实现的“音乐盒”小程序的设计与实现-音乐播放器歌曲

    含文档 PPT 源码等 精品Nodejs实现的 音乐盒 小程序的设计与实现 包运行成功 该项目含有源码 文档 PPT 配套开发软件 软件安装教程 项目发布教程 包运行成功 软件开发环境及开发工具 操作系统 Windows 10 Window

随机推荐

  • 构造方法私有化

    1 单例设计模式 Singleton 在正常情况下 如果有一个类 那么只有通过产生对象之后才可以操作这个类范例 观察如下代码 class Singleton public void print System out println Hell
  • Web3的未来:7 个潜在的亿级机会

    Web3的未来将不仅仅是PFP的jpegs NFT市场 CEXs DEXs和DeFi协议 为了使Web3成为主流 有许多工具可以围绕一个繁荣的生态系统来构建 这里有7个隐藏的web3亿美元的机会 当下就开始建设 1 钱包整合生态系统 Web
  • 随机生User-Agent代理Ip

    import random import urllib request def url url p 49 235 246 24 8118 proxy support urllib request ProxyHandler http p op
  • opencv2 无法加载RTSP的问题

    最近通过OPENCV3 2 0加载海康摄像头 实现后续的摄像头画面拼接 但是发现拷贝了所有的opencv2的dll文件 仍然无法成功加载rtsp视频流 假设是视频流无法获取 通过VLC工具拉流 可以成功 效果如下 后来试了很多其他办法 感觉
  • linux卸载内核

    查看所安装的所有内核 ls boot 在删除旧内核之前 记住最好留有2个最近的内核 最新的和上一个版本 以防主要的版本出错 现在就让我们看看如何在Ubuntu上清理旧内核 在Ubuntu内核镜像包含了以下的包 linux image 内核镜
  • 【python实现华为OD机试真题】优雅子数组【2023 Q1

    题目描述 如果一个数组Q中出现次数最多的元素出现大于等于K次 被称为k 优雅数组 k也可以被称为优雅阈值只 例如 数组1 2 3 1 2 3 1 它是一个3 优雅数组 因为元素1出现次数大于等于3次 数组 1 2 3 1 2 就不是一一个3
  • UE4 跑酷游戏-得分机制

    得分机制 1 这次我们要做的是得分 根据人物跑过的地板来得取分数 首先进入我们的第三人称游戏模式里面 创建一些变量 2 退出第三人称游戏模式后 进入主地板蓝图后 在销毁地板之前写读取人物跑i过地板块数进行得分
  • Unity 使用Photon Server 联网开发(一)配置连接设置流程

    Photon官网首页 Photon官网 下载配置Pun与Server的教程 Photon Pun与Server的下载与配置教程 1 Pun导入项目后配置PhotonServerSettings Hosting 服务器托管方式 Not Set
  • Date 日期时间 浅层研究

    Date 日期时间 浅层研究 若需查看所有函数及属性常量 请直接翻至尾部 文章目录 Date 日期时间 浅层研究 获取当前时间 奇怪玩法 Date System Calendar 奇怪的问题探究区 查看此资料之前我们需要了解下 native
  • 论文阅读:FMCW雷达生命体征监测(心跳监测)

    论文 基于连续波雷达的非接触式生命体征监测系统设计与实现 1 雷达种类及特点 用于非接触式测量的雷达种类主要有脉冲雷达和连续波雷达两类 脉冲雷达根据发射脉冲与接收脉冲的时间差来计算所测量对象的实际距离 脉冲雷达需要将窄脉冲持续地发出 其优点
  • QVector 容器

    QVector 容器 QVector在相邻的内存中存储给定数据类型T的一组数据 在QVector前部或中间位置插入操作速度都很慢 因会导致内存中大量的数据移动 访问数据可使用下标 也可使用迭代器 继承自QVector类的子类有QPolygo
  • 如何运行后缀名为.ipynb的文件

    打开cmd 输入 pip install jupyter notebook 安装截图 下载之后 输入 jupyter notebook 之后浏览器会弹出一个页面 如图 然后就可以打开电脑里的文件 如图 也可以选择upload你的文件 打开i
  • Android 下拉刷新实践

    1 手动实现一个下拉刷新功能 2 效果图 3 view结构 4 实现思路
  • linux系统调用线程

    1 基础概念 早期unix系统中 没有线程概念 后来才引入线程 linxu 为了迎合 windows引入了线程 linux 上进程是非常优秀了 linux 上用线程和进程的区别不大 老程序都是用进程 gdb不支持线程 因为gdb比线程出现了
  • net core 下的图形验证码

    首先 通过 Nuget 安装 dotnet add package Lazy Captcha Core 注册服务 默认使用了内存存储 AddDistributedMemoryCache builder Services AddCaptcha
  • 什么是IDP?---What Is an Internal Developer Platform (IDP)?

    The modern approach to software delivery is based on cloud native services and the DevOps culture entailing software dev
  • 项目-天气邮局

    一 项目背景 http协议被广泛使用 从移动端 pc端浏览器 http协议无疑是打开互联网应用窗口的重要协议 http在网络应用层中的地位不可撼动 是能准确区分前后台的重要协议 在学习完网络的有关知识后 HTTP服务器无疑是巩固及应用所学知
  • 怎么用linux查看xml文件格式,xml是什么格式?xml文件格式用什么软件可以打开

    xml是什么格式 xml文件是很多用户在电脑上看见过了 很多小伙伴看到了xml格式的文件都不知道这个是什么东东 其实这个xml也是一种比较有用的文件 可以用来存储软件数据 不过不是所有的软件都可以打开的 下面智能手机网就来科普一下xml是什
  • 各种虚拟机体验杂谈 --- 兼发布 google chrome os (chromiumos) vmware版本

    前两天赶时髦 把笔记本换上了win8 pro 换win8pro的原因 一个是价格真的很有诚意 另一个就是从DP版本开始就一直用 虽然兼容性问题多多 但作为宿主主机还行 而且xenclient也实在是让人窝火 号称裸机虚拟 其实硬盘速度慢如蜗
  • 读论文(五)MedDialog【参考性大】【可复现】

    Abstract 医疗对话系统有望帮助远程医疗增加医疗保健服务的可及性 提高患者护理质量并降低医疗成本 为促进医学对话系统的研发 我们构建了大规模的医学对话数据集 MedDialog 其中包含中文数据集340万条医患对话 英文数据集120条