【文献调研】再入院预测（1）

2023-11-09

1. 基于MIMIC-3数据库的心衰患者诊断与再入院模型研究

1.1 文献来源

太原理工大学 2022年6月

1.2 摘要

背景：利用深度学习去大规模的分析电子健康记录数据仍具有极大的挑战；基于大量医学文本，及时识别心力衰竭患者并建立再入院预测模型，可以使临床医生采取正确的治疗从而防止患者病情恶化、减轻患者费用负担。
内容：
- 数据：利用MIMIC-3公开数据库的非结构化数据（会包含历史疾病、家族疾病等更为丰富的患者信息，同时存在口语化词汇多，内容稀疏等问题）进行心衰疾病诊断和再入院预测的研究。
- 方法：以非结构化数据为实验支撑，搭建深度学习模型，对心衰患者进行诊断研究并进一步判断心衰患者的再入院情况，从而使心衰患者的治疗过程更加及时高效。
- 具体内容：数据预处理（根据心力衰竭病种和入院时间确定类标签）+基于文本数据进行患者识别/分类（文本特征具体是如何处理的）+使用M-BERT模型对患者再入院进行预测，在BERT模型的embedding上加入对抗训练FGM模型。

1.3 数据提取与实验预处理

1.3.1 数据提取

数据提取过程图

筛选心衰患者、心肌梗死患者和高血压患者：
- 25种心衰，10270位心衰患者+23种心肌梗死，4464位心肌梗死患者+19种高血压，17644位高血压患者
- 既然要做心衰患者的话，为什么要选择其他两个病种的患者呢？
筛选心衰患者中符合再入院情况的患者：
- 利用第二次入院的入院记录所对应的时间减去第一次入院的出院记录所对应的时间，获得两次入院的时间差。
Q：能不能做多病种呢？识别多种疾病（多输出或者二分类变为多分类），去查查多病种患者识别！

1.3.2 数据预处理

心衰诊断实验的预处理：
- 医学文本出院摘要-文本预处理
- 去除非文本部分+分词+去除停用词+词干化+文本大小写转换
再入院实验的预处理（不平衡）
预处理前期先进行采样平衡类别分布，分别对30天内是否再入院、30天后是否再入院进行采样处理

1.3.3 训练集和测试集的划分

心衰诊断实验中，训练集和测试集的划分按照7:3的比例，即前70%作为训练集，剩下30%作为测试集。
心力衰竭患者再入院预测实验中，需要分出三个类别；本文将训练集和测试集的划分按照8:2的比例，即前80%作为训练集，剩下20%作为测试集。

1.4 基于KTI-RNN模型的心衰患者诊断预测

KTI-RNN

利用MIMIC-3数据库中的数据进行心力衰竭患者的诊断研究，建立KTI-RNN模型，分别使用LDA模型和TF-IDF模型从心衰文本中提取主题词集和关键词集，再使用改进的分类器进行心力衰竭疾病的诊断。【主题词到分类器这个步骤会是什么样子的】

1.5 基于 M-BERT 模型的心衰患者再入院预测

总体框架图

通过MIMIC-3数据库提取心衰临床笔记数据，即出院总结记录，进行数据预处理，然后使用M-BERT进行模型训练，最终对心衰患者30天再入院做出预测。

1.6 总结与展望

总结：针对心衰患者诊断研究中，本文初步尝试了提取医学文本中的关键词集和主题词集，并在改进的 BiRNN 模型基础上，对心力衰竭患者进行有效分类和诊断。针对心衰患者的再入院预测研究中，本文使用改进的 BERT 模型进行分析和讨论，最终获得很好的分类效果，从而有效判断出心衰患者是不再入院、30 天内再入院还是 30 天后再入院。
展望：
- 尝试在提取 MIMIC-III 数据库数据，结合医生对于临床数据的认知与策略；
- 目前使用的数据较为单一，仅仅是非结构化数据，尝试将结构化数据和非结构化数据结合起来；
- 本文的工作是多分类，之后会尝试使用本文模型进行多个二分类的研究探讨；
- 在原有数据的基础上，尝试完善数据不平衡问题的研究或者其他模型的改进，试着讨论是否可以进一步提高心衰患者再入院的预测性能。
思考：异构数据如何结合+可否多病种+其他不平衡策略

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Literature reading

人工智能

深度学习

机器学习

【文献调研】再入院预测（1）的相关文章

蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
用CHAT写一份标题为职业教育教师教学能力提升培训总结

CHAT回复标题职业教育教师教学能力提升培训总结一活动概述本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行来自全校的60位职业教育教师参与了此次培训主讲人为享有盛名的教育专家马丁先生二培训内容与
基于opencv的大米计数统计（详细处理流程＋代码）

在我每周的标准作业清单中有一项是编写计算机视觉算法来计算该图像中米粒的数量因此当我的一个好朋友M给我发了一张纸上的扁豆照片显然是受到上述转发的启发请我帮他数一下谷物的数量时它勾起了我怀旧的回忆因此我在我的旧硬盘上寻找很久以前
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
CorelDRAW2024官方中文版重磅发布更新

35年专注于矢量设计始于1988年并不断推陈出新致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
5_机械臂运动学基础_矩阵

上次说的向量空间是为矩阵服务的 1 学科回顾从科技实践中来的数学问题无非分为两类一类是线性问题一类是非线性问题线性问题是研究最久理论最完善的而非线性问题则可以在一定基础上转化为线性问题求解线性变换数域 F 上线性空间V中的变
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating

随机推荐

vm manager failed to contact configuration server

当用virt manager命令启动VM 管理工具是报错 vm manager failed to contact configuration server 如下办法解决了我的问题读取dbus uuid dbus uuidgen get
花费7元训练自己的GPT 2模型

在上一篇博客中我介绍了用Tensorflow来重现GPT 1的模型和训练的过程这次我打算用Pytorch来重现GPT 2的模型并从头进行训练 GPT 2的模型相比GPT 1的改进并不多主要在以下方面 1 GPT 2把layer nor
Gensim 中 word2vec 模型的恢复训练：载入存储模型并继续训练

Gensim 中 word2vec 模型的恢复训练本文为系列文章之一前面的几篇请点击链接 NLP 利器 gensim 库基本特性介绍和安装方式 NLP 利器 Gensim 库的使用之 Word2Vec 模型案例演示 NLP 利器 Gen
数据挖掘概述

目录 1 数据挖掘概述 2 数据挖掘常用库 3 模型介绍 3 1 分类 3 2 聚类 3 3 回归 3 4 关联 3 5 模型集成 4 模型评估 ROC 曲线 5 模型应用 1 数据挖掘概述数据挖掘寻找数据中隐含的知识并用于产生商业价值
无基础学c语言的打卡日记总论

背景知识笨人浙江考生选课是政史地目前在读大一知道自己的专业学c并且还学数学分析和高等代数一开始不以为意学校用的教材是谭浩强老师的c语言程序设计推荐的小白友好上课之前有很认真的自习课本第一章好像是一个总论里面有一些思想以
在NPU上的切片操作x=x[:,::-1,:,:]不生效的分析解决

1 系统环境硬件环境 Ascend GPU CPU Ascend GPU MindSpore版本 1 9 0 执行模式 PyNative Graph 不限 Python版本 3 7 5 操作系统平台 Linux 2 报错信息 2 1 问题
winform下mapxtreme2008 v7.0 生成release版提示找不到dll问题

在winform下基于mapxtreme2008 v7 0 生成了一个地图软件用debug方式运行无误但改为release版时提示缺少一大堆dll 如无法从C Program Files x86 Common Files MapInf
本地网站域名与联网冲突吐槽篇

提示前面是吐槽360使用bug 以及网站开发者使用弊端解决冲突主要方法在后面前言是解决电脑无法保存修改的hosts文件真相以及解决棒法处理不行的话只能一棒打死安全软件前言电脑里安装了360之类的安全软件安全类软件为了安全往
时序预测

时序预测 MATLAB实现时间序列回归之评估模型残差及统计分布目录时序预测 MATLAB实现时间序列回归之评估模型残差及统计分布基本介绍程序设计异方差性统计分布学习总结参考资料致谢基本介绍残差分析的基本目的是检查 CL
偷懒的一天-------Day83

今天实在是学不进去从公司里工作着也是浑浑噩噩的虽然不是我媳妇生孩子但这也是我们这个大家庭里的第一个孩子我的亲大侄子啊当然还可能是侄女还在想名字都想了好多了还是有些激动有些紧张啊偷懒一天来码上几个字草草写上至少我也知道我
Opencv的基础操作

一图像填充首先定义图像显示函数 def cv show name img cv2 imshow name img cv2 waitKey 0 cv2 destroyAllWindows 图像读取 img cat cv2 imread c
一定能让你理解的素数筛法——埃氏筛法和欧式筛法

先上代码埃氏筛法 include
卸载Docker方法

卸载步骤在安装Autoware库的时候安装了Docker 发现电脑硬盘容量被占用不少现在想卸载一下docker 查找了很多资料最终使用以下方法完整卸载 1 在配置autoware的时候其实安装的docker ce 所以需要执行 sud
Nginx基本使用

一 Nginx作用 1 HTTP服务器 2 反向代理 3 负载均衡 4 正向代理 5 虚拟主机等二 Nginx安装 1 下载nginx最新稳定版 windows nginx 1 14 0 2 解压备注如上图配置关键配置文件后双击
基于tensorflow实现手写数字识别

实验目的了解机器学习的相关知识实现基于tensorflow的手写数字识别实验环境 ubuntu16 04 或 windows python 3 默认安装版本 tensorflow 2 0 版本以上或其他深度学习框架实验内容实现基
内网穿透-Natapp实现免费远程桌面

很多人都在使用Teamviewer访问远程桌面但收费很贵而且经常有一些安全漏洞下面教大家一个免费安全的远程桌面方法打开Natapp主页 https natapp cn 点击立即下载按钮下载操作系统匹配的客户端下载之后解压至
可能是史上最全的Kubernetes证书解析

为了避免广告法题目还是加个可能吧想要安全就必须复杂起来证书是少不了的在Kubernetes中提供了非常丰富的证书类型满足各种不同场景的需求今天我们就来看一看Kubernetes中的证书 k8s证书分类在说证书之前先想想作为集
Shiro简单配置Springboot版（1）

1 权限的管理 1 1 什么是权限管理基本上涉及到用户参与的系统都要进行权限管理权限管理属于系统安全的范畴权限管理实现对用户访问系统的控制按照安全规则或者安全策略控制用户可以访问而且只能访问自己被授权的资源权限管理包括用户身份认证
【论文速递】CCDC2021 - 轻量级网络的结构化注意知识蒸馏

论文速递 CCDC2021 轻量级网络的结构化注意知识蒸馏论文原文 Structured Attention Knowledge Distillation for Lightweight Networks 获取地址 https ieeex
【文献调研】再入院预测（1）

1 基于MIMIC 3数据库的心衰患者诊断与再入院模型研究 1 1 文献来源太原理工大学 2022年6月 1 2 摘要背景利用深度学习去大规模的分析电子健康记录数据仍具有极大的挑战基于大量医学文本及时识别心力衰竭患者并建立再入院预

【文献调研】再入院预测（1）

1. 基于MIMIC-3数据库的心衰患者诊断与再入院模型研究

1.1 文献来源

1.2 摘要

1.3 数据提取与实验预处理

1.3.1 数据提取

1.3.2 数据预处理

1.3.3 训练集和测试集的划分

1.4 基于KTI-RNN模型的心衰患者诊断预测

1.5 基于 M-BERT 模型的心衰患者再入院预测

1.6 总结与展望

【文献调研】再入院预测（1） 的相关文章

随机推荐

热门标签

【文献调研】再入院预测（1）的相关文章