1. 基于MIMIC-3数据库的心衰患者诊断与再入院模型研究
1.1 文献来源
1.2 摘要
- 背景:利用深度学习去大规模的分析电子健康记录数据仍具有极大的挑战;基于大量医学文本,及时识别心力衰竭患者并建立再入院预测模型,可以使临床医生采取正确的治疗从而防止患者病情恶化、减轻患者费用负担。
- 内容:
1.3 数据提取与实验预处理
1.3.1 数据提取
1.3.2 数据预处理
- 心衰诊断实验的预处理:
- 再入院实验的预处理(不平衡)
- 预处理前期先进行采样平衡类别分布,分别对30天内是否再入院、30天后是否再入院进行采样处理
1.3.3 训练集和测试集的划分
- 心衰诊断实验中,训练集和测试集的划分按照7:3的比例,即前70%作为训练集,剩下30%作为测试集。
- 心力衰竭患者再入院预测实验中,需要分出三个类别;本文将训练集和测试集的划分按照8:2的比例,即前80%作为训练集,剩下20%作为测试集。
1.4 基于KTI-RNN模型的心衰患者诊断预测
- 利用MIMIC-3数据库中的数据进行心力衰竭患者的诊断研究,建立KTI-RNN模型,分别使用LDA模型和TF-IDF模型从心衰文本中提取主题词集和关键词集,再使用改进的分类器进行心力衰竭疾病的诊断。【主题词到分类器这个步骤会是什么样子的】
1.5 基于 M-BERT 模型的心衰患者再入院预测
- 通过MIMIC-3数据库提取心衰临床笔记数据,即出院总结记录,进行数据预处理,然后使用M-BERT进行模型训练,最终对心衰患者30天再入院做出预测。
1.6 总结与展望
- 总结:针对心衰患者诊断研究中,本文初步尝试了提取医学文本中的关键词集和主题词集,并在改进的 BiRNN 模型基础上,对心力衰竭患者进行有效分类和诊断。针对心衰患者的再入院预测研究中,本文使用改进的 BERT 模型进行分析和讨论,最终获得很好的分类效果,从而有效判断出心衰患者是不再入院、30 天内再入院还是 30 天后再入院。
- 展望:
- 思考:异构数据如何结合+可否多病种+其他不平衡策略
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)