100+医学影像数据集集锦

2023-10-28

100+医学影像数据集集锦

linhandev

于 2021-11-06 18:41:38 发布

4654
收藏 97
文章标签: 深度学习 计算机视觉 python 图像处理 机器学习
版权
医学影像数据集集锦
前言
本项目的目标是整理一个医学影像方向数据集的列表,提供每个数据集的基本信息,并对其中License允许的提供不限速下载。项目按照数据集关注的器官对其进行分类。需要整理的数据集很多,我们十分期待大佬们为项目作出贡献。

如果您发现项目已有的内容中有任何错误(包括但不限于md格式问题,网址失效,数据错误,简介信息补充等),可以通过Pull/Request进行修正。
如果您想用的数据集没有出现在列表中,请按照模板提交Issue,并尽量详细地描述数据集信息。我们会尽快添加,若License允许可以免费代下。
当前共收录约 20 个方向的 100+ 个数据集

PS:平时不看CSDN消息,任何问题烦请提个Issue或在我的博客文章下方评论。

转载请联系项目维护者:me@linhan.email

目录

肝脏
LiTS
Sliver07
3D-IRCADB
CHAOS
TCGA-LIHC
MSD肝脏血管分割

MSD肺癌分割
LoLa11肺叶分割
StructSeg2019
肺部多病智能诊断
CheXpert
NIHChest Xray
QIN Lung CT
4D-Lung
NSCLC-Radiomics
vessel12 肺部血管分割
肺结核
Shenzhen Hospital X-ray Set
Montgomery County X-ray Set
肺炎
Ieee8023
covid19-ct-scans
COVID-CT
Figure1-COVID-chestxray-dataset
RSNA肺炎检测
CovidX
Flyai Covid
covid19-radiography-database
COVID-19-AR
CT Images in COVID-19
肺结节
LIDC-IDRI
LUNA16
天池肺部结节
LNDB
Lung Nodule Malignancy
Data Science Bowl 17
Lung-PET-CT-Dx
气胸
SIIM-ACR Pneumothorax Segmentation

CBIS-DDSM
QIN Breast
Rider Breast MRI
ACRIN 6688
BraTS2015

MSD脑瘤分割
MSD海马体分割
Iseg2019
ABIDE
ADNI
CQ500
脑出血
RSNA Intracranial Hemorrhage Detection
肾脏
Kits19

CT COLONOGRAPHY
MSD肠道分割数据集
心脏
EchoNet
MMWHS
MSD心脏分割
主动脉
冠状动脉分割
眼睛
DRIVE
ODIR-5k
FIRE 视网膜图像数据
STARE
CHASE_DB1
IDRiD
细胞
Data Science Bowl 18
血细胞涂片分类
ISBI细胞跟踪
骨骼
MURA-1.1
RSNA Bone Age
磁共振图像脊柱结构多类别三维自动分割
膝盖
MRNet
脊椎
Verse大规模脊椎分割数据集
前列腺
PANDA
MSD前列腺分割
QIN-PROSTATE-Repeatability
胰腺
MSD胰腺分割
PDMR-833975-119-R
皮肤
SIIM-ISIC Melanoma Classification
VQA
PathVQA
内窥镜
SARAS-MESAD
SARAS-MESAD
医学影像数据库
参考项目/列表
贡献者
Release Note
肝脏
LiTS
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
LiTS 肝脏/肝脏肿瘤 分割 CT 131+70 0/1标签 nii CC 4.0

LiTS数据集包含131套训练扫描和70组测试数据,其中70组测试数据标签不公开。LiTS训练集中包含3DIRCADB中的所有数据,所以如果合并多个数据集不要合并这两个。Medical Segmentation Decathlon中肝脏分割的数据集就是LiTS。

分割结果可以在线提交进行评估,在线提交方法参考。 在线提交地址

数据集论文:The Liver Tumor Segmentation Benchmark (LiTS)

相关项目: 基于Paddle的肝脏CT影像分割

Aistudio下载

Sliver07
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
Sliver07 肝脏 分割 CT 20+10 0/1标签 MetaImage Other

这个数据集比较老了,现在用的也比较少,一些研究会将sliver和lits合起来,这样基本上就是所有常用的关于肝脏分割的公开数据了。mhd格式可以用 SimpleITK 读,在medseg项目中有转换成nii的脚本

Aistudio下载

3D-IRCADB
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
3D-IRCADb 01 02 肝脏/肝肿瘤 分割 CT 20+2 surface mesh dcm CC

3D-IRCADb是比较早的一个数据集,有两个子集,分别包含20组和2组CT片子。

Aistudio下载

CHAOS
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
CHAOS 肝/肾/脾 分割 CT+MRI 40CT+120MRI 0/1标签 dcm CC 4.0
CHAOS是一个多脏器,多模态分割数据集。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ML21YiIl-1636195013833)(https://raw.githubusercontent.com/linhandev/dataset/main/static/chaos.png)]

Aistudio下载

TCGA-LIHC
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
TCGA-LIHC 肝 CT/MR/PT 97患者/237套 无标签 dcm Other
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Sr35CLBK-1636195013837)(https://raw.githubusercontent.com/linhandev/dataset/main/static/tcga-lihc.jpg)]

Aistudio下载

MSD肝脏血管分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD肝脏血管分割 肝脏血管 分割 CT 443 0/1 nii CC-BY-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nNojbcKa-1636195013847)(https://raw.githubusercontent.com/linhandev/dataset/main/static/Hepatic-Vessels.png)]

Aistudio下载


MSD肺癌分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD肺癌分割 肺脏 分割 CT 96 0/1 nii CC-BY-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yn7hWlPm-1636195013850)(https://raw.githubusercontent.com/linhandev/dataset/main/static/Lung-Tumours.png)]

Aistudio下载

LoLa11肺叶分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
LoLa11 None 分割 CT 55 None Metaimage Other
lola11

LoLa11 包含55套CT数据,未发现任何公开标注信息

zenodo下载

StructSeg2019
名称 标注内容 类型 模态 数量 标签格式 文件格式
StructSeg2019
structseg2019

肺部多病智能诊断
名称 标注内容 类型 模态 数量 标签格式 文件格式
肺部多病智能诊断 CT
CheXpert
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
CheXpert Other
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-duTwLsh1-1636195013855)(https://raw.githubusercontent.com/linhandev/dataset/main/static/chest-x-pert.png)]

介绍论文: CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison

相关项目

NIHChest Xray
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
NIHChest Xray 14种肺部疾病/部分病灶位置 分类/检测 CXR 112,120 csv png CC0: Public Domain
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yZ51mSFM-1636195013856)(https://raw.githubusercontent.com/linhandev/dataset/main/static/nih-chest-xray.png)]
介绍论文: ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases

Aistudio下载

QIN Lung CT
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
QIN Lung CT 非小細胞癌 CT 47 dcm Other
Aistudio下载

4D-Lung
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
4D-Lung 非小細胞癌 CT 20 dcm Other
Aistudio下载

NSCLC-Radiomics
名称 标注内容 类型 模态 数量 标签格式 文件格式
NSCLC-Radiomics 非小细胞癌 分割 CT 422 dcm
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GcJ6ahL0-1636195013857)(https://raw.githubusercontent.com/linhandev/dataset/main/static/NSCLC-Radiomics.png)]

Aistudio下载

vessel12 肺部血管分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
vessel12 肺部血管分割 肺部血管 分割 CT 20 raw
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AB33diWL-1636195013858)(https://grand-challenge-public-prod.s3.amazonaws.com/b/1/header.x15.jpeg)]

Aistudio下载

肺结核
Shenzhen Hospital X-ray Set
名称 标注内容 类型 模态 数量 标签格式 文件格式
Shenzhen Hospital X-ray Set 肺结核/正常 分类 CXR 662 类别 图片
深圳第三医院收集的肺结核胸透数据集,包含326张正常扫描和336张不正常的扫描。

Aistudio下载

Montgomery County X-ray Set
名称 标注内容 类型 模态 数量 标签格式 文件格式
Montgomery County X-ray Set 肺结核/正常 分类 CXR 138 类别 图片
蒙哥马利市收集的肺结核胸透数据集,包含80张正常的扫描和58张不正常的扫描。

Aistudio下载

肺炎
Ieee8023
名称 标注内容 类型 模态 数量 标签格式 文件格式
Ieee8023 肺脏 分类 CT 20 nii
持续搜集公开的新冠CT扫描,目前有20个病例。

Aistudio下载

covid19-ct-scans
名称 标注内容 类型 模态 数量 标签格式 文件格式
covid19-ct-scans 左右肺/新冠感染 分割 CT 20 nii
数据来自Ieee8023,对20组扫描进行了左右肺和感染区的标注。基于这个数据集和另外几个数据集,大佬们做了一个新冠分割的 benchmark

Aistudio下载

COVID-CT
名称 标注内容 类型 模态 数量 标签格式 文件格式
COVID-CT 分类 CT 349 图片
包含216名新冠患者的349张胸部CT图片,从相关paper中收集。

Aistudio下载

Figure1-COVID-chestxray-dataset
名称 标注内容 类型 模态 数量 标签格式 文件格式
Figure1-COVID-chestxray-dataset 分类 CXR 48 图片
DarwinAI收集的一些新冠CT的图片,是CovidX数据集的一部分。持续更新,使用前可以先pull。

Aistudio下载

RSNA肺炎检测
名称 标注内容 类型 模态 数量 标签格式 文件格式
RSNA肺炎检测 之否肺炎/肺炎区域BB 分类/检测 CXR 26684+3000 图片
RSNA是北美放射学会在Kaggle上组织的一个比赛数据集,数据来自NIH。包含26684张训练数据,有图片的分类和肺炎区域的边界框。

Aistudio下载

CovidX
名称 标注内容 类型 模态 数量 标签格式 文件格式
CovidX 新冠/其他肺炎/正常 分类 CT 13569+231 图片
CovidX数据集是DarwinAI训练CovidNet做的一个数据集,本身没有新的数据,是Ieee8023,Figure1和RSNA组合成的一个数据集。

Flyai Covid
名称 标注内容 类型 模态 数量 标签格式 文件格式
Flyai Covid
Flyai举办的一个新冠分类比赛。

Aistudio下载

covid19-radiography-database
名称 标注内容 类型 模态 数量 标签格式 文件格式
covid19-radiography-database 新冠/其他肺炎/正常 分类 CT 219+1314+1345 图片
跟CovidX一样是一个组合数据集,数据来自论文图片和RSNA。

Aistudio下载

COVID-19-AR
名称 标注内容 类型 模态 数量 标签格式 文件格式
COVID-19-AR dcm
Chest Imaging with Clinical and Genomic Correlates Representing a Rural COVID-19 Positive Population (COVID-19-AR)

Aistudio下载

CT Images in COVID-19
名称 标注内容 类型 模态 数量 标签格式 文件格式
CT Images in COVID-19 无标签 分类/分割 CT 650 无 nii
Aistudio下载

肺结节
LIDC-IDRI
名称 标注内容 类型 模态 数量 标签格式 文件格式
LIDC-IDRI 肺部肿瘤 目标检测 CT 1012 xls dcm
介绍论文: The Lung Image Database Consortium (LIDC) and Image Database Resource Initiative (IDRI): A Completed Reference Database of Lung Nodules on CT Scans

The public cancer radiology imaging collections of The Cancer Imaging Archive

Aistudio下载 Part1 Part2

LUNA16
名称 标注内容 类型 模态 数量 标签格式 文件格式
LUNA16
Aistudio下载

天池肺部结节
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
天池肺部结节 肺部结节 检测 低剂量肺部CT 1000(初赛) + 2000(复赛) 位置+直径 mhd Custom
LNDB
名称 标注内容 类型 模态 数量 标签格式 文件格式
LNDB 直径大于3mm的肿瘤分割标注/小于3mm肿瘤和非肿瘤标记中心 分割/分类 CT 294 XML MetaImage
介绍论文: LNDb: A Lung Nodule Database on Computed Tomography

Aistudio下载

Lung Nodule Malignancy
名称 标注内容 类型 模态 数量 标签格式 文件格式
Lung Nodule Malignancy 肺结界良恶性 分类 CT 4165+2526 tif
Aistudio下载

Data Science Bowl 17
名称 标注内容 类型 模态 数量 标签格式 文件格式
Data Science Bowl 17
Aistudio下载

Lung-PET-CT-Dx
名称 标注内容 类型 模态 数量 标签格式 文件格式
Lung-PET-CT-Dx 肺癌 目标检测 CT 363 xml dcm
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tRU10Ywx-1636195013860)(https://raw.githubusercontent.com/linhandev/dataset/main/static/Lung-PET-CT-Dx.png)]

气胸
SIIM-ACR Pneumothorax Segmentation
名称 标注内容 类型 模态 数量 标签格式 文件格式
SIIM-ACR Pneumothorax Segmentation

CBIS-DDSM
名称 标注内容 类型 模态 数量 标签格式 文件格式
CBIS-DDSM 正常/良性/恶性 分类 CT 2620
介绍论文: Deep Learning to Improve Breast Cancer Early Detection on Screening Mammography A curated mammography data set for use in computer-aided detection and diagnosis research

Aistudio下载

QIN Breast
名称 标注内容 类型 模态 数量 标签格式 文件格式
QIN Breast 0102 MRI 67
Aistudio下载

Rider Breast MRI
名称 标注内容 类型 模态 数量 标签格式 文件格式
Rider Breast MRI MRI
ACRIN 6688
名称 标注内容 类型 模态 数量 标签格式 文件格式
ACRIN 6688 CT 83
Aistudio下载

BraTS2013
名称 标注内容 类型 模态 数量 标签格式 文件格式
BraTS2013
BraTS2015
名称 标注内容 类型 模态 数量 标签格式 文件格式
BraTS2015
Aistudio下载

BraTS2021
名称 标注内容 类型 模态 数量 标签格式 文件格式
BraTS2015

MSD脑瘤分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD Brain Tumor Segmentation 胶质瘤/肿瘤/水肿 分割 MRI 484 Train + 266 Test 0/1 nii CC-BY-SA 4.0
msd-brain

Aistudio下载

MSD海马体分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD Hippocampus Segmentation 海马体 分割 MRI 394 0/1 nii CC-BY-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d4tph43w-1636195013862)(https://raw.githubusercontent.com/linhandev/dataset/main/static/msd-hippocampus.png)]

Aistudio下载

Iseg2019
名称 标注内容 类型 模态 数量 标签格式 文件格式
Iseg2019
ABIDE
名称 标注内容 类型 模态 数量 标签格式 文件格式
ABIDE 是否有自闭症 分类 MRI 539+573
自闭症患者的头部MRI扫描,包含539例自闭症患者和573个正常扫描对照组。 介绍论文: The autism brain imaging data exchange: towards a large-scale evaluation of the intrinsic brain architecture in autism.

下载地址

ADNI
名称 标注内容 类型 模态 数量 标签格式 文件格式
ADNI
介绍论文: Alzheimer’s Disease Neuroimaging Initiative (ADNI)

CQ500
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
CQ500 分割 CT 491组扫描 by-nc-sa 4.0
介绍论文:Development and Validation of Deep Learning Algorithms for Detection of Critical Findings in Head CT Scans

脑出血
RSNA Intracranial Hemorrhage Detection
名称 标注内容 类型 模态 数量 标签格式 文件格式
RSNA Intracranial Hemorrhage Detection CT
Aistudio下载

肾脏
Kits19
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
Kits19 肾脏/肾肿瘤 分割
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AE35434R-1636195013863)(https://raw.githubusercontent.com/linhandev/dataset/main/static/kits19.png)]

Aistudio下载


CT COLONOGRAPHY
名称 标注内容 类型 模态 数量 标签格式 文件格式
CT COLONOGRAPHY CT
包含没有结肠息肉,有6-9mm息肉和大于10mm息肉的数据。

MSD肠道分割数据集
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD肠道分割数据集 结肠癌原发病灶 分割 CT 126训练+64测试 CC-BY-SA 4.0
Aistudio下载

心脏
EchoNet
名称 标注内容 类型 模态 数量 标签格式 文件格式
EchoNet 心脏 分割 MRI 10300 0/1
介绍论文: EchoNet-Dynamic: a Large New Cardiac Motion Video Data Resource for Medical Machine Learning

MMWHS
名称 标注内容 类型 模态 数量 标签格式 文件格式
MMWHS 心脏 分割 CT / MRI 20CT、20MRI 类别 nii
mmwhs是心脏分割数据集,共有8类,MRI和CT两种模态 相关项目: Hybrid Loss Guided Convolutional Networks for Whole Heart Parsing

Aistudio下载

MSD心脏分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD心脏分割 左心房 分割 MRI 20(训练)+10(测试) CC-BY-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dV0EDM1c-1636195013864)(https://raw.githubusercontent.com/linhandev/dataset/main/static/mds-cardiac.png)]

Aistudio下载

主动脉
冠状动脉分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
Automated Segmentation of Coronary Arteries 冠状动脉 分割 CTA 40+20 Custom
Grand Challenge下载

眼睛
DRIVE
名称 标注内容 类型 模态 数量 标签格式 文件格式
DRIVE 眼底血管 分割 眼底照片 40 0/1 图片
DRIVE数据集是一个糖尿病病人眼底血管分割数据集。

Aistudio下载

ODIR-5k
名称 标注内容 类型 模态 数量 标签格式 文件格式
ODIR-5k 正常和7种疾病 分类 眼底彩色照片 5000 图片
ODIR-5K包括5000名患者的年龄,双眼的彩色眼底照片和医生的诊断关键词。该数据集是上工医疗技术有限公司从中国不同医院/医疗中心收集的“真实”患者信息。在这些机构中,眼底图像由市场上的各种相机捕获,例如Canon,Zeiss和Kowa,因此导致各种各样的图像分辨率。病人的识别信息会被移除。注释由经过培训的人类读者进行标记,并具有质量控制管理。患者分为8个标签,包括正常(N),糖尿病(D),青光眼(G),白内障(C),AMD(A),高血压(H),近视(M)和其他疾病/异常(O)。

FIRE 视网膜图像数据
名称 标注内容 类型 模态 数量 标签格式 文件格式
FIRE 视网膜图像数据 分类 视网膜图像 129
FIRE 是一个视网膜眼底图像数据集,包含 129张 眼底视网膜图像,由不同特征组合成 134对 图像组合。这些图像组合根据特质被划分为3类。眼底图像由 Nidek AFC-210 眼底照相机采集,分辨率为2912x2912,视觉仰角为40度。图像由 Papageorgiou Hospital 医院和Aristotle University of Thessaloniki大学共同构建,由于Thessaloniki 大学采集自39名患者。. 数据包括以下几部分内容: 1.成对的视网膜图像。 2.彩色ROI掩模(作为二值图像)。 3.特征ROI掩模(作为二值图像)。 4.每个图像对应的标注点。

STARE
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
STARE 眼底血管 分割 眼底照片 400 照片 照片 无
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3emF09zR-1636195013865)(https://raw.githubusercontent.com/linhandev/dataset/main/static/stare.png)]

STructured Analysis of the Retina数据集包含400张眼底照片,作者团队对这些数据进行了多种诊断,并对部分数据的血管进行了标注

Aistudio下载

CHASE_DB1
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
CHASE_DB1 眼底血管 分割 眼底照片 28 png png 无
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rnj8gUF3-1636195013868)(https://raw.githubusercontent.com/linhandev/dataset/main/static/CHASE_DB1.png)]

Kinston大学公开的一个小规模眼底分割数据集,包含28张眼底照片及对应的分割标签。

Aistudio下载

IDRiD
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
IDRiD 常见DR病灶、视盘、DR病变等级等 分类、检测、分割 眼底照片 * tif/csv jpg CC BY 4.0
Indian Diabetic Retinopathy Image Dataset (IDRiD)

Aistudio下载

前列腺
PANDA
名称 标注内容 类型 模态 数量 标签格式 文件格式
PANDA 前列腺癌分级 镜检图片 10616张镜检 分类 tiff
MSD前列腺分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD前列腺分割 前列腺中央腺体及外周区域 分割 多模态核磁 32(训练)+16(测试) CC-BY-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ms3lKxSd-1636195013869)(https://raw.githubusercontent.com/linhandev/dataset/main/static/msd-prostate.png)]

Aistudio下载

QIN-PROSTATE-Repeatability
名称 标注内容 类型 模态 数量 标签格式 文件格式
QIN-PROSTATE-Repeatability 前列腺癌 MRI 15 dcm
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RgLpxujA-1636195013869)(https://raw.githubusercontent.com/linhandev/dataset/main/static/QIN-Prostate-Repeatability.png)]

Aistudio下载

胰腺
MSD胰腺分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
MSD胰腺分割 胰腺肿瘤 分割 CT 282(训练)+139(验证) 0/1 nii CC-BY-SA 4.0
Aistudio下载

PDMR-833975-119-R
名称 标注内容 类型 模态 数量 标签格式 文件格式
PDMR-833975-119-R 胰腺癌 MRI 20 dcm
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SK6zWGbV-1636195013871)(https://raw.githubusercontent.com/linhandev/dataset/main/static/PDMR-833975-119-R.png)]

Aistudio下载

皮肤
SIIM-ISIC Melanoma Classification
名称 标注内容 类型 模态 数量 标签格式 文件格式
SIIM-ISIC Melanoma Classification 皮肤癌病变类别 分类 皮肤镜 88.3K张图片 类别 dicom
目前最大的皮肤镜图像集合,用来在皮肤病变图像中之别黑色素瘤,图片以DICOM格式提供,同时包含图像元数据,有的图像也以JPEG和TFRecord格式提供,TFRecords格式的图像已被调整为统一的1024x1024

细胞
Data Science Bowl 18
名称 标注内容 类型 模态 数量 标签格式 文件格式
Data Science Bowl 18 细胞核 分割 841张/37333个细胞核 0/1 图片
细胞核分割数据集

介绍论文: Nucleus segmentation across imaging experiments: the 2018 Data Science Bowl

Aistudio下载

血细胞涂片分类
名称 标注内容 类型 模态 数量 标签格式 文件格式
血细胞涂片分类 四种血细胞类型 分类 镜检 12500 - 图片
血细胞分类数据集包含12500张四种血细胞的照片。图片是从大的血细胞涂片照片上截下来的,数据集经过增广。图片都很小,训练时注意IO瓶颈。

Aistudio下载

ISBI细胞跟踪
名称 标注内容 类型 模态 数量 标签格式 文件格式
ISBI细胞跟踪 细胞像素级别位置 跟踪 镜检 图片
在镜检视频中像素级跟踪细胞位置

Aistudio下载 2D+Time Datasets

骨骼
MURA-1.1
名称 标注内容 类型 模态 数量 标签格式 文件格式
MURA-1.1 正常/非正常 分类 x-ray 40561
介绍论文: MURA: Large Dataset for Abnormality Detection in Musculoskeletal Radiographs

Aistudio下载

RSNA Bone Age
名称 标注内容 类型 模态 数量 标签格式 文件格式
RSNA Bone Age
Aistudio下载

磁共振图像脊柱结构多类别三维自动分割
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
磁共振图像脊柱结构多类别三维自动分割 椎骨和椎间盘 分割 MRI T2WI 172 0/1 nii Custom
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3pZkdKbs-1636195013872)(https://raw.githubusercontent.com/linhandev/dataset/main/static/spine-mri.png)]

Aistudio下载

膝盖
MRNet
名称 标注内容 类型 模态 数量 标签格式 文件格式
MRNet
Aistudio下载

脊椎
Verse大规模脊椎分割数据集
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
VerSe 脊椎 分割 CC BY-SA 4.0

Aistudio下载

VQA
PathVQA
名称 标注内容 类型 模态 数量 标签格式 文件格式
PathVQA 图片 4998图片/32799问答 图片
介绍论文: PathVQA: 30000+ Questions for Medical Visual Question Answering

Aistudio下载

内窥镜
SARAS-MESAD
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
SARAS-MESAD 24种动作 静态背景动作识别 内窥镜 4(真实手术)+5(模拟手术) CC BY-NC-SA 4.0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7YA4mKXc-1636195013873)(https://raw.githubusercontent.com/linhandev/dataset/main/static/saras-mesad.png)]

SARAS-MESAD
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
SARAS-ESAD 21种手术动作 静态背景动作识别 内窥镜 22,601(训练)+4,574(测试) 图片 BB CC BY-NC-SA
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fo2gnOEU-1636195013874)(https://raw.githubusercontent.com/linhandev/dataset/main/static/SARAS-ESAD.png)]

数字病理
CAMELYON
名称 标注内容 类型 模态 数量 标签格式 文件格式 License
CAMELYON16,17 镜检 图片 BB CC0
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZZtyJzLP-1636195013875)(https://grand-challenge-public-prod.s3.amazonaws.com/b/80/camelyon17_header.x15.jpeg)]

交流群
如果您对医学影像技术感兴趣,欢迎加入医学影像技术交流群 365213556 ,与更多大佬一起交流,共同进步!

257867080

医学影像数据库
TCIA:The Cancer Imaging Archive

MedPix 包含超过12000名患者和59000张影像

Belarus tuberculosis portal 包含结核病人的CT,胸透和检验数据

Grand Challenges

LONI 神经相关医学影像

参考项目/列表
医学影像分割挑战

胸部\肺部ct数据集

adalca

beamandrew

Stanford ML Group

omic tools

各领域公开数据集

medical-imaging-datasets

Open-Access Medical Image Repositories

Medical Image Datasets Download Links

HAM10000 dataset

Dermatology Image Classification

havard

usc

burkely

isdis

radiopedia

aimi

贡献者
(按照首次贡献时间排序)

多语言代码生成器 Mail : linhandev@qq.com

自尊心3

底迪

ChenchenHu007

lixinhui541

吖吖查

parap1uie-s

Jianpeng Zhao

Release Note
2021/5/21
开始添加数据集图片,接受多次外部贡献,对存量数据集进行合规检查,数据集总量达到71

2020/11/20
添加Issue模板,鼓励外部贡献,数据集数量达到67

2020/11/8
在Github发布,整理格式,添加多个数据集

2020/6/11
添加LIDC-IDIR,编写数据压缩脚本

2020/6/4
添加MMWHS心脏分割数据集,SIIM皮肤病分类比赛数据集

2020/5/27
添加ISBI细胞分割,TCGA-LIHC肝脏,4D-Lung肺部数据集,围绕乳腺癌添加一系列数据集

2020/5/20
项目添加数据集计数和release note,数据集方面添加 RSNA骨龄,PathVQA,FIRE视网膜,DDSM乳腺癌等数据集

2020/5/13
项目在Aistudio公开,包含约40个数据集

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

100+医学影像数据集集锦 的相关文章

  • 为神经网络打乱两个 numpy 数组

    我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
  • 安装tensorflow的正确命令

    当尝试在 Anaconda 上安装 Tensorflow 时 我尝试了两种类型的命令 conda install tensorflow gpu工作得很好 然而 当尝试conda install c anaconda tensorflow g
  • Keras ZeroDivisionError:整数除法或以零为模

    我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络 我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
  • 如何检索分配给 Django 中的组的所有权限

    我正在执行一项任务来检索分配给 Django 中的组的一组权限 我可以使用以下代码获取创建的组 但无法使用它来获取分配给它们的权限 from django contrib auth models import Group Permissio
  • 如果另一列中的值为空,则删除重复项 - Pandas

    我拥有的 df Name Vehicle Dave Car Mark Bike Steve Car Dave Steve 我想从 名称 列中删除重复项 但前提是 车辆 列中的相应值为空 我知道我可以使用 df dropduplicates
  • Karasuba算法递归过多

    我正在尝试用 c 实现 Karasuba 乘法算法 但现在我只是想让它在 python 中工作 这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
  • Pandas如何按时间段过滤DataFrame

    我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
  • 如何将 Pyspark Dataframe 标题设置到另一行?

    我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框 使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行 新表应如下所示 id na
  • Bokeh 中单独的节点和边缘悬停工具?

    我正在尝试为 Bokeh 中的节点和边缘获取单独的悬停工具提示 但未能使其正常工作 有人可以指出我做错了什么吗 我相信代码应该如下所示 from bokeh io import show output notebook from bokeh
  • 将 Python Selenium 输出写入 Excel

    我编写了一个脚本来从在线网站上抓取产品信息 目标是将这些信息写入 Excel 文件 由于我的Python知识有限 我只知道如何在Powershell中使用Out file导出 但结果是每个产品的信息都打印在不同的行上 我希望每种产品都有一条
  • 如何处理 Tkinter 中的窗口关闭事件?

    如何在 Python Tkinter 程序中处理窗口关闭事件 用户单击 X 按钮 Tkinter 支持一种称为协议处理程序 http web archive org web 20201111215134 http effbot org tk
  • 更新 matplotlib 中颜色条的范围

    我想更新一个contourf在函数内绘制 效果很好 然而 数据的范围发生了变化 因此我还必须更新颜色条 这就是我未能做到的地方 请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
  • 更改用作函数全局作用域的字典

    我想做一个 purePython 的装饰器 其中一部分是能够有选择地禁止访问函数的全局范围 有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局 外部作用域 因此 例如在下面我希望能够拦截对f in h并抛出错误 但我想允许访问g因为
  • 异步异常处理程序:在事件循环线程停止之前不会被调用

    我正在我的异步事件循环上设置异常处理程序 但是 在事件循环线程停止之前 它似乎不会被调用 例如 考虑以下代码 def exception handler loop context print Exception handler called
  • 通过新数据更新绘图,而不是在 Jupyter 笔记本中制作新绘图

    我有一些问题 希望你能帮我解决 我需要使用下拉小部件创建交互式绘图 我可以在其中选择并绘制感兴趣的数据 我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
  • 在 anaconda 环境下运行 qsub

    我有一个程序 通常在 Linux 的 conda 环境中运行 因为我用它来管理我的库 指令如下 source activate my environment python hello world py 我怎样才能跑你好世界 py在与 PBS
  • 使用 Numpy 进行多维批量图像卷积

    在图像处理和分类网络中 一个常见的任务是输入图像与一些固定滤波器的卷积或互相关 例如 在卷积神经网络 CNN 中 这是一种极其常见的操作 我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
  • 如何在supervisord中设置组?

    因此 我正在设置 Supervisord 并尝试控制多个进程 并且一切正常 现在我想设置一个组 以便我可以启动 停止不同的进程集 而不是全部或全无 这是我的配置文件的片段 group tapjoy programs tapjoy game1
  • 在 python 中使用高精度时间戳

    嘿 我正在使用 python 处理日期时间 我想知道解析这个时间戳的最佳方法是什么 时间戳是ISO标准 这里是一个例子 2010 06 19T08 17 14 078685237Z 现在到目前为止我已经使用过 time datetime d
  • 当训练和测试的特征数量不同时,如何处理生产环境中的One-Hot Encoding?

    在做某些实验时 我们通常在 70 上进行训练 在 33 上进行测试 但是 当您的模型投入生产时会发生什么 可能会发生以下情况 训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

  • promise详解

    一 promise含义 Promise 是异步编程的一种解决方案 比传统的解决方案 回调函数和事件 更合理和更强大 它由社区最早提出和实现 ES6 将其写进了语言标准 统一了用法 原生提供了Promise对象 所谓Promise 简单说就是
  • poi 灵活导出excel(有这一篇即可~~~~)

    大家在开发项目的时候 但凡涉及数据多而杂的时候或多或少需要导出excel 用什么的工具类这时候就很烦恼了 接下来的工具类傻瓜式一键生成大家需要的excel 1 依赖 Apache POI是Apache软件基金会的开放源码函式库 POI提供A
  • 以太坊开发者常见的问题答案

    求职面试不仅是一种过滤掉不合格候选人的考验 对于候选人来说 这也是一个很好的机会 可以评估未来雇主的开发团队的优秀程度 如果你的面试官问的是原始的 蹩脚的或错误的问题 是的 他们会问你一些完全没有意义的事情 然后这是一个红旗 也许你应该重新
  • Error:Cannot build Artifact 'art_training:war exploded' because it is included into a circular depen

    今天在做项目弄项目的时候启动tomcat出现问题错误如下 Error Cannot build Artifact art training war exploded because it is included into a circula
  • 远程访问服务器Jupyter Notebook (浏览器访问和pycharm访问)

    1 在remote server上运行 jupyter notebook no browser port 8888 复制远程终端显示的 token 序列 2 在本地终端上运行 ssh L 8888 localhost 8888
  • Android中的DPI和PPI

    DPI是Android开发中的像素密度 PPI是Android手机物理像素密度 他们两者是完全没有关系的 千万不要把ppi的公式等同于dpi dpi是通过displayMetrics获取的 val densityDpi resources
  • 芯片开发语言:Verilog 在左,Chisel 在右

    来源 老石谈芯 在最近召开的RISC V中国峰会上 中科院计算所的包云岗研究员团队正式发布了名为 香山 的开源高性能处RISC V处理器 前不久我有幸和包老师就这个事情做了一次深度的交流 我们聊了关于RISC V 还有 香山 处理器的前世今
  • VS code Python使用:debug环境配置,日常使用技巧

    1 配置debug环境 1 1 步骤一 9步配置远程环境 成功解决 vscode远程调试python 如果单步跳过快捷键F10没有反应 可以 设置 键盘快捷方式 重新设置一遍 Debug 单步跳过 随便设一个键 然后再设置回 F10 拓展插
  • 算法_快速排序

    Python 快速排序 快速排序使用分治法 Divide and conquer 策略来把一个序列 list 分为较小和较大的2个子序列 然后递归地排序两个子序列 步骤为 挑选基准值 从数列中挑出一个元素 称为 基准 pivot 分割 重新
  • 【C语言】_8.数据的存储

    正文 1 数据类型介绍 前面我们已经了解到基本的内置类型 char 字符数据类型 1个字节 short 短整型 2个字节 int 整型 4个字节 long 长整型 4或8个字节 long long 更长的整型 8个字节 float 单精度浮
  • Android让EditText输入框真正失去焦点问题解决

    在显示一些记录的时候 不希望EditText有光标 也就是失去焦点 可以通过调用edittext clearFocus 来实现 但clearFocus 的会将焦点移到Activity的第一个View 如果不幸你的EditText就是第一个V
  • 由于找不到d3dx9_43.dll无法继续执行代码

    电脑提示由于找不到d3dx9 43 dll 无法继续执行代码如何修复呢 相信不少小伙伴遇到过这个问题 d3dx9 43 dll是Windows系统中重要的组件 缺失或者损坏都会导致很多游戏跟软件无法运行打开 小编今天就把修复教程分享给大家
  • java map取第一个元素_从HashMap获取第一个和最后一个元素

    6 个答案 答案 0 得分 3 首先 地图不是有序的 所以你不会真正拥有第一个和最后一个元素 但是 如果你想获得它的第一个和最后一个元素 你可以只获取值并将其转换为数组 这不是很漂亮 但它会起作用 Map result new HashMa
  • 有没有免费/便宜好用的云服务器推荐?

    国内各大云平台目前都处于拉新阶段 免费是有的 但是时间都有限 例如腾讯云个人注册新用户可以领取一个月的免费服务器 企业注册新用户可以领取6个月的免费服务器 虽然都是1核1G1M带宽的 但是对于熟悉云环境还是有一定的帮助 具体可前往腾讯云官网
  • 蓝桥杯嵌入式STM32G431——第十二届第一场省赛停车计费系统真题及代码

    1 第十二届第一场省赛真题 2 解题思路整理 本届赛题相较于往届赛题在串口部分有较为复杂的逻辑 想要解决还是需要下一番功夫的 首先除了串口模块 LED LCD 按键 PA7输出频率固定 占空比固定的PWM这些模块都是基本的套路比较简单 先把
  • C++模板*******

    模板是泛型编程的基础 泛型编程即以一种独立于任何特定类型的方式编写代码 模板是创建泛型类或函数的蓝图或公式 库容器 比如迭代器和算法 都是泛型编程的例子 它们都使用了模板的概念 每个容器都有一个单一的定义 比如 向量 我们可以定义许多不同类
  • 配置Win10解决VMware Intel VT-x虚拟化问题

    http jingyan baidu com article 4b52d702a3e0aafc5d774b7c html
  • mfc c语言串口通信,C++的MFC 串口通讯(转)

    修改了原作者的一些小笔误 完善了一下整个过程 本例程是在VS2010环境下 使用MFC做的是一个简单的串口通信程序 欢迎交流 1 首先 在VS2010环境下创建基于对话框的MFC应用程序 a 选择菜单项 文件 gt 新建 gt 项目 弹出新
  • 【MySQL】索引

    目录 一 索引的概念 二 前导理解 2 1 硬件方面 2 2 软件方面 2 3 建立共识 三 索引的理解 3 1 单个page 3 2 多个page 3 3 B 树 3 4 B 树的特征 3 5 聚簇索引与非聚簇索引 3 6 辅助索引 普通
  • 100+医学影像数据集集锦

    100 医学影像数据集集锦 linhandev 于 2021 11 06 18 41 38 发布 4654 收藏 97 文章标签 深度学习 计算机视觉 python 图像处理 机器学习 版权 医学影像数据集集锦 前言 本项目的目标是整理一个