摘要:本数据集包含腹部肾脏 CT 影像及其对应的分割标注,旨在支持 肾脏与肾脏肿瘤的自动分割研究。数据集共包含 3921 张图像,划分为训练集、验证集和测试集,并提供与之对应的 YOLOv8、YOLOv12实例分割格式标签。标注区分 两类目标:肾脏正常(Normal)与肾脏肿瘤(tumor),可用于训练和评估分割模型。

作者信息

编号:Dataset-1
大小:202M
作者:Bob(整理实测)

数据集概览

本项目提供的数据集均来源于真实场景的实测数据,并经过精心筛选与规范化整理。每份数据均配套完整的测试样本与真实标注结果,可直接用于模型训练与性能验证,用户在获取数据集后即可快速开展实验与应用开发。同时,我们对数据集的真实性、完整性与可用性提供可靠保障。

1.数据类型
本数据集由肾脏 CT 图像及其对应的分割标注文件构成。原始数据为腹部/肾脏区域的CT横断面图像,统一裁剪并重采样后,以固定分辨率的图像文件(JPEG格式)进行存储;每一张肾脏CT图像均配套一个同名的标注文件,用于描述肾脏及相关目标区域的精细轮廓信息。

2.标注格式
本数据集采用 YOLO 图像分割标注格式。如图所示,每个标注文件中的一行对应图像中的一个目标结构,其格式为:

图1 YOLO 肾脏CT图像分割标注格式示意图

其中, 表示目标类别编号(如肾脏、病灶等不同结构),x1, y1, x2, y2, …, xn, yn 为该目标多边形轮廓的顶点坐标,每一对 (xi, yi) 表示一个顶点。所有坐标均为相对于图像宽度和高度的归一化值,取值范围为0,1。通过该标注格式,可以精确描述肾脏及相关病变区域的形状,为后续分割模型的训练与评估提供高质量的监督信息。

数据集来源

本研究所使用的数据集由Bob在KiTS公开数据集的基础上自行整理与规范化构建。原始数据来源于KiTS数据集(公开可获取的数据资源),在此基础上完成了进一步的筛选、清洗与标注调整,用于本项目的实验研究。

本数据集仅限于科学研究与教学目的使用,不得用于任何形式的商业应用。所有数据已按要求进行匿名化处理,去除了患者身份识别相关信息,不包含任何可追溯至个体的隐私内容,符合医学数据使用的隐私保护与合规要求。

数据集类别

本研究针对肾脏 CT 图像中感兴趣区域,将标注目标划分为两类。如表所示,类别编号为 0 的目标记为“正常(Normal)”,对应肾脏的正常实质区域;类别编号为 1 的目标记为“肿瘤(Tumor)”,对应肾脏内肿瘤病灶区域。

表1 数据类别

数据集规模

本数据集在保证数据质量的前提下,提供了具有一定规模的样本数量,以支持模型的训练、验证和测试。总体样本数量及其在不同数据子集(如训练集、验证集和测试集)之间的划分情况如图所示。

图2 数据集划分直方图

数据集用途

本肾脏 CT 图像数据集主要适用于以下研究与应用场景:
(1)医学图像分割模型训练(YOLOv8、U-Net、nnU-Net等深度学习模型的训练与优化。)
(2)临床辅助诊断(肾脏肿瘤检测、体积测量及病灶区域分析,辅助医学研究与诊断。)
(3)算法性能对比(作为Benchmark,用于不同算法的性能评测与对比实验。)
(4)教学与科研实验(作为医学影像与人工智能课程的实验数据,用于教学和科研探索。)

数据集性能

训练与验证性能曲线:

图3 YOLOv12 模型训练与验证性能曲线

该图展示了 YOLO 模型在数据集上的训练与验证过程,损失函数逐步下降并趋于平稳,同时验证集上的精度、召回率和 mAP 指标不断提升并稳定,表明模型收敛良好并具备较高的分割性能。

精确率-召回率曲线(Box与Mask):

图4 PR曲线(Box)和PR曲线(Mask)

无论是Box还是Mask,模型在本数据集上的表现都非常优异,正常类接近完美 (≈0.993),肿瘤类也保持了较高精度 (≈0.974),整体 mAP 指标达到 0.984,说明模型具有良好的分类与分割能力。

混淆矩阵与归一化混淆矩阵:

图5 混淆矩阵与归一化混淆矩阵

模型在该数据集上的分类和分割效果都非常优异,尤其是 normal 类几乎完美,tumor 类表现良好但有少量误判,需要关注类别不平衡问题。

训练数据可视化

图6 训练与验证数据可视化对比

左图为训练集样本(train_batch0.jpg),展示了数据增强后的标注情况;右图为验证集样本(val_batch0_labels.jpg),展示了真实标注。蓝色区域为肾脏正常(类别 0),青色区域为肾脏肿瘤(类别 1)。

数据集须知

(1)类别不平衡(肿瘤区域远小于肾脏区域,训练时需考虑类别权重或使用 Dice/Focal Loss。)
(2)图像格式 (数据集为 JPG/PNG,可能丢失原始 CT 的 HU 值,不适合直接做医学定量分析。)
(3)匿名化处理(已去除 DICOM 头等隐私信息,确保患者数据安全。)
(4)使用限制(数据集仅限科研与教学用途,不得用于商业医疗诊断。)

版权声明:本站除特别标注外的所有源码与资料均为原创,受《中华人民共和国著作权法》等相关法律保护。未经本站事先书面许可,任何个人或机构不得以复制、转载、爬取、汇编、改写、引用等方式使用本站内容,不得将本站内容发布或用于任何形式的商业活动。对未经授权使用本站内容的行为,本站保留追究法律责任的权利,包括但不限于要求删除、赔偿、诉讼等。如认为本站内容侵犯其合法权益,请提供权属证明并联系我们,我们将在核实后依法及时处理。