摘要:本数据集包含腹部肾脏 CT 影像及其对应的分割标注,旨在支持 肾脏与肾脏肿瘤的自动分割研究。数据集共包含 3921 张图像,划分为训练集、验证集和测试集,并提供与之对应的 YOLOv8、YOLOv12实例分割格式标签。标注区分 两类目标:肾脏正常(Normal)与肾脏肿瘤(tumor),可用于训练和评估分割模型。
作者信息
编号:Dataset-1
大小:202M
作者:Bob(整理实测)
数据集概览
本项目提供的数据集均来源于真实场景的实测数据,并经过精心筛选与规范化整理。每份数据均配套完整的测试样本与真实标注结果,可直接用于模型训练与性能验证,用户在获取数据集后即可快速开展实验与应用开发。同时,我们对数据集的真实性、完整性与可用性提供可靠保障。
1.数据类型
本数据集由肾脏 CT 图像及其对应的分割标注文件构成。原始数据为腹部/肾脏区域的CT横断面图像,统一裁剪并重采样后,以固定分辨率的图像文件(JPEG格式)进行存储;每一张肾脏CT图像均配套一个同名的标注文件,用于描述肾脏及相关目标区域的精细轮廓信息。
2.标注格式
本数据集采用 YOLO 图像分割标注格式。如图所示,每个标注文件中的一行对应图像中的一个目标结构,其格式为:

图1 YOLO 肾脏CT图像分割标注格式示意图
其中, 表示目标类别编号(如肾脏、病灶等不同结构),x1, y1, x2, y2, …, xn, yn 为该目标多边形轮廓的顶点坐标,每一对 (xi, yi) 表示一个顶点。所有坐标均为相对于图像宽度和高度的归一化值,取值范围为0,1。通过该标注格式,可以精确描述肾脏及相关病变区域的形状,为后续分割模型的训练与评估提供高质量的监督信息。
数据集来源
本研究所使用的数据集由Bob在KiTS公开数据集的基础上自行整理与规范化构建。原始数据来源于KiTS数据集(公开可获取的数据资源),在此基础上完成了进一步的筛选、清洗与标注调整,用于本项目的实验研究。
本数据集仅限于科学研究与教学目的使用,不得用于任何形式的商业应用。所有数据已按要求进行匿名化处理,去除了患者身份识别相关信息,不包含任何可追溯至个体的隐私内容,符合医学数据使用的隐私保护与合规要求。
数据集类别
本研究针对肾脏 CT 图像中感兴趣区域,将标注目标划分为两类。如表所示,类别编号为 0 的目标记为“正常(Normal)”,对应肾脏的正常实质区域;类别编号为 1 的目标记为“肿瘤(Tumor)”,对应肾脏内肿瘤病灶区域。

表1 数据类别
数据集规模
本数据集在保证数据质量的前提下,提供了具有一定规模的样本数量,以支持模型的训练、验证和测试。总体样本数量及其在不同数据子集(如训练集、验证集和测试集)之间的划分情况如图所示。

图2 数据集划分直方图
数据集用途
本肾脏 CT 图像数据集主要适用于以下研究与应用场景:
(1)医学图像分割模型训练(YOLOv8、U-Net、nnU-Net等深度学习模型的训练与优化。)
(2)临床辅助诊断(肾脏肿瘤检测、体积测量及病灶区域分析,辅助医学研究与诊断。)
(3)算法性能对比(作为Benchmark,用于不同算法的性能评测与对比实验。)
(4)教学与科研实验(作为医学影像与人工智能课程的实验数据,用于教学和科研探索。)
数据集性能
训练与验证性能曲线:

图3 YOLOv12 模型训练与验证性能曲线
该图展示了 YOLO 模型在数据集上的训练与验证过程,损失函数逐步下降并趋于平稳,同时验证集上的精度、召回率和 mAP 指标不断提升并稳定,表明模型收敛良好并具备较高的分割性能。
精确率-召回率曲线(Box与Mask):

图4 PR曲线(Box)和PR曲线(Mask)
无论是Box还是Mask,模型在本数据集上的表现都非常优异,正常类接近完美 (≈0.993),肿瘤类也保持了较高精度 (≈0.974),整体 mAP 指标达到 0.984,说明模型具有良好的分类与分割能力。
混淆矩阵与归一化混淆矩阵:

图5 混淆矩阵与归一化混淆矩阵
模型在该数据集上的分类和分割效果都非常优异,尤其是 normal 类几乎完美,tumor 类表现良好但有少量误判,需要关注类别不平衡问题。
训练数据可视化

图6 训练与验证数据可视化对比
左图为训练集样本(train_batch0.jpg),展示了数据增强后的标注情况;右图为验证集样本(val_batch0_labels.jpg),展示了真实标注。蓝色区域为肾脏正常(类别 0),青色区域为肾脏肿瘤(类别 1)。
数据集须知
(1)类别不平衡(肿瘤区域远小于肾脏区域,训练时需考虑类别权重或使用 Dice/Focal Loss。)
(2)图像格式 (数据集为 JPG/PNG,可能丢失原始 CT 的 HU 值,不适合直接做医学定量分析。)
(3)匿名化处理(已去除 DICOM 头等隐私信息,确保患者数据安全。)
(4)使用限制(数据集仅限科研与教学用途,不得用于商业医疗诊断。)


评论(0)