本研究构建了一个涵盖六个类别的皮肤病图像数据集,经过数据清洗与筛选,类别分布较为均衡,包含常见的良性病变和典型的恶性肿瘤,能够较全面地反映临床实际情况。数据集包括日光性角化病、特应性皮炎、皮肤纤维瘤、色素痣、黑色素瘤和鳞状细胞癌,其中良性病变与恶性肿瘤的样本比例合理。该数据集为后续基于YOLOv8的皮肤病灶检测与分类模型训练提供了坚实的基础,具有重要的临床应用价值。
数据集信息
编号:Dataset-2
大小:881M
整理:Bob
数据集概览
数据类型:
表1 数据类型与格式
数据规模:
(1)数据集划分直方图
图1 数据集划分直方图
表2 数据集划分与规模
(2)数据集划分饼图
图2 数据集划分饼图
表3 数据集比例及作用
任务类型:
表4 任务类型说明
数据集类别
表5 类别定义
数据集来源
表6 数据集来源与说明
数据集用途
本数据集可用于:
(1)皮肤病检测与分类模型训练(YOLOv8等深度学习模型)。
(2)临床辅助诊断(皮肤病病变检测与区域分析)。
(3)算法性能对比(Benchmark测试与对比实验)。
(4)教学与科研(医学影像与AI课程实验数据)。
数据集须知
(1)类别不平衡:恶性病变样本较少,需考虑类别权重或使用Dice/Focal Loss优化。
(2)图像格式:JPG/PNG格式,缺少原始CT定量信息,适合病变检测与分类。
(3)匿名化处理:已去除隐私信息,确保数据安全。
数据集性能
训练与验证性能曲线:
图3 YOLOv8 模型训练与验证性能曲线
这张图展示了训练和验证过程中,多个指标(如损失函数和精度)随迭代次数的变化趋势,曲线平滑且表现出明显的收敛性,表明模型在训练过程中逐步优化,并且在验证集上也取得了较好的效果。
精确率-召回率曲线(Box与Mask):
图4 PR曲线
这张精度-召回曲线(Precision-Recall Curve)展示了各个皮肤病类别(如日光性角化病、特应性皮炎等)在不同召回率下的精度,所有类别的精度值都接近1,表明模型在各个类别上表现非常优秀,总体mAP@0.5为0.992。
混淆矩阵与归一化混淆矩阵:
图5 混淆矩阵
这张混淆矩阵显示了模型在皮肤病分类任务中的表现,大部分预测都正确,且各个类别之间的混淆较少,表明模型具有较高的准确性,尤其在区分不同类型的皮肤病时表现优秀。
训练数据可视化
图6 训练与验证数据可视化对比
这张图展示了训练样本和验证样本的可视化,左侧是训练集图像,右侧是验证集图像,并标注了相应的皮肤病类型(如皮肤纤维瘤、鳞状细胞癌等),有助于理解模型如何学习并检测不同类型的皮肤病。
联系我们
官方声明
(1)实验环境真实性与合规性声明:
本研究所使用的硬件与软件环境均为真实可复现的配置,未采用虚构实验平台或虚拟模拟环境。实验平台为作者自主购买的惠普(HP)暗影精灵 10 台式整机,具体硬件参数详见表。软件环境涵盖操作系统、开发工具、深度学习框架等,具体配置详见表,所有软件组件均来源于官方渠道或开源社区,并按照其许可协议合法安装与使用。
研究过程中严格遵循学术诚信和实验可复现性要求,确保所有实验数据、训练过程与结果均可在相同环境下被重复验证,符合科研规范与工程实践标准。
(2)版权声明:
本算法改进中涉及的文字、图片、表格、程序代码及实验数据,除特别注明外,均由2zcode.Bob独立完成。未经2zcode官方书面许可,任何单位或个人不得擅自复制、传播、修改、转发或用于商业用途。如需引用本研究内容,请遵循学术规范,注明出处,并不得歪曲或误用相关结论。
本研究所使用的第三方开源工具、框架及数据资源均已在文中明确标注,并严格遵守其相应的开源许可协议。使用过程中无违反知识产权相关法规,且全部用于非商业性学术研究用途。
评论(0)