摘要:本数据集共包含 1,920 张斑点叉尾鮰鱼图像,标注目标框总数为 2,070 个,涵盖 3 类目标,分别为正常个体(normal)、轻 微损伤个体(minor_damage)和严重损伤个体(major_damage)。其中,正常类别目标框数量为 900 个,轻微损伤类别为 450 个,严重损伤类别为 720 个。数据集采用 YOLO 格式进行标注,能够满足目标检测任务对数据组织与标签表示的要求。

数据集简介

本研究构建的斑点叉尾鮰鱼损伤检测数据集共包含 1920 张图像和 2070 个目标框,涵盖正常、轻微损伤和严重损伤 3 个类别,并按照 7:2:1 的比例划分为训练集、验证集和测试集,采用 YOLO 格式进行标注。

数据集概述

本研究构建的斑点叉尾鮰鱼损伤检测数据集采用 YOLO 格式进行标注,数据集目录下包含图像文件、对应标注文件以及数据配置文 件,能够满足目标检测模型训练、验证与测试的基本需求。数据集共设置 3 个类别,分别为正常(normal)、轻微损伤(minor_d amage)和严重损伤(major_damage),能够较为全面地反映斑点叉尾鮰鱼表面损伤程度。

在数据规模方面,该数据集共包含 1920 张图像及对应标注文件,标注目标框总数为 2070 个。其中,正常类别目标框数量为 900 个,轻微损伤类别为 450 个,严重损伤类别为 720 个。整体来看,数据集类别分布存在一定差异,其中轻微损伤类别样本数量相对较少,表现出一定程度的类别不均衡特征。

在数据划分方面,数据集按照 7:2:1 的比例划分为训练集、验证集和测试集,其中训练集包含 1344 张图像,验证集包含 384 张图像,测试集包含 192 张图像。所有图像均与标注文件一一对应,且不存在空标注文件,说明数据集具有较好的完整性,可为 斑点叉尾鮰鱼损伤检测模型的训练、参数调优及泛化性能评估提供可靠的数据基础。

数据集来源

本研究所使用的数据集为自主构建,图像数据来源于斑点叉尾鮰鱼样本的实际采集与拍摄,经筛选与预处理后获得 1,920 张有效图像。所有图像均采用 YOLO 格式进行边界框标注,定义了正常个体、轻微损伤个体和严重损伤个体 3 类目标,共计标注 2,070 个实例。其中,正常类别标注 900 个,轻微损伤类别标注 450 个,严重损伤类别标注 720 个。标注过程中遵循统一的标注规范,以确保数据标注的一致性与准确性,为后续模型训练与性能评估提供可靠的数据基础。

类别定义

标注规范

标注采用 YOLO 格式:每个目标一行,字段为 class x_center y_center width height, 坐标均为相对归一化(0~1)。

图1 标注规范图

数据规模与划分

  • 总图像数:1,920张;总标注框数:2,070

图2 数据集在训练、验证和测试集上的分布

数据集按照约 80:10:10 的比例划分为训练集、验证集和测试集:

表1 数据集划分及用途说明

质量控制

标注采用双阶段质量控制流程:首先进行规范化标注与自检, 确保目标框贴合实例外接矩形且类别一致;随后进行抽样复核, 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认, 以提高跨标注者一致性与总体标注可靠性。

数据格式与使用

数据集采用标准 YOLO 格式组织,通过 data.yaml 配置文件即可快速集成到训练流程中。

目录结构

数据集采用标准 YOLO 格式组织,图像和标注文件分别存放在 images/ 和 labels/ 目录下,并按训练集、验证集、测试集划分。

配置文件

在训练脚本中指定 data.yaml 即可加载数据:

性能评测

基于 YOLOv8 模型在本数据集上进行训练和评测,使用mAP@0.5与mAP@0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下:

训练过程综合指标曲线图

图3 训练与验证指标随Epoch变化趋势图

精确率-召回率(PR)曲线图

图4 目标检测PR曲线(Precision-Recall)

F1分数-置信度阈值曲线图

图5 不同置信度阈值下的F1曲线

归一化混淆矩阵图(分类误判分析)

图6 归一化混淆矩阵(person / leaflet)

应用案例

图7 应用案例:基于改进YOLOv8斑点叉尾鮰鱼损伤检测系统的研究与实现

免责声明与引用

数据仅用于科研与教学用途。若用于商业场景,请自行核验数据许可。 如需引用,请在论文或报告中注明数据集名称与版本号。

作者信息

作者:Bob (张家梁)
项目编号:Datasets-13
数据大小:569M
原创声明:本项目为原创作品

开源协议

本项目采用AGPL-3.0开源协议,允许个人和组织自由使用、修改和分发代码,但基于本项目的衍生作品必须同样开源,且用于提供网络服务时需向用户提供完整源代码。本项目仅供学习研究使用,作者不对使用本项目产生的任何后果承担责任,使用者应遵守当地法律法规,合理合法使用本项目。如本项目对您的研究或工作有所帮助,欢迎引用并注明出处。

版权声明:本站除特别标注外的所有源码与资料均为原创,受《中华人民共和国著作权法》等相关法律保护。未经本站事先书面许可,任何个人或机构不得以复制、转载、爬取、汇编、改写、引用等方式使用本站内容,不得将本站内容发布或用于任何形式的商业活动。对未经授权使用本站内容的行为,本站保留追究法律责任的权利,包括但不限于要求删除、赔偿、诉讼等。如认为本站内容侵犯其合法权益,请提供权属证明并联系我们,我们将在核实后依法及时处理。