摘要:随着教育信息化的深入发展,考试监考工作面临着人力成本高、监控效率低、主观判断差异大等挑战。为推动智能监考技术的发展,本研究构建了一个面向考试异常行为检测的大规模标注数据集。该数据集包含5,463张高质量图像,按照7:2:1的比例划分为训练集(3,824张)、验证集(1,092张)和测试集(547张),确保了模型训练和评估的科学性。

数据集简介

该数据集是一个面向考试场景异常行为检测的高质量标注图像数据集,涵盖多类作弊、违规及正常行为,采用标准化 YOLO 格式,可有效支撑智能监考目标检测模型的训练与评估。

数据集概述

随着教育信息化的深入发展,考试监考工作面临着人力成本高、监控效率低、主观判断差异大等挑战。为推动智能监考技术的发展,本研究构建了一个面向考试异常行为检测的大规模标注数据集。该数据集包含5,463张高质量图像,按照7:2:1的比例划分为训练集(3,824张)、验证集(1,092张)和测试集(547张),确保了模型训练和评估的科学性。

数据集针对考场中常见的 12 类行为 进行了精细化标注,涵盖了作弊行为(如提前作答、考后继续作答、传递/拾取/携带可疑物品、撕毁试卷)、违规或异常行为(如左右转头、向后转头、站立、手放桌下、考生中途离开/返回)以及待确定行为(举手)等多种典型场景。所有样本均采用 YOLO 格式的边界框标注方式,标注信息包括类别 ID、目标中心点坐标及目标框的宽高,便于直接应用于主流目标检测算法。

该数据集在多个方面具有显著优势:行为类别覆盖全面,能够有效反映考场中主要的异常行为模式;标注质量高,采用统一的标注规范与严格的质量控制流程,确保数据可靠性;数据规模适中,既满足深度学习模型的训练需求,又有利于研究者快速开展算法验证;数据格式标准化,兼容 YOLO等主流目标检测框架。实验结果表明,基于该数据集训练的目标检测模型能够有效识别考场异常行为,为智能监考系统的研究与应用提供了重要的数据支撑,具有良好的应用价值和推广前景。

数据集来源

本数据集来源于真实考试场景的现场采集图像,覆盖考生多种作弊及异常行为的多样化表现形式。采集场景包括不同类型的考场环境,并涵盖多种光照条件、拍摄视角、背景复杂度及遮挡情况,从而有效提升模型在实际考试监考应用中的泛化能力。

类别定义

标注规范

标注采用 YOLO 格式:每个目标一行,字段为 class x_center y_center width height, 坐标均为相对归一化(0~1)。

图1 标注规范图

数据规模与划分

  • 总图像数:5463;总标注框数:5463

图2 数据集在训练、验证和测试集上的分布

数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集:

表1 数据集划分及用途说明

质量控制

标注采用双阶段质量控制流程:首先进行规范化标注与自检, 确保目标框贴合实例外接矩形且类别一致;随后进行抽样复核, 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认, 以提高跨标注者一致性与总体标注可靠性。

数据格式与使用

数据集采用标准 YOLO 格式组织,通过 data.yaml 配置文件即可快速集成到训练流程中。

目录结构

数据集采用标准 YOLO 格式组织,图像和标注文件分别存放在 images/ 和 labels/ 目录下,并按训练集、验证集、测试集划分。

使用方式

在训练脚本中指定 data.yaml 即可加载数据:

性能评测

基于 YOLOv12 模型在本数据集上进行训练和评测,使用mAP@0.5与mAP@0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下:

训练过程综合指标曲线图

图3 训练与验证指标随Epoch变化趋势图

精确率-召回率(PR)曲线图

图4 目标检测PR曲线(Precision-Recall)

F1分数-置信度阈值曲线图

图5 不同置信度阈值下的F1曲线

归一化混淆矩阵图(分类误判分析)

图6 归一化混淆矩阵(person / leaflet)

应用案例

图7 应用案例:基于YOLO12的考试作弊异常行为检测与分析系统

免责声明与引用

数据仅用于科研与教学用途。若用于商业场景,请自行核验数据许可。 如需引用,请在论文或报告中注明数据集名称与版本号。

作者信息

作者:Bob (张家梁)
项目编号:Datasets-3
数据大小:2.5G
原创声明:本项目为原创作品

开源协议

本项目采用AGPL-3.0开源协议,允许个人和组织自由使用、修改和分发代码,但基于本项目的衍生作品必须同样开源,且用于提供网络服务时需向用户提供完整源代码。本项目仅供学习研究使用,作者不对使用本项目产生的任何后果承担责任,使用者应遵守当地法律法规,合理合法使用本项目。如本项目对您的研究或工作有所帮助,欢迎引用并注明出处。

版权声明:本站除特别标注外的所有源码与资料均为原创,受《中华人民共和国著作权法》等相关法律保护。未经本站事先书面许可,任何个人或机构不得以复制、转载、爬取、汇编、改写、引用等方式使用本站内容,不得将本站内容发布或用于任何形式的商业活动。对未经授权使用本站内容的行为,本站保留追究法律责任的权利,包括但不限于要求删除、赔偿、诉讼等。如认为本站内容侵犯其合法权益,请提供权属证明并联系我们,我们将在核实后依法及时处理。