基于Swin Transformer的心电图图像分类与诊断系统-猿创-2zcode

摘要：本研究提出了一种基于Swin Transformer的心电图图像分类与诊断系统，通过特征提取提升了房性传导阻滞、新冠病毒、心肌损伤、心肌梗死和心脏正常的分类精度，为心脏疾病的早期诊断提供支持。

项目信息

编号：PCV-21
数据集：Dataset-21
大小：199M
作者：Bob(原创)

法律声明

由于源码产品具有可复制性，根据《中华人民共和国消费者权益保护法》相关规定，一旦完成购买和下载，本产品不支持退货或退款。请在购买前确认软件符合您的需求。如果对产品有任何疑问，请在购买前及时咨询客服（QQ 8872401）。

订单付款后，不支持取消和退款。购买数字资源前请谨慎，确保已详细了解产品内容。

如果源码需要远程部署，请及时联系我们的技术支持团队，我们将提供相应的技术支持，确保顺利使用。

环境配置

开发工具：
– PyCharm的安装包：PyCharm: Python IDE for Professional Developers
– PyCharm的历史安装包：PyCharm: Python IDE for Professional Developers
– Anaconda的安装包：Anaconda | Start Coding Immediately

语言环境：Python == 3.12.0
操作系统：Windows 11

依赖包：
– pip install numpy==2.3.3
– pip install opencv-python==4.12.0.88
– pip install pillow==11.3.0
– pip install PyQt==5.15.11
– pip install torch==2.7.0+cu118
– pip install torchvision== 0.22.0+cu118
– pip install matplotlib==3.10.7

算法概述

1.Swin Transformer
Swin Transformer由微软公司的研究人员推出，是一种有效结合了 CNN 和 Transformer模型优势的新型架构。它旨在以类似 CNN 的分层方式处理图像，同时利用变换器固有的自我关注机制。这种混合方法使 Swin 变换器能够有效处理各种规模的视觉信息，从而使其在广泛的视觉任务中具有高度的通用性和强大的功能。

Swin Transformer 的核心创新在于其分层结构和基于移位窗口的自我注意力机制。与标准视觉转换器（ViT）在整个图像中应用自我注意力不同，Swin Transformer将图像划分为不重叠的小窗口，在这些窗口内计算自我注意力，从而减少了计算复杂性。此外，Swin Transformer引入了窗口移位技术，使得在连续的Transformer块之间，图像区域能在不同层之间相互影响，从而更好地整合局部与全局上下文信息。

图1 Swin Transformer多层级表示和ViT对比

如图1所示，Swin Transformer从小的patch开始，通过在深层次逐步合并相邻patch的方式构建了一个层级化的表示。通过这些层级特征图，Swin Transformer可以像FPN和U-Net那样进行多尺度密集预测。通过对图像分区（用红色标出）进行非重叠窗口的局部自注意力计算实现了线性的计算复杂度。每个窗口的patch的个数是固定的，因此计算复杂度和图像的大小成线性关系。

相比于之前只能产生单一分辨率特征图和平方复杂度的Transformer模型，Swin Transformer适合作为各种视觉任务的通用主干网络（backbone）。

图2：Swin Transformer网络架构

该架构详细展示了 Swin-Transformer 模型如何通过逐层处理和 Patch Merging 实现高效的图像特征提取。每个阶段的 Swin Transformer Block 通过不同的自注意力机制（如 W-MSA 和 SW-MSA）逐步提升图像理解的深度。通过多层次的处理和特征合并，该模型在处理大规模图像数据时表现出色，特别适合于图像分类和目标检测等任务。

Swin Transformer解决了以往基于 CNN 和 Transformer的模型的几个局限性。首先，它的分层设计可以高效处理多种分辨率的图像，有助于完成需要同时了解精细细节和整体结构的任务，如物体检测和语义分割。其次，通过将自我关注机制定位到窗口并采用移位窗口，Swin Transformer 大幅降低了计算要求，使其更易于扩展到大型图像和数据集。最后，它的架构通过将局部特征无缝集成到更广泛的上下文中，实现了更好的特征学习，从而提高了各种视觉任务的性能。

系统设计

本系统实现了房性传导阻滞、新冠病毒、心肌损伤、心肌梗死和心脏正常的心电图图像自动化诊断，采用“数据输入—模型推理—结果展示”流程，结合Swin Transformer模块，精准区分病变，辅助医生提高诊断效率。

图3 诊断系统整体流程图

数据集构建

1.数据来源
本数据集包含房性传导阻滞、新冠病毒、心肌损伤、心肌梗死和心脏正常的心电图图像，来自医学标准数据库（如PhysioNet、MIMIC-III），均为经伦理审批的合法样本。数据用于Swin Transformer模型训练与验证，助力心脏疾病早期智能诊断研究。

表1 数据集基本信息

图4 数据集图片

2.分类格式
该格式用于图像分类任务，广泛应用于包括Swin Transformer在内的深度学习模型训练。数据集中的图像将根据类别进行分类，以确保数据与模型的高效匹配，从而提升分类精度和推理效率。

图5 分类数据集格式

3.数据集划分
本研究使用的分类图像数据集仅包含按类别整理的图像文件，该数据集适用于图像分类任务，用于模型的训练与验证。

图5 数据集划分：测试集和训练集

模型训练

Swin Transformer是一种常用于图像分类的深度学习模型。其训练过程包括超参数设置、模型训练及结果可视化。通过分层结构与移位窗口自注意力机制，模型能高效提取局部与全局特征，提升分类精度与效率。在大规模数据集上，Swin Transformer表现出优异的分类性能与计算效率。

图6 模型训练流程图

1.配置文件与超参数设置
以下是关于Swin Transformer模型训练过程中的配置文件和超参数设置，并通过配置文件以及相关参数进行训练设置。

表2 Swin Transformer模型训练超参数设置

2.模型性能评估
在 Swin Transformer模型的训练过程中，模型性能评估是衡量其在图像分类任务中表现的重要环节，能够全面反映模型在分类精度和泛化能力方面的表现。科学而准确的评估不仅有助于揭示模型的优势与不足，还能为后续的改进与优化提供可靠依据。
（1）训练与验证准确率和损失曲线

图7 Swin Transformer训练与验证准确率和损失曲线

该图显示训练准确率和验证准确率随轮次提升逐渐上升，最终稳定在约0.95，说明模型收敛良好且未过拟合。训练损失与验证损失同步下降并趋于平稳，表明模型在训练过程中不断优化，具有较强的泛化能力。整体而言，模型表现稳定，能有效完成心电图图像分类任务。

（2）混淆矩阵热力图

图8 Swin Transformer混淆矩阵热力图

从混淆矩阵热力图可见，模型在所有类别中的预测准确度很高，特别是新冠病毒（COVID-19）和心肌梗死（MI）几乎无误分类，准确率接近1.0。房性传导阻滞（AHB）虽有少量误分类为心肌损伤（HMI），但整体表现优秀。心脏正常的预测准确率也很高，误差较小，显示模型具有强大的分类能力。

（3）各类的分类性能评估：准确率、精确率、召回率与F1分数图

图9 各类的分类性能评估：准确率、精确率、召回率与F1分数图

这张图显示，基于 Swin Transformer 的心电图分类模型准确率为 0.97，精确率和召回率均表现优异，所有类别的精确率在 0.93 以上，特别是新冠病毒和心肌梗死的精确率达到 1.00。房性传导阻滞的召回率略低（0.90），表明存在轻微漏检。F1-score 高于 0.94，体现了精确率与召回率的良好平衡。整体来看，该模型具有较强的分类精度和临床应用潜力。

（4）训练日志（Training Log）
训练日志记录了Swin Transformer模型在训练过程中的详细信息，包括训练轮次、每轮的损失值、验证准确率以及训练时间等，这些信息帮助评估模型的训练效果和性能。

图10 Swin Transformer训练日志

训练轮次30轮，耗时约26分钟，训练损失从0.555降至0.137，验证准确率从0.739提升至0.969。
训练结果显示，模型在30个训练周期后成功，准确率大幅提升，具备了很好的应用前景。

该系统硬件配置如下，如果您的电脑配置低于下述规格，模型训练时间及结果可能会与本系统的训练日志存在差异，请注意。

表3 电脑硬件配置

功能展示

本系统基于Swin Transformer模型，实现心电图图像自动分类与诊断，集成特征提取、分类推理与结果可视化，为心电图智能诊断和临床辅助提供支持。

1. 系统主界面展示

图11 系统主界面

2. 图片检测功能

图12 房性传导阻滞

图13 心冠病毒

图14 心肌梗死

图15 心肌损伤

图16 心脏正常

3. 保存结果

图17 结果保存

4. 生成医疗影像诊断报告

图18 成功生成医疗影像诊断报告

图19 诊断报告

界面设计

本系统的图形用户界面采用PyQt5框架开发，致力于打造直观、高效且流畅的交互体验。通过精心设计的界面布局和模块化架构，系统功能得以清晰呈现，并确保各项操作的高效执行，全面提升用户使用体验。

图17 PyQt5主控面板界面

该界面展示了基于PyQt5框架精心设计的诊断系统，界面布局简洁、直观且高度集成。通过巧妙的模块化设计，系统涵盖了多项功能模块，确保用户能够高效、流畅地进行操作与交互，充分体现了系统在医学领域中的智能化与人性化设计。

文件清单

1.核心文件

2.训练文件

3.训练模型

4.界面文件

5.数据集文件

服务项目

联系我们

官方声明

（1）实验环境真实性与合规性声明：
本研究所使用的硬件与软件环境均为真实可复现的配置，未采用虚构实验平台或虚拟模拟环境。实验平台为作者自主购买的惠普（HP）暗影精灵 10 台式整机，具体硬件参数详见表。软件环境涵盖操作系统、开发工具、深度学习框架等，具体配置详见表，所有软件组件均来源于官方渠道或开源社区，并按照其许可协议合法安装与使用。

研究过程中严格遵循学术诚信和实验可复现性要求，确保所有实验数据、训练过程与结果均可在相同环境下被重复验证，符合科研规范与工程实践标准。

（2）版权声明：
本算法改进中涉及的文字、图片、表格、程序代码及实验数据，除特别注明外，均由2zcode.Bob独立完成。未经2zcode官方书面许可，任何单位或个人不得擅自复制、传播、修改、转发或用于商业用途。如需引用本研究内容，请遵循学术规范，注明出处，并不得歪曲或误用相关结论。

本研究所使用的第三方开源工具、框架及数据资源均已在文中明确标注，并严格遵守其相应的开源许可协议。使用过程中无违反知识产权相关法规，且全部用于非商业性学术研究用途。

声明：本站所有项目资源都可以正常运行，亲测无错！而且我们录制了演示视频，在我们注明的环境版本下，项目运行效果完全和演示视频一致。客服QQ：下载须知

基于Swin Transformer的心电图图像分类与诊断系统

项目信息

法律声明

环境配置

算法概述

系统设计

数据集构建

模型训练

功能展示

界面设计

文件清单

服务项目

联系我们

官方声明

评论(0)

提示：请文明发言取消回复

作者信息

文章展示

基于深度学习的河南特色农产品自动识别系统

基于深度学习的中国交通警察手势识别与指令优先级判定系统

基于Swin Transformer的帕金森症手绘图像分类与诊断系统