基于Paddle2.0的注意力卷积网络SA-NET

P粉084495128

发布时间：2025-07-23 11:18:55

405人浏览过

来源于php中文网

原创

本项目基于2021年ICASSP论文的SA-NET模型，用paddle2.0复现含Shuffle Attention模块的网络，在10分类动物数据集（按8:2划分训练、验证集）上实验。对比SA-ResNet50与ResNet50，前者验证准确率达86.78%，通过图示训练过程及结果，展现SA模块融合空间与通道注意力的优势。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于paddle2.0的注意力卷积网络sa-net - php中文网

项目背景

SA-NET是2021年ICASSP上的一篇论文SA-Net: Shuffle Attention for Deep Convolutional Neural Networks中提出的基于注意力机制的卷积网络模型。本项目即对其进行复现。

计算机视觉领域的注意力机制主要涵盖空间注意力和通道注意力两个方面。其中空间注意力用来捕获像素间的关系，而通道注意力用来捕获通道间的关系。SA-NET提出了一个将空间注意力和通道注意力融合起来的模块Shuffle Attention(SA)。本项目复现SA-NET并用其来完成动物图像分类的实验。

项目简介

本项目首次使用paddle2.0复现了含有注意力机制的网络SA-NET，并在动物数据集上进行了训练和验证。

动物数据集的划分是按8:2的的划分方法进行训练集与验证集划分的。

模型简介

SA-NET网络的核心思想是提出了SA模块。该模块对分组卷积的每个组采取通道分割。对于通道注意力分支，采用全局平均池化产生通道相关的统计信息，然后使用参数来缩放和平移通道矢量并生成通道特征表达。对于空间注意力分支，采用组归一化来产生空间相关的统计信息并生成空间特征表达。将两个分支的特征合并后，使用channel shuffle操作来进行不同子特征间的通信。如图1所示。

图1 SA模块细节示意图

具体实现可以fork后见代码细节。

论文原文：SA-Net: Shuffle Attention for Deep Convolutional Neural Networks

参考代码：

BiLin AI

免费的多语言AI搜索引擎

下载

PyTorch的实现

数据集介绍

本项目使用10分类的动物数据集进行训练和测试.

该十分类动物数据集，包含dog,horse,elephant,butterfly,chicken,cat,cow,sheep,spider和squirrel。每一分类的图片数量为2k-5k。

文件结构

文件名或文件夹名	功能
sa_resnet.py	SA网络定义文件
animal_dataset.py	数据集定义文件
config.py	配置文件
train_val_split.py	训练验证划分文件
train.py	模型训练
eval.py	模型验证

解压数据集

In [ ]

!unzip -q data/data70196/animals.zip -d work/dataset

查看图片

In [ ]

import osimport randomfrom matplotlib import pyplot as pltfrom PIL import Image

imgs = []
paths = os.listdir('work/dataset')for path in paths:   
    img_path = os.path.join('work/dataset', path)    if os.path.isdir(img_path):
        img_paths = os.listdir(img_path)
        img = Image.open(os.path.join(img_path, random.choice(img_paths)))
        imgs.append((img, path))

f, ax = plt.subplots(3, 3, figsize=(12,12))for i, img in enumerate(imgs[:9]):
    ax[i//3, i%3].imshow(img[0])
    ax[i//3, i%3].axis('off')
    ax[i//3, i%3].set_title('label: %s' % img[1])
plt.show()

<Figure size 864x864 with 9 Axes>

划分训练集和验证集

In [ ]

!python code/train_val_split.py

finished train val split!

使用SA-ResNet50网络进行动物分类的训练并验证

In [1]

!python code/train.py --net 'sa_resnet'

验证

In [5]

!python code/eval.py --net 'sa_resnet'

Constructing sa_resnet50......
W0218 00:13:00.844122 29642 device_context.cc:362] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1
W0218 00:13:00.848348 29642 device_context.cc:372] device: 0, cuDNN Version: 7.6.
Eval begin...
The loss value printed in the log is the current batch, and the metric is the average value of previous step.
step 103/103 [==============================] - loss: 0.6799 - acc: 0.8678 - 215ms/step         
Eval samples: 3276
{'loss': [0.67990136], 'acc': 0.8678266178266179}

图示训练验证过程

图2. 使用SA-ResNet50的训练验证图示

使用ResNet50网络进行动物分类的训练并验证

训练

In [1]

!python code/train.py --net 'resnet'

验证

In [2]

!python code/eval.py --net 'resnet'

图示训练验证过程

图3. 使用ResNet的训练验证图示

比较

图4. 使用SA-NET和ResNet的验证比较图示

AutoGPT任务执行失败怎么办_AutoGPT问题处理方法【解答】

ChatGPT批量写工作总结怎么实现_高效提示方法是什么【介绍】

ChatGPT生成Python代码怎么提问_提示写法是什么【教程】

OpenClaw集成其他工具_OpenClaw集成使用方法【方法】

QClaw能不能帮我下载B站视频_QClaw资源下载技能与指令输入【解答】

相关专题

Golang channel原理

本专题整合了Golang channel通信相关介绍，阅读专题下面的文章了解更多详细内容。

261

2025.11.14

golang channel相关教程

本专题整合了golang处理channel相关教程，阅读专题下面的文章了解更多详细内容。

352

2025.11.17

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

469

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

272

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

热门下载

网站特效

网站源码

网站素材

前端模板