0

0

当FAIR1M遇上PaddleDetection 2.0

P粉084495128

P粉084495128

发布时间:2025-07-25 10:17:37

|

741人浏览过

|

来源于php中文网

原创

本文介绍将FAIR1M数据集与PaddleDetection 2.0结合的实践。先处理FAIR1M数据,解压后移除4张测试图,转为COCO格式;再安装PaddleDetection及旋转框算子,选用S2ANet模型,配置相关yml文件后训练,最后用测试图预测。训练有警告,预测角度有偏差,部分bug待修复。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

当fair1m遇上paddledetection 2.0 - php中文网

当FAIR1M遇上PaddleDetection 2.0

  • FAIR1M数据集1.0版本中包含了超过15000幅分辨率优于1米、尺寸从上千到上万像素不等的图像,其中包含了100多万精细化标注、具有任意角度分布的实例,场景覆盖全球上百个典型城市、乡镇,以及常用机场、港口等。同时根据遥感应用的实际需求,FAIR1M数据集将地物要素和典型目标进一步进行类型的细分。例如,依据型号将飞机细分为波音式(波音737、747、777和787等)、空客式(空客220、321、330和350等)以及国产式飞机(C919和ARJ21等)。目前已发布的FAIR1M数据集1.0版本中一共包含37个精细划分的类别。该数据集建设过程中得到了国家高分辨率对地观测系统重大科技专项支持,并于2021年2月被遴选为ISPRS科学创新项目(2021年度全球共7项),成为该协会高分辨率卫星图像目标识别研究的公开标准数据集。

    数据地址:http://gaofen-challenge.com/

当FAIR1M遇上PaddleDetection 2.0 - php中文网        

  • PaddleDetection飞桨目标检测开发套件,旨在帮助开发者更快更好地完成检测模型的组建、训练、优化及部署等全开发流程。PaddleDetection模块化地实现了多种主流目标检测算法,提供了丰富的数据增强策略、网络模块组件(如骨干网络)、损失函数等,并集成了模型压缩和跨平台高性能部署能力。目前PaddleDetection已经推出了最新的2.0版本,新增倾斜框的检测、高性价比的PPYOLO新品以及Anchor Free的SOTA模型PAFNet。

    github:https://github.com/PaddlePaddle/PaddleDetection

    gitee:https://gitee.com/paddlepaddle/PaddleDetection

0. 数据处理

0.1 解压数据集

解压数据集并且换个地方保存,方便自己管理文件。目前在官网下载的FAIR1M貌似只有part1,也就是1700多张图像,然后我看了一下找了四张不太一张的图像,作为我们结果的测试吧,我们把它们从训练数据中删除。

In [ ]
! unzip -oq /home/aistudio/data/data77871/FAIR1M.zip! mkdir -p datasets
! mv train/part1/images datasets
! mv train/part1/labelXmls datasets
! rm -rf train
   
In [ ]
# 移除用来测试的4张import os

img_path = 'datasets/images'xml_path = 'datasets/labelXmls'names = ['1054.tif', '1066.tif', '1131.tif', '1442.tif']for name in names:
    _img = os.path.join(img_path, name)
    _xml = os.path.join(xml_path, name.replace('.tif', '.xml'))    if os.path.exists(_img):
        os.remove(_img)    if os.path.exists(_xml):
        os.remove(_xml)print('ok')
   

0.2 转换为COCO数据集

由于这个数据集不是标准的VOC格式,然后PaddleDetection的旋转框需要COCO格式的数据集,因此需要想办法转到COCO的格式。因为平时几乎没怎么做检测的任务,那些格式也不太清楚,卡了一下。后来想到一个曲线救国的方法,就是DOTA数据提供了转为COCO的代码,而这个数据集和DOTA的内容有点像(虽然格式啥的完全也不一样)。于是我写了一个fair1m2dota先把数据转为DOTA的数据,再修改dota2coco以此得到需要的COCO数据格式。DOTA 数据集中实例是按照任意四边形标注,最后转换成[xc, yc, bow_w, bow_h, angle]的格式。

In [ ]
! pip -q install shapely# 转化为cocofrom fair1m2coco import func2

func2('datasets', 'datasets/train.json')
   

1. 安装所需

由于旋转框需要额外的算子,所以这里需要安装旋转框的额外算子。

CreateWise AI
CreateWise AI

为播客创作者设计的AI创作工具,AI自动去口癖、提交亮点和生成Show notes、标题等

下载
In [ ]
# 克隆paddleDetection# ! git clone https://gitee.com/PaddlePaddle/PaddleDetection.git%cd PaddleDetection# 安装所需要的包! python setup.py install# 安装检测框所需要的算子%cd /home/aistudio/PaddleDetection/ppdet/ext_op
! python setup.py install# ! python test.py  # 测试算子
   

2. S2ANet

目前官方在旋转框上使用的模型为S2ANet模型。感觉除了论文也没多少人解读,检测不是特别懂,就不乱说细节了。

当FAIR1M遇上PaddleDetection 2.0 - php中文网        

3. 开始训练

在configs中新建自己任务的yml,参考dota的yml,设置好数据路径、轮数等等什么的,就可以开始跑了。

  • s2anet_fair1m.yml:基本的yml;
  • s2anet_reader.yml:在base下面,这里我啥也没改,参考吖吖查大佬所述,batchsize大于1会报错,还在修复,所以我也保持的1;
  • s2anet.yml:在base下面,网络的一些设置,不太清楚也没怎么改,也就是设置下权重和num_classes;
  • s2anet_optimizer_1x.yml:在base下面,学习率和轮数什么的可以在这里设置;
  • runtime.yml:在上一级,这里可以设置保存间隔和路径等等;
  • dota.yml:在datasets下面,里面需要设置一下数据的路径,需要注意test的anno_path设置为训练的json,否则会使用COCO默认的标签。

然后据吖吖查大佬所述,加上eval会导致报错,所以这里也没有进行验证,只能通过loss来查看训练的如何。

In [ ]
%cd /home/aistudio
! mkdir -p /home/aistudio/log
%cd PaddleDetection
! python tools/train.py -c configs/dota/s2anet_fair1m.yml -o use_gpu=true --use_vdl=True --vdl_log_dir=/home/aistudio/log
   

有很多这样的警告,我感到莫名其妙,明明都跑起来了,还说框有问题。

ppdet.data.source.coco WARNING: Found an invalid bbox in annotations: im_id: 1318, area: 0.0 x1: -0.5, y1: 96.5, x2: 0.5, y2: 97.5.
       

训练结果如下:

ppdet.engine INFO: Epoch: [29] [1700/1728] learning_rate: 0.000001 fam_cls_loss: 0.082565 fam_reg_loss: 0.036638 odm_cls_loss: 0.090113 odm_reg_loss: 0.111688 loss: 0.352884 eta: 0:00:06 batch_cost: 0.2364 data_cost: 0.0001 ips: 4.2298 images/s
   

4. 图像预测

预测的图像不知为何tif就没办法了,只得将jpg的图像放在了test_img中,用于预测,结果都保留在output中。

In [3]
%cd /home/aistudio/PaddleDetection
! python tools/infer.py -c configs/dota/s2anet_fair1m.yml \
    -o weights=output/s2anet_fair1m/model_last.pdparams \
    --infer_dir=test_img \
    --draw_threshold=0.5 \
    --output_dir=output
   

这里显示一下,看看大概的效果。这个图太大了,这样压缩在里面看不太清,可以去output中找到对应的原图。

In [2]
import matplotlib.pyplot as pltimport cv2

%matplotlib inline

names = ['1054.jpg', '1066.jpg', '1131.jpg', '1442.jpg']
plt.figure(figsize=(20,20))for i, name in enumerate(names):
    img_path = '/home/aistudio/PaddleDetection/output/' + name
    img = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB)
    plt.subplot(2, 2, (i + 1));plt.imshow(img)
plt.show()
       
<Figure size 1440x1440 with 4 Axes>
               

总结说明

  • 大体看效果还可,总算转起来啦,但是旋转的角度感觉有偏差,应该是在转换中精度有所损失;
  • 目前PaddleDetection的旋转框还有点bug在修改,后面肯定会越来越好用的;
  • 关于警告数据集的事,实在搞不懂,请教JavaRoom大佬了,有知道的朋友欢迎评论区指导一下;
  • 由于发布新版本时PPDet超过了1000个文件,所以把其中的docs、demo、静态的contrib和静态的configs都删除了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析的方法
数据分析的方法

数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。php中文网为大家带来了数据分析的相关知识、以及相关文章等内容。

504

2023.07.04

数据分析方法有哪几种
数据分析方法有哪几种

数据分析方法有:1、描述性统计分析;2、探索性数据分析;3、假设检验;4、回归分析;5、聚类分析。本专题为大家提供数据分析方法的相关的文章、下载、课程内容,供大家免费下载体验。

292

2023.08.07

网站建设功能有哪些
网站建设功能有哪些

网站建设功能包括信息发布、内容管理、用户管理、搜索引擎优化、网站安全、数据分析、网站推广、响应式设计、社交媒体整合和电子商务等功能。这些功能可以帮助网站管理员创建一个具有吸引力、可用性和商业价值的网站,实现网站的目标。

759

2023.10.16

数据分析网站推荐
数据分析网站推荐

数据分析网站推荐:1、商业数据分析论坛;2、人大经济论坛-计量经济学与统计区;3、中国统计论坛;4、数据挖掘学习交流论坛;5、数据分析论坛;6、网站数据分析;7、数据分析;8、数据挖掘研究院;9、S-PLUS、R统计论坛。想了解更多数据分析的相关内容,可以阅读本专题下面的文章。

534

2024.03.13

Python 数据分析处理
Python 数据分析处理

本专题聚焦 Python 在数据分析领域的应用,系统讲解 Pandas、NumPy 的数据清洗、处理、分析与统计方法,并结合数据可视化、销售分析、科研数据处理等实战案例,帮助学员掌握使用 Python 高效进行数据分析与决策支持的核心技能。

82

2025.09.08

Python 数据分析与可视化
Python 数据分析与可视化

本专题聚焦 Python 在数据分析与可视化领域的核心应用,系统讲解数据清洗、数据统计、Pandas 数据操作、NumPy 数组处理、Matplotlib 与 Seaborn 可视化技巧等内容。通过实战案例(如销售数据分析、用户行为可视化、趋势图与热力图绘制),帮助学习者掌握 从原始数据到可视化报告的完整分析能力。

60

2025.10.14

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

136

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

47

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号