0

0

百度网盘AI大赛:手写文字擦除(赛题二)Baseline

P粉084495128

P粉084495128

发布时间:2025-07-17 17:04:12

|

652人浏览过

|

来源于php中文网

原创

AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,产出基于飞桨框架的开源模型方案。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘ai大赛:手写文字擦除(赛题二)baseline - php中文网

1.大赛背景

百度网盘AI大赛——图像处理挑战赛是 百度网盘开放平台 面向AI开发者和爱好者发起的计算机视觉领域挑战赛。AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,完成模型设计搭建与训练优化,产出基于飞桨框架的开源模型方案,为中国开源生态建设贡献一份力量。

本次图像处理挑战赛以线上比赛的形式进行,参赛选手需要在规定时间内,完成模型设计搭建与训练优化,并提交基于评测数据集产出的结果文件,榜单排名靠前且通过代码复查的队伍可获得高额奖金。

百度网盘开放平台 致力于为全球AI开发者和爱好者提供专业、高效的AI学习与开发环境,挖掘培养AI人才,助力技术产业生态发展。我们向所有胸怀梦想的开发者发出邀请,希望大家能与百度一起,用技术让复杂的世界变得更简单。

2.数据集简介

比赛数据集

在本次比赛最新发布的数据集中,所有的图像数据均由真实场景采集得到,再通过技术手段进行相应处理,生成可用的脱敏数据集。该任务为image-to-image的形式,因此源数据和GT数据均以图片的形式来提供。各位选手可基于本次比赛最新发布的训练数据快速融入比赛,为达到更好的算法效果,本次比赛不限制大家使用额外的训练数据来优化模型。测试数据集的GT不做公开,请各位选手基于本次比赛最新发布的测试数据集提交对应的结果文件。 备注: 百度网盘坚持隐私红线,不会收集或者提供任何用户存储在百度网盘中的文件数据。

数据集构成

|- root  
    |- images
    |- gts

本次比赛最新发布的数据集共包含训练集、A榜测试集、B榜测试集三个部分,其中训练集共1000个样本,A榜测试集共200个样本,B榜测试集共200个样本; images 为带手写文字的源图像数据,gts 为无手写文字的真值数据(仅有训练集数据提供gts ,A榜测试集、B榜测试集数据均不提供gts); images 与 gts 中的图片根据图片名称一一对应。

数据集下载

本次比赛将提供带有手写文字的文档图片作为比赛数据集。 其中,训练集1000张,A榜测试数据集共200张,B榜测试数据集共200张。

官网有训练集和测试集链接,但训练集只有原始图和GT图,作者在这儿做了一份粗略的MASK图以更好的适应模型的训练:下载路径

3.Baseline模型EraseNet介绍

Introduction

文字擦除的意义

  • 隐私保护
  • 有助于文字编辑

挑战

  • 定位文字内容
  • 合理填充前景
  • 背景保持原样

示例

百度网盘AI大赛:手写文字擦除(赛题二)Baseline - php中文网

Architecture

百度网盘AI大赛:手写文字擦除(赛题二)Baseline - php中文网

  • G network是一个由coarse和refinement组成的two-stage network
  • 作者设计了一个segmentation head,用来输出text mask,帮助模型更好的定位mask区域
  • 使用local-global SN-Patch-GAN去让GAN的训练过程更加稳定

Coarse-Erasure Sub-Network

该结构类似于UNet的FCN结构,其中在特征图叠加时采用下图的lateral concatenations的设计,这种设计保证了concat过程中feature map的非线性程度。百度网盘AI大赛:手写文字擦除(赛题二)Baseline - php中文网

PhotoScissors
PhotoScissors

免费自动图片背景去除

下载

Refinement Sub-Network

该部分是Coarse Network的输出,该输出由于监督信号不足的原因导致图像中还包含部分文本信息,因此作者在加一个阶段去细化生成图像。

Segmentation Head

Segmentation Head作为辅助路径能够更好的为Coarse阶段隐式的定位文本位置。

Global and local discriminator

该结构通过全局和局部鉴别,保证了整体的一致性和局部的敏感性。百度网盘AI大赛:手写文字擦除(赛题二)Baseline - php中文网

4.训练及测试

4.1 准备数据集

In [ ]
%cd /home/aistudio/data/
!unzip /home/aistudio/data/data121581/dehw_testA_dataset.zip!unzip /home/aistudio/data/data121581/dehw_train_dataset.zip!unzip /home/aistudio/data/data122013/mask.zip%mv mask/ dehw_train_dataset/

解压数据集之后,数据集目录如下:

| dehw_testA_dataset/
        -images| dehw_train_dataset/
        -gts        -images        -mask

其中mask 分支为手写文字的掩码,通过滤波算法生成的。

4.2 启动训练命令

In [ ]
%cd /home/aistudio/work/
!python train.py --dataset_root ../data/dehw_train_dataset/ --max_epochs 100 --batch_size 3 --sample_interval 100 --log_iters 100

4.3 启动测试命令

运行结束后,结果文件保存在train_result/model文件夹中,通过--pretrained选择训练模型的路径进行预测

In [ ]
!python test.py --dataset_root ../data/dehw_testA_dataset/ --pretrained model.pdparams

保存的文件在test_result路径中,进入该路径创建readme.txt文件,输入要求的内容:

训练框架:PaddlePaddle
代码运行环境:V100
是否使用GPU:是
单张图片耗时/s:0.06
模型大小:75MB
其他说明:该算法参考EraseNet

然后压缩所有文件

In [ ]
%cd test_result/
!zip -D result.zip ./*

相关专题

更多
golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

75

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

60

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

40

2025.11.27

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

406

2023.08.14

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

58

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

57

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

237

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

393

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 21.5万人学习

Django 教程
Django 教程

共28课时 | 3.5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号