0

0

数据增广+手势识别[Paddlehub+PaddleX]

P粉084495128

P粉084495128

发布时间:2025-07-28 10:50:17

|

699人浏览过

|

来源于php中文网

原创

作者为提升手势识别在复杂背景下的准确率,用Paddlehub的deeplabv3p_xception65_humanseg模型抠出手势,与复杂背景图合成增广数据,将“5”手势与其他手势作二分类。增广后“5”的样本从979张增至2988张,再用PaddleX的MobileNetV3_small_ssld模型训练30个epoch,测试效果良好,摄像头实测表现佳。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

数据增广+手势识别[paddlehub+paddlex] - php中文网

使用Paddlehub 和 PaddleX完成数据的增广和训练~       

大家好,我是只会心疼giegie的桨师,最近因为想做一个手势相关的小游戏,所以看了一下手势识别。但是目前搜到的数据集中,手势识别的背景都是纯色(纯白或是纯绿),一旦在验证的时候背景变得复杂,则准确率会大大降低。
既然如此......那就来做个数据增广吧,把这些数据集里的手全都抠出来,然后贴到复杂场景里就行了。那把手抠出来......当然优先选择 Paddlehub

模型

当然我并没有使用ace2p这种更细粒度的模型,而是使用了deeplabv3p_xception65_humanseg,不因为别的,只是因为我顺手......这个模型用得很熟练哈哈

用到的数据集

手势数据集:aistudio前排手势的数据基本上都用了,因为还有背景数据,用的比较多,一个项目好像只能索引两个数据集,所以我就不引入了,以防不公平,这里把链接贴出来。 手势识别
手势
gesture
手势
手势_石头剪头布
背景数据集,我直接使用的我本地的图,只有上次从ADE2K里挑出来的segsky分割出的数据了。
segsky

墨鱼aigc
墨鱼aigc

一款超好用的Ai写作工具,为用户提供一键生成营销广告、原创文案、写作辅助等文字生成服务。

下载

任务

由于我的任务只需要检测到“5”的手势,所以这里是一个简单的2分类,区分“5”及其他
增广前的“5”
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
增广后的“5”
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
增广前的“其他”
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
增广后的“其他”
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
一方面为手势增加了背景,另一方面让数据变得更多了
经过筛选,5的数据原本979张,增广后2988张

In [ ]
import paddlehub as hubimport cv2import numpy as npimport globimport osimport randomimport argparseclass segUtils():
    def __init__(self):
        super().__init__()
        self.module = hub.Module(name="deeplabv3p_xception65_humanseg")    def doseg(self, frame):
        res = self.module.segmentation(images=[frame], use_gpu=True)        return res[0]['data']def randomCrop(frame, h, w):
    bh, bw = frame.shape[:2]    if bw - w > 0 and bh - h > 0:
        randx = random.randint(0, bw - w)
        randy = random.randint(0, bh - h)        return frame[randy:randy + h,randx:randx + w]    else:        return cv2.resize(frame, (w, h))def main(args):

    backlist = glob.glob(os.path.join(args.backdir, "*.jpg"))
    handlist = glob.glob(os.path.join(args.handdir, "*.png")) + glob.glob(os.path.join(args.handdir, "*.jpg"))    print("back image: ", len(backlist))    print("hand image: ", len(handlist))
    save_dir = args.savedir    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
        SU = segUtils()        for handpath in handlist:
            img = cv2.imread(handpath)
            basename = os.path.basename(handpath)
            filename, ext = os.path.splitext(basename)
            mask = SU.doseg(img)
            mask[mask <= 1] = 0
            mask[mask > 1] = 1
            
            mask = np.repeat(mask[:,:,np.newaxis], 3, axis=2)
            h,w = img.shape[:2]            for i in range(2):
                rback = cv2.imread(backlist[random.randint(0, len(backlist)-1)])
                crop = randomCrop(rback, h, w)
                res = mask * img + (1 - mask) * crop
                newname = filename + str(i) + ext
                cv2.imwrite(os.path.join(save_dir,newname), res.astype(np.uint8))if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("--backdir", type=str, required=True)
    parser.add_argument("--handdir", type=str, required=True)
    parser.add_argument("--savedir", type=str, required=True)
    args = parser.parse_args()
    main(args)
   

训练

至于训练,当然是直接paddleX啦,直接用GUI版本的快速验证自己的想法啦,快速的选择分类模型,开始吧~ 选择的MobileNetV3_small_ssld这个模型,batchsize32,训练了30个epoch,太过简单,就不写流程了。数据增广+手势识别[Paddlehub+PaddleX] - php中文网 数据增广+手势识别[Paddlehub+PaddleX] - php中文网        

测试

一些测试结果图,效果完全OK哈哈哈
数据增广+手势识别[Paddlehub+PaddleX] - php中文网数据增广+手势识别[Paddlehub+PaddleX] - php中文网数据增广+手势识别[Paddlehub+PaddleX] - php中文网数据增广+手势识别[Paddlehub+PaddleX] - php中文网数据增广+手势识别[Paddlehub+PaddleX] - php中文网
本地开着摄像头视频做了一些测试,效果还不错,但是忘了保存视频了,之后补上。

In [ ]
# 验证 上传一张test.jpg的图片进行测试吧!python predict.py
   

相关专题

更多
c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

17

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

22

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

91

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

124

2026.01.23

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

14

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

65

2026.01.22

PHP后端开发相关内容汇总
PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容,阅读专题下面的文章了解更多详细内容。

59

2026.01.22

php会话教程合集
php会话教程合集

本专题整合了php会话教程相关合集,阅读专题下面的文章了解更多详细内容。

61

2026.01.22

宝塔PHP8.4相关教程汇总
宝塔PHP8.4相关教程汇总

本专题整合了宝塔PHP8.4相关教程,阅读专题下面的文章了解更多详细内容。

33

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 17.7万人学习

Django 教程
Django 教程

共28课时 | 3.4万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号