0

0

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

王林

王林

发布时间:2023-10-30 16:01:08

|

940人浏览过

|

来源于51CTO.COM

转载

目前,虽然在人体全身姿态与体型估计(EHPS, Expressive Human Pose and Shape estimation)方面已经取得了很大的研究进展,但是最先进的方法仍然受限于训练数据集的限制

最近,南洋理工大学S-Lab、商汤科技、上海人工智能实验室、东京大学和IDEA研究院的研究人员首次提出了针对人体全身姿态与体型估计任务的动捕大模型SMPLer-X。该研究使用了来自不同数据源的多达450万个实例对模型进行训练,在7个关键榜单上都取得了最佳性能

SMPLer-X不仅可以捕捉身体动作,还可以输出面部和手部动作,并对体型进行估计

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

论文链接:https://arxiv.org/abs/2309.17448

项目主页:https://caizhongang.github.io/projects/SMPLer-X/

凭借丰富的数据和庞大的模型,SMPLer-X在各种测试和排行榜上展现出强大的性能,甚至在未知环境中也具备出色的通用性

在数据扩展方面,研究人员对32个3D人体数据集进行了全面的评估和分析,以为模型训练提供参考

2. 在模型缩放方面,使用视觉大模型来研究增加模型参数量对性能的提升效果

3. 通过微调策略可以将SMPLer-X通用大模型转变为专用大模型,使其能够实现进一步的性能提升。

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

综上所述,SMPLer-X进行了数据缩放与模型缩放的探索(见图1),并在32个学术数据集上进行排名,同时在其450万个实例上进行训练,在包括AGORA、UBody、EgoBody和EHF在内的7个关键榜单上均实现了最佳性能

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

Figure 1 增大数据量和模型参数量在降低关键榜单(AGORA、UBody、EgoBody、3DPW 和 EHF)的平均主要误差(MPE)方面都是有效的

对现有的3D人体数据集进行泛化性研究

研究人员对32个学术数据集进行了排名:为了衡量每个数据集的性能,需要使用该数据集训练一个模型,并在五个评估数据集上评估模型:AGORA、UBody、EgoBody、3DPW和EHF。

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

表中还计算了平均主要误差(Mean Primary Error, MPE),以便于在各个数据集之间进行简单比较。

从研究数据集泛化性得到的启示

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

通过对大量数据集的分析(见图3),可以得出以下四个结论:

1. 关于单一数据集的数据量,10万个实例数量级的数据集用于模型训练可以得到较高的性价比;

2. 关于数据集的采集场景,In-the-wild数据集的效果最佳。如果只能在室内采集数据,为了提升训练效果,需要避免使用单一场景的数据

关于数据集的采集,排名前三的数据集中有两个是生成的数据集。近年来,生成数据集展现出了强大的性能

关于数据集的标注,伪标签在训练中也扮演了非常重要的角色

动捕大模型的训练与微调

现今最先进的方法通常只使用少数几个数据集(例如,MSCOCO、MPII和Human3.6M)进行训练,而本文研究了使用更多的数据集

Type Studio
Type Studio

一个视频编辑器,提供自动转录、自动生成字幕、视频翻译等功能

下载

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

在考虑到排名较高的数据集为首选的前提下,我们使用了四种不同的数据量:分别是作为训练集的5、10、20和32个数据集,总大小分别为75万、150万、300万和450万个实例

除此之外,研究人员也展示了低成本的微调策略来将通用大模型适应到特定场景。

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

上表中展示了部分主要测试,如AGORA测试集(表3)、AGORA验证集(表4)、EHF(表5)、UBody(表6)、EgoBody-EgoSet(表7)。

此外,研究人员还对动捕大模型的泛化性进行了在ARCTIC和DNA-Rendering两个测试集上的评估

研究人员希望SMPLer-X能带来超出算法设计的启发,并为学术社区提供强大的全身人体动捕大模型。

代码和预训练模型已经在项目主页开源,欢迎访问https://caizhongang.github.io/projects/SMPLer-X/ ,了解更多详情

结果展示

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

SMPLer-X:颠覆七大榜单,呈现首个人体动捕基模型!

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

208

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

295

2023.10.25

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

722

2026.01.21

idea快捷键大全
idea快捷键大全

本专题为大家提供idea快捷键相关的文章,帮助大家解决问题。

166

2023.08.03

idea如何集成Tomcat
idea如何集成Tomcat

idea集成Tomcat的步骤:1、添加Tomcat服务器配置;2、配置项目部署;3、运行Tomcat服务器;4、访问项目;5、注意事项;6、关闭Tomcat服务器。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

169

2024.02.23

idea怎么配置maven
idea怎么配置maven

idea配置maven的步骤:1、打开intellij idea,并确保已安装maven integration插件,可以在"file"菜单中选择"settings",然后在"plugins"选项卡中搜索并安装maven integration插件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

119

2024.02.23

eclipse和idea有什么区别
eclipse和idea有什么区别

eclipse和idea的区别:1、平台支持;2、内存占用;3、插件系统;4、智能代码提示;5、界面设计;6、调试功能;7、学习曲线。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

136

2024.02.23

webstorm和idea有什么区别
webstorm和idea有什么区别

webstorm专为web开发量身定制,提供针对web开发语言的强大功能,而intellij idea是支持多种语言的多功能ide。它们的差异主要在于语言支持、web开发特性、代码导航、调试和测试功能、附加特性。最终选择取决于语言偏好和项目需求。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

327

2024.04.09

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.5万人学习

Go 教程
Go 教程

共32课时 | 4.2万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号