0

0

一块GPU,每秒20个模型!英伟达新玩具用GET3D造元宇宙

PHPz

PHPz

发布时间:2023-04-12 23:16:01

|

1439人浏览过

|

来源于51CTO.COM

转载

Abracadabra!

在2D生成3D模型上,英伟达亮出了自称「世界级」研究:GET3D。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

通过2D图像训练后,该模型可生成具有高保真纹理和复杂几何细节的3D形状。

图片

究竟有多厉害?

形状、纹理、材质自定义

GET3D之所以得名,是因为它能够生成显式纹理3D网格(Generate Explicit Textured 3D meshes )。

图片

论文地址:https://arxiv.org/pdf/2209.11163.pdf

也就是说,它创建的形状是三角形网格的形式,就像纸模型一样,上面覆盖着纹理材质。

关键是,这个模型可以生成多种多样,且高质量的模型。

比如,椅子腿上的各种轮子;汽车的车轮,灯和车窗;动物的耳朵、角;摩托车的后视镜,车轮胎上的纹理;高跟鞋,人类衣服...

街道两旁的独特建筑,不同的车辆呼啸而过,还有不同的人群穿梭而过...

若想通过手动建模做出同样的3D虚拟世界非常耗时。

尽管先前的3D生成AI模型虽然比手动建模更快,但它们在生成更多丰富细节模型的能力还是欠缺。

图片

即便是,最新的逆向渲染方法也只能基于从各个角度拍摄的2D图像生成3D对象,开发人员一次只能构建一个3D物体。

GET3D可就不一样了。

开发者可以轻松地将生成模型导入到游戏引擎、3D建模器和电影渲染器中,对它们进行编辑。

当创建者将GET3D生成的模型导出到图形应用程序,他们就可以在模型所在的场景中移动或旋转时应用逼真的照明效果。

如图所示:

图片

另外,GET3D还可以做到文本引导形状生成。

通过使用英伟达的另一个AI工具StyleGAN-NADA,开发人员可以使用文本提示为图像添加特定的风格。

比如,可以将渲染后的汽车变成一辆烧毁的汽车或出租车

将一个普通的房子改造成砖房、着火的房子,甚至是鬼屋。

图片

或者将老虎纹、熊猫纹的特色应用在任何动物身上...

图片

简直就是辛普森一家的「动物森友会」...

英伟达介绍,在单个英伟达GPU上训练,GET3D每秒可以生成大约20个对象。

在此,它所学习的训练数据集越大、越多样化,输出的多样性和详细程度就越高。

英伟达称,研究团队仅用2天时间,就使用A100 GPU在大约100万张图像上训练了模型。

研究方法与过程

GET3D框架,主要作用是合成有纹理的三维形状。

生成过程分为两个部分:第一部分是几何分支,可以输出任意拓扑结构的表面网格。另一部分则是纹理分支,它会产生一个纹理场,由此可以在表面点上进行查询。

图片

在训练过程中,一个可微分光栅化器被用来高效渲染所产生的纹理网格,并渲染成二维的高分辨率图像。整个过程是可分的,允许通过传播二维判别器的梯度,从图像中进行对抗性训练。

之后,梯度从二维判别器传播到两个发生器分支。

研究人员又进行了广泛的实验来评估该模型。他们首先将GET3D生成的三维纹理网格的质量与现有的使用ShapeNet和Turbosquid数据集生成的做比较。

接下来,研究人员根据对比结果在之后的研究中对模型进行了优化,并做了更多实验。

GET3D模型在几何形状和纹理能够实现相分离。

如图,在每一行中展示了由相同的几何隐藏代码生成的形状,同时更改了纹理代码。

在每一列中展示了由相同的纹理隐藏代码生成的形状,同时更改了几何代码。

另外,研究人员在每一行中相同的纹理隐藏代码生成的形状,从左到右插入几何隐藏代码。

并由相同的几何隐藏代码生成的形状,同时从上到下插入纹理代码。结果显示,每个插值对生成模型都是有意义的。

图片

在每个模型的子图中,GET3D能够在所有类别的不同形状之间的生成实现平滑过渡。

图片

在每一行中,通过添加一个小噪声来局部扰乱隐藏代码。通过这种方式,GET3D能够在局部生成外观相似但略有差异的形状。

图片

研究人员指出,未来版本的GET3D可以使用摄像机姿态估计技术,让开发人员训练模型的现实世界的数据,而不是合成数据集。

未来,通过改进,开发人员可以在各种3D形状上一次性训练GET3D,而不需要一次在一个对象类别上训练它。

英伟达人工智能研究副总裁Sanja Fidler表示,

GET3D让我们离人工智能驱动的3D内容创作大众化又近了一步。它即时生成带纹理3D形状的能力可能会改变开发人员的游戏规则,帮助他们用各种有趣的对象快速填充虚拟世界。

MagickPen
MagickPen

在线AI英语写作助手,像魔术师一样在几秒钟内写出任何东西。

下载

作者介绍

论文一作Jun Gao是多伦多大学机器学习小组的博士生,导师是Sanja Fidler。

除了学历优异以外,他还是英伟达多伦多人工智能实验室的研究科学家。

他的研究主要集中在深度学习(DL),目标直指结构化几何表示学习。同时,他的研究还从人类对2D和3D图像、视频的感知中获得见解。

这么一位优秀的高材生,来自北京大学。他于2018年本科毕业,获得学士学位。在北大期间,他和王立威教授一同工作。

毕业后他还在斯坦福大学、MSRA和英伟达进行过实习。

Jun Gao的导师同样是业内翘楚。

Fidler是多伦多大学的副教授,Vector研究所的一名教师,同时,她还是该研究所的联合创始成员之一。

教学之外,她还是英伟达公司的人工智能研究副总裁,领导着多伦多的一个研究实验室。

在来到多伦多之前,她是芝加哥丰田技术研究所的研究助理教授。该研究所位于芝加哥大学校园内,算是个学术机构。

Fidler的研究领域集中在计算机视觉(CV)和机器学习(ML),聚焦于CV和图形学的交叉领域、三维视觉,以及三维重建与合成,还有图像注释的互动方法等等。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2088

2024.08.16

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.6万人学习

Go 教程
Go 教程

共32课时 | 4.3万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号