0

0

英伟达为远程会议通话研发AI 3D视频聊天解决方案

WBOY

WBOY

发布时间:2023-08-23 18:49:01

|

1944人浏览过

|

来源于搜狐

转载

视频会议系统首次商用化于50多年前,它使人们能够与千里之外的同事、朋友或家人进行视听交流。视频会议的最终目标是实现远程参与者之间的沉浸式通信,仿佛大家身处同一地点

现有的3D视频会议系统虽然展示了捕捉眼神交流和其他非语言线索的潜力,但却需要昂贵的3D采集设备

在名为“AI-Mediated 3D Video Conferencing”的项目中,英伟达、美国加利福尼亚大学圣迭戈分校和北卡罗来纳大学教堂山分校的团队通过AI人工智能技术成功开发了一种高保真度、低成本的3D远程呈现方法,并且提供了以3D扫描为基础无法实现的新功能

此外,团队的解决方案兼容多种现有的3D显示器,包括立体显示器和光场显示器

延伸阅读:利用AI缩小体积,谷歌展示光场通话项目Project Starline新迭代

值得注意的是,谷歌正在利用人工智能来改进他们的光场通话项目Project Starline。简单来说,Project Starline是一个3D视频聊天室,利用光场技术创造出一种仿佛对方真的坐在你对面的感觉。这一创新性的远程通信工具结合了谷歌在硬件和软件方面的进步,旨在提升朋友、家人和同事在远程交流时的身临其境感

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

英伟达为远程会议通话研发AI 3D视频聊天解决方案

英伟达团队回到了他们的“AI-Mediated 3D Video Conferencing”项目,并在SIGGRAPH大会上展示了该设置,并撰写了相关介绍

英伟达为远程会议通话研发AI 3D视频聊天解决方案

图示系统包括一个sender,用于记录和传输来自单个RGB网络摄像头的2D视频;以及一个receiver,用于接收并将2D视频转换为3D,并呈现出新颖的3D视图

通过使用one-shot方法,研究人员可以实时地从单一的unposed图像中推断和渲染出真实的3D表示,并在NVIDIA RTX A5000笔记本电脑上生成光场图像。使用instant AI super-resolution技术,参与者可以立即看到他们的3D自我影像。在实时情况下,参与者可以观察到2D网络摄像头图像被提升为具有头部追踪功能的立体3D视图

用户可以选择使用2D Avatar生成器模块来生成和自定义由用户驱动的2D Avatar,除了使用网络摄像头图片

研究人员提出了一种基于Vision Transformer的新编码器,用于将2D输入转换为有效的三平面隐式3D表示,从而在3D提升方面取得了重要进展。通过给定用户的单个RGB图像,该方法能够自动创建用户的正面3D表示,并通过体三维绘制从新视点进行高效的渲染

这个句子的重写如下:三平面编码器完全依赖于经过预训练的EG3D生成的合成数据进行训练,而3D提升模块使用生成的先验来确保生成的视图在多视图一致性和照片真实感方面,并且能够在没有个人特定训练的情况下以one shot方式适用于任何人

英伟达为远程会议通话研发AI 3D视频聊天解决方案

团队使用最先进的神经方法,通过合成给定用户图片的重定向眼睛注视,将2D图像经过注视校正提升为3D图像,实现了眼神交流,如图所示

系统支持多种现成的3D显示器,包括单人立体显示器和多人光场显示器

英伟达为远程会议通话研发AI 3D视频聊天解决方案

这张图展示了使用来自Dimenco的32英寸3D立体显示器的情况。它利用眼动追踪和透镜技术来呈现立体图像,准确显示用户眼睛的位置。其中a提供了一个概览,而b和c展示了系统能够以正确的视角记录参与者的立体图像。同时,d和e说明了通过给定单一的RGB图像,该方法可以生成逼真的远程呈现效果

此外,研究人员使用一台32英寸的Looking Glass显示器来评估AI系统。该显示器能够同时展示真实大小的说话人头,让多人能够清晰地观看。这种光场显示器为普通观众和等待演示的人员提供了清晰的技术展示

接下来,轮候排队的人员可以尝试不同展位的立体显示器,并体验多路人工智能引导的3D视频会议电话

延伸阅读:AI-Mediated 3D Video Conferencing
延伸阅读:Live 3D Portrait: Real-Time Radiance Fields for Single-Image Portrait View Synthesis

值得注意的是,团队通过使用NVIDIA TensorRT对编码器进行了优化,使其能够在NVIDIA A6000 Ada Generation GPU上进行实时推理。整个系统的运行时间不到100毫秒,包括捕获、流式传输和渲染

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

622

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号