0

0

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

心靈之曲

心靈之曲

发布时间:2025-08-30 10:46:24

|

769人浏览过

|

来源于php中文网

原创

8月29日消息,nvidia近期发布了其第二季度财报,业绩持续呈现爆发式增长。备受瞩目的新一代ai显卡blackwell系列中的旗舰型号gb300,预计将在今年第四季度正式上市。与此同时,下一代rubin架构已有6款产品正在规划推进中。

关于GB300的详细规格可参考此前发布的资讯,而更值得关注的是其背后可能引发中美AI技术路线分化的趋势——在算法标准的选择上,国产AI生态与NVIDIA已显现分歧。国内主流选择的是UE8M0 FP8标准,而NVIDIA在Blackwell架构上则重点强化了NVFP4算法标准。

UE8M0 FP8标准近日在国产算力圈内引发热议,起因是Deepseek在发布其3.1版本模型时正式宣布,该标准已全面适配即将面世的新一代国产AI芯片。

尽管未明确点名具体厂商,但包括华为昇腾、摩尔线程、砺算科技、芯原科技、海光科技在内的多家国产芯片企业,其新一代AI算力产品几乎都已支持这一标准。

相较于以往国产AI芯片普遍采用的FP16+INT8组合,UE8M0 FP8带来了显著优势:性能提升可达2至3倍,同时大幅缓解显存压力并有效降低功耗,实际表现将取决于各厂商的具体实现能力。

反观AI领域的领军者NVIDIA,与国内由模型厂商牵头推动标准不同,NVIDIA长期以算力上游主导者的身份引领行业,其产品一直兼容FP64、FP32、FP16、INT8、FP8等多种精度标准。在Blackwell架构中,NVIDIA同样支持FP4与MXFP4,但主推的是NVFP4标准,其结构类似于E2M1 FP4,但在精度上几乎没有明显损失

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

NVFP4究竟有哪些优势?首先从性能来看,GB300在采用该标准后,稠密计算性能实现了50%的跃升,达到15PFlops,值得注意的是,其核心架构与GB200相比并无根本性变化。

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

50%的性能提升或许已足够亮眼,但其精度表现更令人关注。

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

Background Eraser
Background Eraser

AI自动删除图片背景

下载

对比FP8基准,NVFP4在DS 0528模型上的精度几乎持平,多数情况下差距不足1个百分点,而在AIME 2024测试中甚至反超2个百分点

内存占用方面,NVFP4相比FP16减少了3.5倍,相比FP8也减少了1.8倍。与此同时,GB300的HBM显存容量从GB200的186GB提升至288GB,在NVL72机柜中,系统总内存容量可达40TB,足以支撑3000亿参数以上的大模型运行。

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

第三大优势体现在能效上。在NVFP4的支持下,GB300每生成一个Token仅消耗0.2焦耳能量,而GB200为0.4焦耳,H100架构的H100则高达10焦耳,能效相较提升达50倍。

综上所述,NVIDIA此次主推的NVFP4标准实现了50%的性能提升,精度与FP8基本持平,内存占用减少2至3倍,能效更是提升了50倍

凭借NVIDIA在行业内的巨大影响力,NVFP4极有可能成为前沿大模型广泛采纳的标准,国内大型AI企业预计也将大规模采用。

然而,在国产AI芯片阵营中,UE8M0 FP8已成为新一代产品的主流标准。尽管在整体生态上尚难匹敌NVIDIA的CUDA体系,但这标志着国产AI软硬件协同迈出了关键一步,未来仍有机会开辟属于自己的技术路径,一切皆有可能。

与国产AI分裂 NVIDIA最强AI显卡GB300强化FP4:能效暴增50倍

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6105

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

811

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1063

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1275

2024.03.01

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

482

2023.08.10

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

404

2023.08.14

Golang 性能分析与pprof调优实战
Golang 性能分析与pprof调优实战

本专题系统讲解 Golang 应用的性能分析与调优方法,重点覆盖 pprof 的使用方式,包括 CPU、内存、阻塞与 goroutine 分析,火焰图解读,常见性能瓶颈定位思路,以及在真实项目中进行针对性优化的实践技巧。通过案例讲解,帮助开发者掌握 用数据驱动的方式持续提升 Go 程序性能与稳定性。

9

2026.01.22

html编辑相关教程合集
html编辑相关教程合集

本专题整合了html编辑相关教程合集,阅读专题下面的文章了解更多详细内容。

53

2026.01.21

三角洲入口地址合集
三角洲入口地址合集

本专题整合了三角洲入口地址合集,阅读专题下面的文章了解更多详细内容。

28

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.8万人学习

CSS教程
CSS教程

共754课时 | 22.3万人学习

Vue.js 微实战--十天技能课堂
Vue.js 微实战--十天技能课堂

共18课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号