微软正式发布第二代自研 ai 加速芯片 maia 200,官方宣称其为当前公有云服务商中性能最卓越的 ai 处理器。
该芯片集成超 1000 亿颗晶体管,依托台积电三纳米先进制程打造,在 4 位精度下实现逾 10 petaFLOPS 的计算能力,8 位精度下达 5 petaFLOPS;配备原生支持 FP8/FP4 的张量核心,搭载带宽高达 7 TB/s 的 216GB HBM3e 内存子系统,以及容量为 272MB 的片上 SRAM。
Maia 200 面向大语言模型推理场景深度优化,微软将其定义为具有里程碑意义的推理加速芯片,相较前代 Maia 100,推理性能提升达 30%。

据微软透露,Maia 200 已率先在爱荷华州得梅因数据中心投入运行,为 Copilot 365、OpenAI GPT-5.2 及微软内部“超级智能”团队的关键项目提供算力支撑,并将在未来数周内扩展部署至亚利桑那州凤凰城数据中心。在关键指标上,其 FP4 性能为 AWS Trainium3 的三倍,FP8 表现亦优于谷歌最新一代 TPU。

与此同时,微软已面向开发者开放 Maia 200 软件开发工具包(SDK)的早期预览版本,助力第三方模型高效适配与性能调优。此举意在逐步减少对英伟达 GPU 的依赖,同时有效应对日益攀升的 AI 推理成本压力。










