0

0

国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?

蓮花仙者

蓮花仙者

发布时间:2025-09-09 11:31:01

|

474人浏览过

|

来源于php中文网

原创

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?

deepseek的火热,不仅点燃了资本与市场的激情,也让ai推理的需求在短时间内骤然升温。需求膨胀的同时,产业内部出现了两种截然不同的判断。

“我认为未来AI推理主要在云和端侧,边缘推理的需求会越来越小。”AI芯片公司的销售晨坤认为,“因为边缘AI的性能和成本都不占优势,会是一个过渡状态。”

另一位资深芯片销售嘉铭有不一样的观点,“端侧提升AI性能,功耗和价格难以平衡,并不是一个好选择。我认为边缘AI推理的需求会持续增加。”

这种对未来格局的分歧,也折射出AI推理市场的不确定性。端、边、云的占比至今难有定论,但可以明确,在泛安防这个巨大的端侧AI推理市场,即便大模型掀起一场技术革命,格局依旧稳固。占据市场份额的公司依然处于易守难攻的位置。

然而,AI算力需求100TOPS以上的边缘推理市场,正悄然酝酿着一场变局。无论是待上市的摩尔线程、沐曦、燧原科技、天数智芯、登临科技,还是已经上市的云天励飞,或者是发布了新品的江原科技、后摩智能,都试图抢占AI推理市场的先机。

他们必须直面同一个强大的对手——英伟达4090。

“国产芯片没有一款能全面超越英伟达4090,但通过极致的性能优化,可以在特定领域实现超越英伟达4090的极致性价比。”嘉铭直言。这些特定领域包括信创、交通、能源、通信、消费等领域。

2025年的AI推理市场,是一场双重博弈,既是国产芯片对英伟达4090的一次集体围攻,也是一次攸关未来格局的关键卡位战。

谁能从中切下更大的一块蛋糕?获取更多国产AI推理芯片的信息添加作者微信BENSONEIT互通有无。PHP中文网

AI推理,边缘和端侧市场谁的空间更大?

无论是ChatGPT还是DeepSeek,当下最受关注的AI应用几乎都依赖云端AI推理。在可预见的未来,云端依然会在AI发展中扮演核心角色。但云、边、端三者究竟如何协同,业界存在明显分歧。

在深入探讨之前,有必要先明确:什么是云、边、端?在CNN(卷积神经网络)时代,如果按算力划分,小于8TOPS为端侧,小于64TOPS为边缘,大于64TOPS为云端。

然而,大模型正在重新定义端、边、云的边界。在本文中,将使用70B模型进行AI推理,单卡AI算力超过100TOPS@TF32,使用单台或少量服务器的应用视为边缘AI市场;小于10B模型的推理场景,则归入端侧市场。

“CNN时代之所以诞生边缘计算,是因为泛安防场景下,一路摄像头就需要4兆带宽。带宽不够时,就必须在边缘增加计算盒子。”晨坤说,“当前的AI推理主要以文本为主,即便未来向多模态发展,也不再需要处理实时视频流。端侧小模型(10B以内)完全可以满足识别和检测的需求。如果需要更高性能,直接调用云端AI就够了。因此,未来边缘推理的需求会逐渐下降。”

晨坤认为,随着端侧小模型能力不断提升,边缘AI在成本和性能上难以形成优势。生成式AI时代的推理需求,将主要由云端和端侧主导。

嘉铭持不同观点,在端侧大幅增加AI算力的必要性并不高,因为功耗与性价比难以兼顾。他认为,边缘AI推理的需求仍将保持快速增长。

江原科技董事长李瑛则认为,生成式AI时代的AI推理依旧会是云-边-端协同的格局。

从市场角度出发,云天励飞副总裁罗忆提出:“目前云端推理市场的绝对规模不大,但其占比正在逐步提升;相比之下,泛安防的边缘和端侧推理虽然体量巨大,但整体份额正在下降。等云端应用逐渐饱和后,端侧推理的需求或将迎来新一轮增长。”

眼下,哪种观点更为准确尚无法定论,但这并不妨碍对边缘与端侧市场格局进行判断。

传统端侧推理市场易守难攻,新兴AI应用还未爆发

在生成式AI席卷市场之前,AI推理最重要的战场,是泛安防。经历多年激烈角逐后,这一市场格局已相对稳定:华为、云天励飞、登临科技、算能科技、爱芯元智等公司各自握有优势。

“泛安防的边缘和端侧这个万亿级市场,已经非常卷,增长也很缓慢。”晨坤说。

罗忆也表示:“泛安防属于典型的存量市场。目前最大的开销是运维。在各地预算紧张的大背景下,预算首先保证运维开销,剩余资金才可能投向少量新设备。”

今年,泛安防市场仍有一些大的设备更新的项目。

“设备都有使用年限。原本计划5年更换的设备,一些地方用了8年,今年终于到了不得不更新的时候。”罗忆说,“不过各地做法不一:有的只是标清换高清,有的直接换成智能相机。从整体来看,智能摄像头的渗透率依然很低。”

那么,设备更新叠加生成式AI的浪潮,是否会撼动这个庞大的端侧AI市场?

罗忆判断,“即便今年有大额订单,由于市场格局已经固化,除非新玩家带来颠覆式创新,否则很难改变现有格局。”

泛安防端侧推理市场需求分散,芯片类型繁多,有的擅长视频编解码,有的AI能力更强。经过多年市场筛选,目前仍留在市场上的国产AI芯片公司,都已经各自分得属于自己的蛋糕。

晨坤也强调:“即便生成式AI带来一些变化,新玩家切入成本极高。”

实际上,在泛安防市场的客户目前更关注的是如何把有限的资源利用到极致。罗忆对此深有感触,“能够用有性价比的方式帮助客户完成智能化升级,做更多精细化的工作,才能留住泛安防客户。”

除了泛安防这个AI推理的大市场,生成式AI正在催生大量新应用——AI玩具、AI眼镜、AI戒指,以及基于小模型的各种智能硬件,这些潜在产品将带来新的端侧AI芯片需求。

AI芯片公司的资深市场泰玮说,“国内已有老牌芯片公司押注了这一赛道,专为7B模型设计芯片。”

与端侧相比,70B以下模型的边缘推理芯片市场更受国产厂商关注,其成长性和潜力显然更具吸引力。想要进一步探讨端侧AI添加作者微信BENSONEIT。

国产AI芯片围攻英伟达4090,极致性价比的战场

年初,DeepSeek的火热再次点燃了各行各业将AI引入工作流的热情。大模型一体机需求暴涨,边缘AI推理市场也随之升温。

“48G的英伟达4090,是当前边缘推理的王者。”嘉铭直言,“想让客户为国产芯片买单,就要做到超越4090的极致性价比。”

MagickPen
MagickPen

在线AI英语写作助手,像魔术师一样在几秒钟内写出任何东西。

下载

泰玮对“极致性价比”有切身感受:“我们瞄准商业市场,但商业市场的客户对成本有极致要求。他们甚至愿意用淘汰的英伟达3090、4090矿卡——这些二手GPU便宜得令人难以置信,但稳定性堪忧。我们只能靠性价比与稳定性,在这个市场与英伟达正面竞争。”

嘉铭也指出,4090确实具备性价比优势,但毕竟是消费级产品,不适合7×24小时连续运行。对于有合规要求、需要全天候运作的客户,他们可能选择英伟达L20,但使用量有限,性价比也不如4090。

国产AI芯片的优势,除了稳定性,还在于大显存和大带宽。李瑛举例:“运行满血版DeepSeek时,8卡的4090服务器需要两台,而我们产品单台就能跑满血版DeepSeek,TCO(总体拥有成本)优势明显。”

泰玮也说,“我们一张售价5000元左右的加速卡,拥有128G的大显存,运行30B量化模型速度可达20 token/s,性价比极高。”

Qwen3和DeepSeek量化模型的首字延迟和每秒Token数只是敲门砖。嘉铭强调:“如果这两个指标不够,说明TCO没有优势。但也几乎没有客户不因为这两个指标直接下单,还需要在实际场景中测试性能。”

在具体场景下做极致的软件优化,是国产AI芯片实现超越4090的关键。

嘉铭表示:“芯片落地时一般三个关键流程,编译、调精度、调性能。若是NPU等专用芯片架构,这三步每一步可能都需1–2个月,累计可能需要数月时间,GPGPU架构的芯片可大幅缩短落地时间,也降低了客户的TCO。”

李瑛认为,“若两种架构的芯片从零起步布局同一场景,GPGPU 因可依托已有的成熟生态体系,初期优势会比专用架构更突出。但随着专用架构芯片在算子库优化、软件生态构建等软件领域积累足够经验并达成成熟应用标准,且能充分满足主流业务的实际需求,GPGPU 的原有优势将大幅减弱,不再具备明显差异化特点。”

“在DeepSeek火爆之后,AI算子的种类已经锐减,这时候只要把有限的算子优化好,不仅能缩小GPGPU相比专用芯片在软件生态方面的优势,如果做好了特定场景的算子优化,还能实现相比GPGPU数倍的性价比优势。”李瑛进一步表示。

罗忆也说,“专用架构芯片虽然有专精领域,但适用场景会越来越广。”

华为Atlas 300I Duo已验证了这一点,专用架构芯片只要适配好场景,就能体现强大性价比。

因此,对于国产AI推理芯片而言,要与4090竞争,必须依靠大显存优势,同时针对客户场景和使用模型进行优化,实现极致性价比。

“国内基于英伟达5090魔改的产品,性能调试已完成,很快将推向市场。性能比4090更强,价格接近,国产芯片还能有TCO或性价比优势吗?”晨坤提出疑问。

嘉铭则保持乐观:“我相信英伟达5090将成为新一代边缘AI推理王者,但并非无懈可击。国内各家公司也在设计下一代产品,准备与5090正面竞争。”

跑马未圈地,国产边缘推理芯片的卡位战

在下一代产品尚未上市之前,国产AI推理芯片公司的当务之急,是充分发挥现有产品优势,找到合适落地的场景。

国产替代需求最迫切的信创市场,成为了国产AI芯片最容易相遇的战场。

“信创市场的规模没有想象中那么大,也没有那么容易进入。”罗忆认为,“目前信创市场的刚需主要是CPU,满足日常办公需求,AI算力的需求还相对有限。再加上各地财政预算收缩,购买AI算力和设备的意愿并不高,因此现阶段信创市场并不是AI推理芯片的理想赛道。”

李瑛对此乐观一些,“信创市场确实存在挑战,但也有机会。一方面,信创市场已经启动AI芯片测试报名,这意味着对AI算力的需求正在增长;另一方面,通过更灵活的产品形式,例如在PC上扩展加速卡,也能降低成本。”

“医疗和能源市场也是我们重点关注的方向。”李瑛说,“医疗领域涉及大量敏感数据,这个领域的客户对替换国产芯片也有比较高的意愿。”

在罗忆看来,AI推理市场存在两个优质机会:一是互联网大厂,这些企业走在AI技术前沿,对算力需求庞大;二是各行业头部企业,这些公司也在数字化转型前沿,对AI算力有更多刚需。

“云天励飞现有的AI芯片能实现8TOPS-256TOPS算力,既能巩固泛安防存量市场,也能面向增量市场。我们同时在规划下一代产品,充分发挥后发者优势。”罗忆补充道,“作为上市公司,我们不仅有战略决心,还拥有资金和人才优势。更重要的是,过去11年公司在智能硬件、智算中心、智慧城市等多个领域积累了大量实践经验。这些宝贵的第一手资料,为芯片设计提供了明确指导。”

在泛安防市场站稳脚跟的登临科技,也将重点关注商业市场,在预算10万元左右的客户群中寻找对AI推理有实际需求的企业,比如中小企业。

走存算一体技术路线的后摩智能则瞄准不同赛道。后摩智能创始人兼CEO吴强说,“我们比较看重三个领域,一是平板电脑这种消费终端类,这是大模型生产力工具,对AI性能有刚需。二是智能语音系统,大模型语音会议也是重点布局的一个方面。三是运营商的边缘计算,看中了5G+AI的趋势。”

吴强补充:“目前这三个方向已有早期客户。我们精力有限,先把这几块做扎实,未来只要涉及大模型和对功耗敏感的应用场景,都会逐步拓展。”

整体来看,国内AI芯片公司都在积极布局快速增长的大模型边缘AI推理市场。罗忆形象地总结:“大家现在是在跑马,但还没有真正圈地。要成功圈地,必须与大客户深度绑定。目前还没有厂商做到这一点。”

在这场AI推理的竞争中,生态合作伙伴尤其关键,其中ISV(独立软件开发商)扮演不可替代的角色。相比芯片公司,ISV更了解客户需求,也能在擅长的领域服务更多客户。

若把芯片公司和ISV的合作比作“0到1”的工作,那么芯片公司优化算子、提供高效编译器,让ISV开发解决方案,就是把AI从“1到100”实现规模化应用的过程。

这样说来,通过一家AI芯片公司的软件生态合作伙伴,不仅能了解其重点落地的领域,也能看出各家的竞争优势。

明年,切换全国产工艺的AI芯片将陆续发布,谁能在特定场景中发挥大显存和极致性价比优势,谁就有机会赢得大客户的深度绑定,也可能在端-边-云格局中抢占更有利的位置。

可以预见,国产AI芯片的“围攻战”才刚刚开始。未来,随着技术成熟、生态完善以及大模型应用的持续落地,谁能分到更大的蛋糕?关于国产AI推理芯片的更多讨论,欢迎添加作者微信BENSONEIT。

注,文中晨坤、嘉铭、泰玮均为化名 PHP中文网

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6193

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

819

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1069

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1358

2024.03.01

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

503

2023.08.10

ChatGPT注册
ChatGPT注册

ChatGPT注册方法:1、访问OpenAI的官方网站,进入注册页面;2、完成注册后收到一份邮件,打开后点击验证账号;3、选择一个适合您需求的订阅计划;4、获得访问ChatGPT的权限即可。

538

2023.09.12

国内免费ChatGPT大全
国内免费ChatGPT大全

ChatGPT是一种基于深度学习技术的自然语言处理模型,由OpenAI开发。它是GPT的一个变体,专门设计用于生成上下文相关的文本回复。ChatGPT被训练成一个聊天机器人,可以与用户进行对话交互。更多关于ChatGPT的文章详情请查看本专题,希望对大家能有所帮助。

585

2023.10.25

手机安装chatgpt的方法
手机安装chatgpt的方法

手机安装chatgpt的方法:1、在ChatGTP官网或手机商店上下载ChatGTP软件;2、打开后在设置界面中,选择语言为中文;3、在对局界面中,选择人机对局并设置中文相谱;4、开始后在聊天窗口中输入指令,即可与软件进行交互。想了解更多chatgpt的相关内容,可以阅读本专题下面的文章。

2863

2024.03.05

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

1

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 10.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号