0

0

智谱首席科学家唐杰:很快将推出新一代模型 GLM-5

心靈之曲

心靈之曲

发布时间:2026-01-08 15:28:02

|

152人浏览过

|

来源于php中文网

原创

智谱首席科学家唐杰:很快将推出新一代模型 glm-5

晚点独家获悉,1 月 8 日智谱上市当天,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。

唐杰说,今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标,但强调,真正 “有人用”,能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。

PDFlux
PDFlux

PDF内容提取+智能问答神器,结合了科研级精准的非结构化文档解析能力,以及ChatGPT的智能问答能力。

下载

除了 GLM-5 的发布,内部信还介绍了 2026 年智谱聚焦的三个技术方向,包括全新的模型架构设计,更通用的 RL(强化学习)范式以及对模型持续学习与自主进化的探索。它们均围绕基础模型能力提升展开。

以下是唐杰公开信全文:

用“咖啡”的精神做 AGI 在香港科技大学做短期访问时,和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝的太多,感觉有点上瘾,需要戒一戒了。 杨老师说:“为什么要戒呢?上瘾也不一定是坏事呀,如果我们做研究能像喝咖啡一样上瘾,又何愁研究做不好呢?”。 是啊,“上瘾”便是人生的精彩所在,无论是研究,还是其它事,只要专注、努力,就一定能做好。 “让机器像人一样思考”是智谱自始至终的愿景和理想,也是智谱人持之以恒奋斗的唯一目标。 2018年底,在人脑认知的双系统理论的启发下,我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱,开始尝试探索AGI,实现“让机器像人一样思考”的宏伟愿景。 这里的最大挑战可能是直到今天也没有人包括我们自己能够给出一个准确的AGI定义以及如何实现AGI的技术路径,也许这正是探索AGI的魅力所在。 我们处在历史上一个从未有过的非凡时刻,一个技术再一次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座,更有望成为驱动生产力变革的核心引擎。 回顾一路走来的历程,我们能走到今天的一个重要原因是,我们始终坚持做让用户真正用得上的AI技术。只有真正有人用的理论、技术或产品才能最终成为AGI之路上的重要成就。当然,不是所有的创新都能成功,我们也有很多有风险的项目都以败告终,但这也往往教会了我们从失败中汲取力量,这让智谱变得更强大,对AGI的理解也更深刻。更重要的是,这让我们注重实用的同时,不再只盯着短期收益:帮助用户、帮助国家、帮助全球科技进步成为智谱的长期目标。 2020年,我们推出了自己的大模型算法架构GLM,并开始尝试训练100亿参数的基座模型,模型很成功,得到包括美团在内的很多企业试用,这是一个很大胆的尝试,因为当年还是BERT模型横行的小模型时代。但当时的成功距离我们梦想中的AGI还遥不可及。部分原因是模型的知识量还不够大,而另一部分原因则是模型还不会像人一样推理思考。 2021到2022年,大模型发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划,也不认为这可能是个非常大的技术变革机会,或者害怕失败。我们还是决定赌一把,用更多数据训练一个1300亿参数的大模型。 这个决策很难,因为还不能影响公司总体发展节奏。为此我们成立了两个专门的小型创新团队,一个负责模型训练,这就是后来公司的GLM三剑客;另一个则独立负责MaaS平台建设,当时这两个小团队可能互相都不知道对方的存在。2022年中,GLM-130B训出来了,其中很多精细的设计引起了全球关注;同时MaaS平台上线,也就是现在的bigmodel.cn,有了第一批真正的API用户。随后,我们正式在公司成立了AI院,专注下一代大模型研发;成立MaaS平台部,负责对外提供大模型API服务。有时候,我们需要找到有足够大胆梦想的人(甚至专门投入更多精力去找这样的人),一个大胆宏伟的目标也许决定了一半的成功。 2023年,我和国内一个顶尖的创业前辈(其实他比我小不少)聊AI可能对未来的改变,我们一致认为AI会颠覆搜索、颠覆浏览器,会给每个人带来一个全新的AI助手;甚至有了这个AI助手后,我们也不再需要应用商店,反之我们可能需要为AI打造一个“API商店”,可能这个API商店的底层逻辑就是颠覆现有的操作系统;随后,也许更重大的颠覆是计算机本身,因为届时我们可能不是需要一个给人用的计算机了,而是适合AI的计算机。 这个变革发生的意义将是无穷的,因为它将彻底重塑计算机底层逻辑,挑战计算机界用了80年的奠基石——冯诺伊曼体系。聊到这里的时候,我们不约而同觉得我们对AI的投入还太少了,还不够All-in。 现实也是残酷的,All-in不仅需要坚定的信念,也需要极其强大的资金、团队支持,更需要精准的预判。2023到2024年是全球大模型的爆发年,大厂纷纷“All-in”大模型,国内也掀起创业高潮,百模大战、各种AI助手层出不穷。 我们那时候可能也有失误,有技术的也有商业的。现在复盘,可能原因是我们自己在追逐AGI的路上有迷失的时候,会被眼前的短期收益、短期热闹所迷惑。AGI是个技术变革,技术是平权的,是公开透明的,是要让所有人都能用的上并从中获益。 随后DeepSeek的出现警醒了我们,文锋2023年创业的时候和我聊过,当时我并没有意识到他对AGI如此执着,感谢他带给我很多不一样的思考。选择对AGI技术的执着追求,不断探索AGI的上界,同时精准的未来预判成为下一步智谱需要不断改进和升华的地方。这两年让我们经历很多,更重要的是“强化学习”了我们对AGI、对公司治理和商业竞争的认知。 过去一年,我们其实做了一次比较系统的"强化"。我们喊出了“定力”与“成就”的口号,要求大家保持定力,不骄不躁,不妄自菲薄,成就智谱每个人手上的事,成就自己。 年初的时候,一切都那么难,模型效果达不到预期,全国上下价格战,杀出重围需要找到一个精准的突破口。 我们坚守了阵地,终于找到Coding作为突破口。 如果说4月份GLM-4.1的发布像是象征性的试探,那7月底的GLM-4.5的发布几乎更是一场决战,所有技术、平台、业务团队捏一把汗,日日夜夜加班,我们终于迎来一场久逢的胜利,接着GLM-4.6和GLM-4.7让我们模型能力方面和那些国际顶尖模型并驾齐驱。我们的GLM-4.7 在包括AA、竞技场等多项评测中获得开源模型、国产模型的SOTA,来自用户侧的模型Coding和Agent真实体感也非常好,全球184个国家的15万开发者朋友使用GLM Coding Plan,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。 总体来说,在模型侧我们如期完成了年初定下的4月发一个“稳住阵脚”的模型、年中发一个“上牌桌”的模型(即成为 one of the best)、年底发一个Top 1的模型的整体战略。这为我们后续继续冲刺AGI技术高地打下重要根基。 我们的「主权AI」也迎来全新进展:马来西亚国家级MaaS平台基于Z.ai开源模型构建,GLM成为马来的国民级模型。主权AI出海是我参加了总书记座谈会后被总书记的“中国AI要走出国门”感召,但说实话我也不知道应该怎么做,我们的国际团队敢拼敢打敢成事,完成中国大模型出海从无到有的一个里程碑。业务方面,我们敢于竞争,再次完成了年度超一倍的营收增长目标。 在种种困难和机遇并存的情况下,今天,我们以一种几乎不可能的姿势成为了全球大模型第一股,这表明了市场对我们技术与商业价值的认可。“Make impossible possible”—— 还记得我们曾经说过的吗? 这一年来,蜕变最大的可能是不是智谱,而是一群一线的年轻人,他们把很多看起来不可能的事,真的做成了。 2026年,公司的目标是成为国际领跑的大模型企业。过去一年大家讨论大模型,很多在聊应用、聊生态。 真正决定下一阶段格局的,还是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。 基于这一判断,我们在 2026 年将聚焦于: GLM-5。很快GLM-5将跟大家见面,通过进一步的Scaling和很多全新技术改进,相信GLM-5会带给大家很多新奇体验,让AI帮大家完成更多真实任务。 全新的模型架构设计。已经广泛使用近10年的Transformer架构已经显露出一些不足,包括超长上下文的计算开销、记忆机制、更新机制等。这些都需要探索全新的模型架构,发现新的Scaling范式,通过芯片-算法协同设计等技术提高计算效率。 具有更强泛化能力的RL。当前主流的RLVR范式虽然在数学和代码领域取得了成功,但其依赖人工构造可验证环境的局限性也日益凸显。今年需要探索更通用的RL范式,支持AI不仅能在人类指令下完成特定任务,更要能理解并执行跨越数小时甚至数天的长时程任务。 最具挑战性的探索,是开启通往持续学习与自主进化的道路。当前所有主流的AI模型,其智能在部署后基本上是静态的。它们通过一次性的、耗资巨大的训练过程获得知识,然后在应用中逐渐过时。这与人脑能够从与世界的持续交互中不断学习、进化的方式截然不同。我们需要对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。 我们不是一家传统公司,我们也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生公司:打造不断提升智能上界的下一代模型,研发AI为核心的产品服务用户。我们要让AI成为每个人最得力的助手,帮助我们完成任务。我们认为还需要利用AI参与治理公司降本增效、做到更公平。 随着时间的推移,一个公司往往会习惯于做同样的事情,做渐进式的改进,这会限制我们的创新力。但在AI时代,一切都是变革式的,我们需要有点“不舒服”才能保持创新力,才能提出革命性的想法推动下一个大的增长领域。 因此,我们在智谱内部设立了一个全新部门X-Lab,这个部门将致力于用开放的方式把更多年轻人聚集,做前沿性探索,包括全新的模型架构、新的认知范式、还将孵化新项目,不局限于软件或是硬件。同时,我们也会扩大对外投资,不仅仅是战略联合已有的被投企业,也要开辟新的版图,让整个行业贯通起来,让整个生态一起繁荣。在X-Lab,每个人的使命就是做完全颠覆式的创新,最终回归到AGI的主线。 今天是智谱生命中激动人心的一天,是智谱历史上一个重要的里程碑,更是智谱一个全新时代的开启。我很喜欢Z.ai这个品牌,Z是字母表中的最后一个,代表终极境地,我们希望在AGI的探索历程上能走到智能的终极境地,这是我们努力的目标。我们非常兴奋: - 有一个雄心勃勃、改变世界的事业 - 着眼长远利益、放眼未来 - 更加专注,探索 AGI 的本质 - 用 AI 赋能伟大的企业家和公司的蓬勃发展 - 用更精准的预判抓住企业发展机遇 - 最终,希望我们能够为人类社会带来不一样的 AI,切实推动人类福祉的进步。 这是一个无与伦比的开心时刻,这种开心不是一时的多巴胺,而是探索 AGI 之路上积累起来的内啡肽,让我们更加专注,脚踏实地,持续前行! 唐杰 2026.1.8

源码地址:点击下载

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

486

2023.08.14

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

2

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

11

2026.03.03

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

68

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

59

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

46

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

24

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

20

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

4

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

R 教程
R 教程

共45课时 | 7.5万人学习

SQL 教程
SQL 教程

共61课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号