在近期举行的 axios ai+ summit 上,谷歌 deepmind 首席执行官德米斯・哈萨比斯(demis hassabis)公布了他对 2026 年人工智能发展的前瞻性判断。他明确指出,明年将是多模态模型能力跃升、交互式视频空间落地、以及高可靠性 ai agent 实现关键突破的集中爆发期。

哈萨比斯特别指出,Gemini 系列模型正推动多模态理解迈向新高度——它不再停留于表层内容识别,而是具备语义纵深解析能力。他以电影《搏击俱乐部》中的经典镜头为例:AI 能将主角摘下婚戒的动作,关联到存在主义语境中“剥离社会身份、回归本真自我”的哲学隐喻,而非仅输出“手指移除金属环”这类字面描述。正是这种跨模态、跨符号的抽象推理能力,支撑起新一代复杂内容生成,如结构化信息图、动态知识图谱可视化等此前难以企及的输出形态。
关于 AI Agent 的演进,他重申了此前在 2024 年 5 月提出的路线图:未来 12 个月内,Agent 将初步具备“类人级任务闭环”能力——即在无持续人工干预前提下,自主完成目标拆解、工具调用、反馈评估与策略迭代全过程。DeepMind 正致力于打造一款真正跨平台、跨终端的通用智能体,覆盖手机、桌面、车载及可穿戴设备,成为用户日常生活的主动协作者而非被动响应者。
为夯实这一愿景的技术底座,团队同步推进“世界模型”架构的工程化落地,其中 Genie 3 是最新代表。该模型不仅能生成高保真视频流,更关键的是赋予其可交互性与可探索性——用户可在生成的虚拟场景中自由移动视角、触发对象响应、甚至改变环境参数,从而构建出兼具沉浸感与操作性的动态数字空间。
源码地址:点击下载
以上就是DeepMind 首席执行官预测 2026 年三大 AI 发展趋势的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号