月之暗面正式推出kimi迄今最强开源思考模型——kimi k2 thinking,该模型基于“模型即agent”理念打造,原生具备“边思考、边使用工具”的能力。在humanity's last exam、browsecomp、seal-0等多项权威基准测试中达到sota水平,并在agentic搜索、编程、写作与综合推理方面实现全面升级。

Kimi K2 Thinking无需人工干预,可自主完成高达300轮的工具调用与持续多轮思考,有效应对复杂任务。“这是我们在Test-Time Scaling(测试时扩展)方向上的最新突破,通过同步扩展思考Token和工具调用轮次,显著提升Agent行为与推理性能。”
实测显示,在开放搜索、Python及网页浏览工具支持下,Kimi K2 Thinking于Humanity's Last Exam评测中取得44.9%的成绩,创下新高。该测试覆盖百余个专业领域,是极具挑战的封闭式学术评估。

在专用于衡量AI Agent网络交互能力的BrowseComp测试中,其表现以60.2%准确率登顶SOTA,远超人类平均29.2%的水平。

依托强大的长程规划与自主检索机制,Kimi K2 Thinking能执行“思考→搜索→浏览→再思考→编程”等上百轮动态循环,不断提出假设、验证信息、深化推理,最终生成逻辑严密的答案。
代码能力方面亦有显著增强。同时,模型支持原生INT4推理,推理速度提升约两倍,对国产AI加速芯片更友好,硬件兼容性更强。
目前,Kimi K2 Thinking API已上线Kimi开放平台(platform.moonshot.cn),支持256K上下文输入,定价与Kimi K2-0905一致:每百万输入Token 4元,输出16元,缓存命中输入仅需1元。高速Turbo API同步发布,处理速度达100 Token/s,每百万输入8元,输出58元,缓存命中输入1元。详细接入指南请参阅官方文档。
更多资讯请查阅官方公告。
以上就是Kimi K2 Thinking 模型开源发布的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号