0

0

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

DDD

DDD

发布时间:2024-10-14 19:19:27

|

596人浏览过

|

来源于机器之心

转载

AI好好用报道

编辑:杨文
Kimi国庆「憋」大招,「憋」出个探索版。

前不久,市场上就有传言称,月之暗面国庆「憋大招」。

至于这个「大招」具体是啥,众说纷纭:

有人说和多模态有关,还有人说是关于深度推理的。

不过,就在上周五,月之暗面高调宣布,上线 Kimi 探索版。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

消息一出,不少体验者纷纷涌入官网,「Kimi 崩了」也一度登上热搜。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

那么,这个探索版厉害在哪儿?它与 Kimi 普通版有啥区别?

这么说吧,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。

而且,它还能模拟人类的推理思考过程,多级分解复杂问题,并进行深度搜索,即时反思改进结果。

这似乎和 OpenAI 的 o1 有着异曲同工之妙。

Kimi 官方也很自信,「如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到」。

接下来,我们就实地测评一下,看看 10 倍搜索量、一次搜索可精读超 500 个页面的 Kimi 探索版,到底是搞噱头还是真实力?

Kimi 官网链接:https://kimi.moonshot.cn/

1. 中国票房过四十亿的电影都讲了什么故事?

我们先通过这个娱乐性的问题,一窥 Kimi 探索版的「脑回路」。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

在答题之前,它会像分析师一样,预先规划解决问题的整体策略,将复杂问题分解为层次化的子问题,然后分步来执行。

具体来说,它先全网搜索中国票房过 40 亿的电影,然后查找这些电影的故事情节介绍。

在搜索过程中,它会把复杂提问转换成多个匹配的搜索关键词,并基于前一步的搜索结果来实时生成下一步的搜索关键词。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

此外,它还能即时反思搜索结果,在发现第一次回答中的情节简介存在信息缺失时,会主动补充更多内容。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

我们又让它来总结上榜的电影具体票房,其回答与搜索引擎上的结果一致。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

那么,Kimi 普通版的表现如何呢?

其工作流程是先理解问题,然后通过较为粗略的关键词搜索网页。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

从网页阅读数量来看,普通版仅阅读了 25 个网页,而探索版则是 40 个。

虽然普通版整体上回答没毛病,但是对于影片故事的介绍过于简单,也无法反思搜索结果。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

2. 请帮我总结一下特斯拉发布会

前几天的特斯拉发布会算是科技圈的大新闻了。

我们就让它总结一下特斯拉发布会的情况。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

它阅读了 11 个网页,并在界面右侧显示所有的搜索结果,从中提取出四大亮点,分别是 Robotaxi、Robovan、Optimus 机器人和 FSD 自动驾驶,还分条缕析地介绍了它们的功能、设计、成本等。

我们进行了一一比对,回答全部正确,没有出现满嘴跑火车的现象。

Video Summarization
Video Summarization

一款可以自动将长视频制作成短片的桌面软件

下载

我们继续追问,特斯拉发布了无人驾驶出租车,为啥股票会跌?

Kimi 探索版不仅搜索了中文网站,还使用英文关键词,网罗了 CBS、CNN 等外文媒体报道。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

如果我们点击它回答中的小引号,界面右侧则会显示出引用的原文信息,这极大地降低了幻觉发生的可能性。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

3. 甄嬛的生日和薛宝钗的生日相差几天?

我们再来问个无厘头的问题。

一直以来,大模型都是重度偏科者,写小作文嘎嘎好使,但一到数学题就抓瞎 ——

9.9 和 9.11 谁大分不清,strawberry 几个 r 搞不明白。

不过,计算甄嬛和薛宝钗这俩八杆子打不着的影视人物的生日,Kimi 探索版有一套自己的解题思路。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

在答题之前,Kimi 探索版先是全网搜索甄嬛和薛宝钗的生日分别是哪天,并在页面右侧显示所有的搜索结果。

然后来到重头戏,计算二者生日差值。

它先算出从正月二十一到四月十七,每个月有几天,然后分别算出总天数,全部相加即可。

不过,它的回答还是有瑕疵,因为农历月份长度以朔望月为准,正月的天数并不固定,因此最终的计算结果仍有偏差。

4.Elon Musk 的生日和 Sam AItman 的生日相差几天?详细介绍计算过程。

农历的计算方法过于复杂,我们也搞不清楚,因此,就让 Kimi 探索版再计算一下马斯克和奥特曼的生日差。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

我们专门用日期计算器检验了一下,Kimi 探索版回答正确。

5. 奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍,但其中 5 个比平均大小要小。奥利弗有多少个猕猴桃?

前天,本站发布了一篇题为《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》的文章。

我们就拿文中的数学题来测一下 Kimi 探索版。

先来个正常的:奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍,奥利弗有多少个猕猴桃?

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

Kimi 探索版先把思路梳理得清清楚楚,然后每一步的执行都相当准确。

我们又在这道题目中,加了一句废话「但其中 5 个比平均大小要小」,OpenAI 的 o1 就翻了车。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

但是,Kimi 探索版竟然没有被误导,得出了正确答案。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

目前,Kimi 探索版已覆盖全量用户。大家也抓紧去薅一波吧~

工具链接——

Kimi官网链接:https://kimi.moonshot.cn/

以后我们会带来更多好玩的AI评测,也欢迎大家进群交流。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2070

2024.08.16

什么是搜索引擎
什么是搜索引擎

搜索引擎是一种互联网工具,用于帮助用户在网上查找信息。搜索引擎的目标是提供最准确、最有价值的搜索结果,使用户能够快速找到所需的信息。本专题为大家提供搜索引擎相关的各种文章、以及下载和课程。

387

2023.08.02

有哪些目录搜索引擎
有哪些目录搜索引擎

目录搜索引擎有Google、Bing、Yahoo、Baidu、DuckDuckGo等。想了解更多目录搜索引擎的相关内容,可以阅读本专题下面的文章。

2853

2023.11.06

搜索引擎营销的主要模式
搜索引擎营销的主要模式

搜索引擎营销的主要模式包括:1. 竞价排名(ppc);2. 搜索引擎优化(seo);3. 本地搜索营销;4. 购物广告;5. 视频广告;6. 展示广告;7. 社交媒体营销;8. 移动广告。想了解更多搜索引擎营销的相关内容,可以阅读本专题下面的文章。

435

2024.05.20

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

109

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

16

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

131

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

7

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号