提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是一个物种了
年初,在体验当下几款热门的 AI 搜索引擎后,我和同事都一致认为,即便百度、Google 等搜索引擎巨头被群狼环视,但还是难以被撼动。
最近发布的 Kimi 探索版带来了很大的惊喜。相比于 AI 搜索更懂人类,我们更希望 AI 搜索引擎能够一步到位,最好就是成为一个带脑子的人类。
先来一剂预防针,目前 Kimi 探索版并未向所有用户开放。
昨天,在探索版上线之后,「Kimi 崩了」这一词条也迅速登上了热搜。不过,Kimi 官方也说了,预计将于下周一向所有用户全量开放,好饭不怕晚,不妨再耐心等待一下。
在这之前,我先行一步,替各位小伙伴尝尝鲜。
附上 Kimi 探索版的亮点总结:
- 搜索调研是核心功能,值得上手体验
- 搜索量是普通版的 10 倍,可精读超过 500 个网页
- 能即时反思,补充更多信息提供用户决策
- 每天 5 次机会,满足用户日常基本需求
- 启用方式简单,预计下周一全量推送
Kimi 搜索版的最强大脑,专治复杂问题
肉眼可见,在熟悉的搜索框里敲上「/」,亦或者启用「探索版」按钮,即可触发 Kimi 探索版。
普通用户每天只有 5 次机会,尽管谈不上量大管饱,但足以满足用户的日常需求。你看,它也给出了一种另类的解释——
「根据多项研究,正常人每天使用搜索引擎的次数大约为 4 次。」
让我们先给 Kimi 探索版做个热身运动。
今年的诺贝尔奖几乎被 AI 包圆了,我试着让 Kimi 列出诺贝尔物理学奖和化学奖得主的共同点,提出问题后,我就直接当甩手掌柜,坐等结果。
Kimi 在回答问题前,会利用模型能力识别用户的真实意图,将问题转化为搜索关键词,并根据前一步的搜索结果实时生成下一步的关键词,甚至使用不同语言进行搜索。
比如在 92 个网页的搜索中,这个问题就分解成了两个环节。
Kimi 先是搜索定位到两位得主,然后再检索出获奖的共同点。据官方介绍,在这个过程中,Kimi 探索版能够并行搜索多个关键词,访问和筛选大量权威信息源,迅速获取回答问题所需的背景信息。
与传统慢悠悠的串行搜索方式相比,二者的效率差距简直是天壤之别。
▲左为 Kimi 普通版答案,右为 Kimi 探索版答案
如果将同一个问题分别输入到普通版和探索版,你会发现两者之间的差异更加明显。
普通版大概会吐出一堆看似详细但信息量堪堪够用的大杂烩,而探索版不仅信息量充足,而且答案结构化,条理清晰。
所以说,AI 多介入一步,人类就多一分欢喜。
这里还有个小技巧,你可以在搜索过程点击关键词,右侧来源页面将自动筛选并跳转到相关网页。
▲点击关键词,注意看右侧页面
此外,Kimi 探索版网页搜索的信源要更详细,质量更高,同时更贴近用户所使用的语言环境。我试着同一个问题用英文搜索,所引用的信源也更贴近英文环境。
▲同一问题,左为中文提问,右为英文提问
我们都知道,任何 AI 都有可能成为说谎惯犯。
反其道而行之,如果我们一开始就提供错误信息,Kimi 探索版会落入我们的陷阱吗?
比如我们输入「在清代罗贯中所写的《西游记》中,为何菩提祖师敲孙悟空三下头?」好在,Kimi 经受了考验,先澄清了错误事项,然后对菩提祖师的行为作出了一番解释。
除了考究答案的正确与否,那 Kimi 探索版的时效性如何?
最近股市火热,我们问它最近 A 股市场的涨跌情况如何,并让它给出一些投资建议,它很快给出了股市全景图,并且投资建议也相当到位。
当然,股市有风险,投资需谨慎的免责声明也没落下。
「假设我从今年初开始定投黄金 ETF,与同期定投标普 500 指数相比,哪个投资策略的回报率更高?请制作一个对比表格。」
昨天发布的特斯拉「赛博的士」Cybercab 还很热乎,我用英文提问 Cybercab 和梦碎的苹果梦碎的汽车项目有哪些不同,也没能难倒 Kimi。
所有的问题都有答案。
既然 Kimi 探索版擅长拆解用户的问题,那它能否智斗弱智吧难题?
- 怎么理解「说明书是书,书是人类进步的阶梯,说明书是人类进步的阶梯」
- 既然快递要 3 天才到,为什么不把所有的快递都提前 3 天发?
实测发现,虽然 Kimi 探索版能够理解拆分复杂问题,但还是一板一眼地遵循搜索环节,依靠海量知识来解答疑惑。
简言之,一寸长,一寸强。和 OpenAI o1 有所不同,「搜索调研」是 Kimi 探索版的核心所在,因此,将其放在推理、思考解题逻辑等场景中可能不太合适。
专业的搜索,交给专业的 AI
专业人做专业事,把搜索交给 AI 也是类似的道理。
据悉,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。
官方表示,Kimi 的性能评估团队结合 1000 多个来自用户的真实长难问题,对比了国内所有的主流 AI 助手和搜索类产品,包括付费和专业版本,Kimi 探索版综合性能超过同类产品至少 30%。
Kimi 探索版产品负责人表示:
如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为 AI 更擅长调用的工具,人只需要专注于提出好的问题,AI 就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。
官方的自信溢出屏幕,但体验下来, Kimi 探索版的实力的确让人刮目相看。
「甄嬛的生日和薛宝钗的生日相差几天?」
面对这种刁钻难题,普通 AI 搜索引擎要么打太极,称缺乏具体资料,要么就算清楚列出了两者的生日,也懒得动脑筋计算。
还好,Kimi 探索版没染上这样的毛病,撸起袖子就给出了运算答案。
运算再复杂些,我们尝试复现官方给出的一些案例。
「如果所有的钢琴都定期调律,估算一下北京需要多少名全职的钢琴调律师?」
我承认,一开始我被这密密麻麻的答案唬住了,但接着我连续问了 3 遍,得到的答案分别为 1005、1050 和 1200。为什么会有所变化?
破案了,Kimi 探索版能够像人类一样反思搜索结果,提升回答质量。
面对信息的缺失或数据的冲突,它不会坐视不管,而是会主动出击,搜寻并补充更多维度的信息,为用户提供一个全面而多角度的视野,以便做出更加明智的决策。
比如在第二遍时,Kimi 探索版又搜索了 13 个关键词,阅读了 45 个网页,最后给出了 1050 答案。当然,建议在提问时,你的问题写得越详细越好。
再给 Kimi 探索版上点强度。
让它查查 9 月上海迪士尼的排队时间,还要做成表格,再设计一条最省时间的游玩路线,看完答案的我,突然脑子里蹦出一个场景。
如果用 Kimi 探索版规划出行路线,再查阅景点知识,四舍五入,这岂不是把真人导游的工作都给抢了。
别急,强度还不够,让我们再来看看两个实测的案例。
每个爱看武侠小说的人,都对「飞雪连天射白鹿,笑书神侠倚碧鸳」这句话早已烂熟于心,但若真要较真,用 C++ 来统计金庸笔下所有武侠小说书名中,哪个字的出现频率最高呢?
答案是侠。侠之大者,为国为民,侠之小者,为友为邻。
「假设 2023 年全球的物流需求都通过无人机配送来完成,需要多少架无人机,这些无人机的总飞行距离相当于多少个地球到月球的距离?」
现在答案有了,这大约需要 5479 万架无人机,相当于约 520 万次地球到月球的距离。
想象一下,地上的汽车排成长龙,动弹不得,司机无奈抬头看向天空,5479 万架嗡嗡作响的无人机也在空中交通大堵塞。
实际上,在随时随地搜索的互联网时代,我们似乎已经淡忘了,搜索其实是一门技术活。
在哪个知识被精心记录在羊皮纸、泥板、竹简等载体的时代上,而学者们在查找信息时,也未必能对所需的资料的存放处了如指掌。
随着「图书馆」的进一步普及,图书管理员的地位也跟着水涨船高。
他们的职责不仅限于书籍的保管,还包括分类、编目、修复和借阅管理。并且,他们还承担着信息传播的使命,通过编纂目录和编写指南,帮助读者更有效地利用图书馆资源。
再后来,20 世纪末,互联网引发了信息大爆炸。传统信息检索方法已经无法跟上人类的节奏,因此,充当救星的搜索引擎应运而生。
这一系列的技术革新,其实就是把专业搜索的权力,进一步下放给我们这些普通人。
我们和答案之间的距离正在一点点缩短,检索效率也一点点提高。
在今天,许多简单的搜索行为已经不成问题。
然而,标题党和眼球经济不可避免地带来了误解、忽略和信息失真。并且在 AI 的推波助澜下,我们不得不面对「垃圾进,垃圾出」的内容农场困境。
而且,大多数 AI 搜索引擎提供的高级搜索,不过是把一堆长答案拼凑在一起。看起来信息量满满,实则空洞无物。AI 偷懒拼凑答案,反而让我们浪费了更多时间。
如果将信息搜寻过程比喻为动物在自然环境中寻找食物,那么 Kimi 探索版通过优化搜索结果的相关性和质量,也就是在减少用户的「觅食成本」。
这也是《定位》理论创始人杰克·特劳特所强调:
「Complexity is sold to the experts, simplicity is sold to the masses. 复杂性卖给了专家,简单性卖给了大众。」
想想看,在智能手机普及之前,专业摄影得有昂贵的设备和深厚的摄影知识。用户常常需要学习如何调整快门速度、光圈、ISO 等技术参数。
但智能手机的出现,使得任何人都能通过傻瓜式的操作拍出世俗意义上的好照片。
类似于智能手机让每个人都有机会成为摄影师,Kimi 探索版将复杂的搜索技术封装成简单易用的工具,在降低用户信息的获取门槛的同时,也朝着更专业更细分的深度搜索迈进。
既要好用,又要易用,专业的搜索,交给专业 AI 的路子,总归没有走错。