编者按:本文来自微信公众号 智谷趋势(ID:zgtrend),作者:丝斯,创业邦经授权转载。
传得沸沸扬扬的OpenAI搜索引擎,再一次延缓发布,留给世人巨大的悬念。
OpenAI创始人山姆·奥特曼说,这次即将要发布的,既不是GPT-5,也不是搜索引擎。而是一些“人们会喜欢的新东西!对我来说感觉像魔术一样”。
额,魔不魔术的先不说,反正传了一个星期的AI搜索引擎是没影儿了。
但是,你细评他这句话,有没有一种“我今天不发布,但我们一直在努力开发你们喜欢的、想象中的AI搜索引擎”这样的言外之意。
换成中国话说,就是 “革命还未成功,同志还在努力” 。
那么问题来了,全村的希望——OpenAI,真的准备要革Google的命了吗?
01 AI搜索呼之欲出
AI搜索已经在路上,这不是乱揣测。
路透社报道,根据最新的SSL证书日志,OpenAI在5月3日创建了一个名为search.chatgpt.com的子域名。只不过你现在点进去,估计还是“Not FOUND”。
放在更长的时间线里看,2022年12月GPT横扫全球时,Google的CEO桑德尔·皮查伊就在公司内部发布了“红色警报”,主动敲响了警钟。
在皮查伊看来,GPT生下来就是要革自己命的。
但两年过去,GPT-5都要来了,Google还是独孤求败,那个唯一可能敢叫嚣的OpenAI搜索,到今天都还是404。
难道,做出一款AI搜索产品,对OpenAI来说,就这么难?
答案并非如此。看看Perplexity就知道了。
根据最新媒体爆料,这家黄仁勋最爱的AI搜索公司正在进行至少2.5亿美元的新一轮融资,估值可能膨胀至25亿美元。此前,Perplexity在今年1月以5.4亿美元的估值筹集近7400万美元,后又在3月初以10亿美元的估值获得6300万美元融资,跟投的公司里不乏英伟达、贝佐斯这些硅谷大佬。
就是这么一款10亿美元估值的产品,其实也没有多么惊天动地的体验。
从主页面来看,Perplexity与传统搜索引擎区别不大,同样设置了系统推荐话题、热门话题和历史搜索记录等功能栏。
图片来源:硅兔赛跑
主要的区别在于,输入搜索指令后,Perplexity生成的信息页面里,包括了“sources”,信息来源、“answer”,AI总结的精简回答以及“related”,相关问题。
想要更精准搜索,就可以在Focus中选择不同的信息来源,比如可以检索源自学术论文的信息、也可以在YouTube上搜索视频,在Reddit上搜索相关讨论。Perplexity会在内容页面上附上信息来源标签,减少AI问答的造假可能性。
如果点击搜索栏里的Copilot,Perplexity就可以在连续的互动和追问中为用户提供定制化的个性回答。要是愿意每月付上20美元订阅Pro方案,就可以无限量的用Copilot进行搜索,也可以上传文件和图片,Perplexity会直接帮你总结文件内容。
简单来说,Perplexity之于传统搜索引擎的区别就在于信息筛选的便利性和个性化定制,的确可以解决传统搜索引擎广告泛滥、信息检索精度有限的毛病。
截至今年3月,Perplexity今年总访问量就达到1.6亿,平均月活用户达到5221万。
看上去是一场史诗级的搜索革命正在开启,但有一句话说得好,这个世界本身就是一个巨大的套娃。
Perplexity也不例外。
肉眼过去,Perplexity好像是周鸿祎所定义的“答案引擎”。但这个答案的生产逻辑是:用户提出问题后,Perplexity接收到用户需求,再去传统搜索引擎上搜查相关链接,最后结合大语言模型把搜到的结果进行总结和提炼呈现。
套了一层传统搜索引擎还不算,Perplexity的大模型也是GPT-3.5和Claude微调得来。
所以,我们大可以将当前的AI搜索看成是GPT和谷歌的结合体。
这也侧面说明了Perplexity的技术护城河并不高。 毕竟,现在开源大模型的推理和训练能力都这么强了,还怕做不出一个拿得出手的AI搜索吗。
阿里原副总裁贾扬清,就用500行代码掀翻了AI搜索套壳产品。
今年1月份,贾扬清在推特上展示了一个对话式搜索引擎的demo。贾扬清在推文中介绍,这款叫做Lepton Search的AI搜索引擎Demo,基于他所创办的LeptonAI提供的框架,用了一个周末就跑出来了。
而且,贾扬清还表示,自己无意入局AI搜索市场,把Demo给大家看,只是想证明“天下没有难构建的AI应用”。感慨的同时也不忘顺手艾特了Perplexity,表示“受到了他们优秀产品的启发”。
再往后,Perplexity创始人Aravind Srinivas下场捧了Lepton Search一番,还意味深长说了句:“看到包括Meta和阿里的前高管都在将Perplexity的UI页面作为未来一些融资动作的参考,这真是太棒了! 这说明Perplexity的影响不仅在于产品本身,还深入到了整个行业生态”。
图片来源:硅星人Pro
一个套壳AI搜索的影响辐射到了整个生态,这真的很难评。
但总而言之,AI搜索的准入门槛,比我们想象中低太多了。
但对OpenAI来说,既然都把人家叫做全村的希望了,肯定要做就要做点不一样的。
就像月之暗面创始人杨植麟就说过,比传统搜索引擎好个10%、20%,没什么太大价值——只有一个颠覆性的东西,才配得上AGI这三个字。
02 OpenAI之困
这也能说明,为什么OpenAI的AI搜索迟迟不肯露面。当没有把握产生另一个Sora级别的地震效果时,我要是奥特曼,我也会先溜一下粉丝。
而且今天,这个微妙的发布时间点说明了一切。
来捋一下OpenAI搜索的发布时间线——
首先,曾经准确预测过GPT-4发布时间的知名科技博主Jimmy Apples在Twitter上表示:“美东时间5月9日上午10点,OpenAI将举行一场活动,这次活动显然不会是发布新模型,而是发布搜索引擎”。
爆料后几天,又有报道称,OpenAI推迟本周的产品发布活动至下周一,5月13日。
在这期间内,网传已经有人拿到GPT搜索的内测资格。华尔街见闻的报道中提到,从流传出来的版本来看,GPT搜索对于苹果发布会的内容可以迅速给出精准答案,但当提及“比特币价格”这类实时更新的信息时,GPT搜索的准确率就不高了。
图片来源:华尔街见闻
再然后,就是奥特曼紧急澄清,5月13日要发布的不是GPT-5,也不是AI搜索引擎。
我们假设网传版本为真,网友对其的评价是 “总体不错,但仍有瑕疵”。
但此前业界的期待里,贾扬清说GPT可以终结“简单调用传统搜索并用LLM进行总结的”模式。
连OpenAI自己人,布拉德·莱特卡也暗示过,这一突破性的发展有望对GPT-5进行重大升级,相比之下,这可能会使今天的GPT看起来“糟糕得可笑”。
所以,结合到理想与现实的出入,OpenAI“溜粉”的花活也可以理解了。
毕竟,如果OpenAI搜索不能在13号的发布会上让GPT-4和之前的几代大模型“糟糕的可笑”,OpenAI和奥特曼就会在14号谷歌大会上变成皮查伊眼里“可笑的糟糕”。
为什么OpenAI再造一个Sora级别的AI搜索产品很难?
一个很重要的前提是,不管是基于大模型的AI搜索还是传统搜索引擎,决定搜索质量的关键因素,都是数据。
对传统搜索引擎来说,搜索次数越多,答案越精准;对AI搜索来说,语料库越丰富、使用次数越多,大模型给出的答案越精准。
但是,OpenAI当前的两座大山就是数据和流量的增长乏力。
数据方面,来自外部的非法数据使用的指控还在继续。4月30日,包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《水星报》在内的美国八家新闻机构向OpenAI和微软提起诉讼,指控其在未经许可的情况下,非法复制了数百万篇文章来训练AI模型。
同时,包括玛丽格特·阿特伍德、丹·布朗和乔迪·皮考特在内的8500多名作者,也联合敦促GPT等AI公司,在未经授权的情况下停止使用他们的作品。
流量方面,SimilarWeb网站数据显示,在去年年初的爆发式增长后,GPT自2023年6月全球流量下降了9.7%,面临着扩大用户群的瓶颈。
数据获取上频繁被指控,再加上流量趋于见顶,OpenAI的搜索新故事,很难在今天讲得漂亮。
还有一层更耐人寻味的是OpenAI与最大股东微软之间的关系变化。
只要AI搜索引擎还需要从传统搜索引擎里过一遍,就离不开Google和Bing两大搜索引擎的授权。而且,Bing所授权的搜索结果因为是不包含广告的纯净版本,更被AI搜索公司青睐。
但Bing的索引授权费从去年就基本上3倍起跳。如果搜索结果还包括Bing的大语言模型内容,授权费最高能涨到27倍。
AI搜索引擎,一边靠着Google和Bing的索引库喂养,受后两者掣肘的同时一边还要准备推翻Google和Bing。
所以你猜,OpenAI要发布AI搜索引擎的消息传出来之后,第一个睡不着觉的是老对手谷歌,还是老东家微软。
更明白一点,当有一天OpenAI的搜索引擎能发布了,微软Bing和它之间必然达成了某种利益共同或制衡约定。
再实际一点,回到最开始说的产品效果上,OpenAI目前释放出的产品形态并未掀起一场产业地震。那么,这也侧面说明,此刻发布AI搜索产品,可以给GPT带来用户增长,但并不能带来爆发性增长。
从商人或者产品经理的角度考量,一个注定无法产生理想商业效益的产品,不是在沉默中被淘汰,就是被淘汰的很沉默。
毕竟,有为AI搜索卖力气赚吆喝的时间,还不如再优化一下GPT-5呢。
03 结语
AI搜索,真的有机会革掉Google的命吗?现在看来,还有一段不短的路要走。
OpenAI正在努力解决一些数据和流量上的关键问题。
比如OpenAI在当地时间5月6日,宣布与英国《金融时报》达成内容许可协议,OpenAI可以利用《金融时报》数据库来训练AI模型。
再比如,更早之前,OpenAI就宣布免登录即可使用,就是为吸引更多的用户,获得更丰富的数据。
而且,本月初,美国司法部和38个州对谷歌提出的严重垄断指控结束了庭审。
虎嗅的报道中提到,诉讼文件中谷歌的垄断行为包括通过与手机制造商和浏览器公司签订排他性合约,确保其搜索引擎成为默认设置,进而巩固其市场主导地位。
谷歌辩称这些合约处在“合法竞争”的范畴中。
但美国司法部的律师Kenneth Dintzer在庭审的总结中表示:“上一次重大科技垄断裁决‘美国诉微软’案‘非常适合’谷歌”。
1998年,美国对微软反垄断的指控,不仅险些让微软一分为二,更迫使其调整了企业商业策略和发展方向。
要是按照“非常适合”的说法,谷歌或许也将面临“拆分”的可能性。
而更早些时候,国内首个AI搜索产品,昆仑万维的天宫AI搜索和月之暗面Kimi长文本模型陆续发布时,关于“百度失其鹿,群雄共逐之”的坊间说法就没停下过。
种种变动,都指向一个事实:
长达20年未有大变的搜索引擎领域,需要一个新的故事起点。
毕竟,作为Google或者百度搜索用户的我们,对搜索页面泛滥且无用的广告、以及常常“言不及义”的低精度关键词搜索和虚假信息早已经疲惫不堪。
不过也得承认,目前可见的OpenAI的搜索产品形态,并未有“历史性”的创新。
也就是说,AI搜索距离“iPhone时刻”和通用AI搜索爆发的奇点,仍然遥远。
但如果你也相信光的话,你一定会相信奥特曼。