红杉:AI 大厦将成,2025 三大 AI 预测

2024 年是 AI 的元年。到 2025 年,AI 的大厦将逐步稳固。 去年一月,我们将 ChatGPT 比作 AI 的“大爆炸”,并预测 2024 年将是 AI 的元年(原文为 “primordial soup” year,原始汤,是指地球上生命出现之前存在的一种液态物质,此处翻译为元年)。AI 生态充满了新想法和潜力。对于创业者来说是一个黄金时期。“空气中有很大的潜力,但它仍然是无定形的”,正如我们当时所写:“空气中弥漫着巨大的潜力,但这种潜力仍然是无形的。我们需要足够的远见和努力,将其转化为真实、有形且具有影响力的事物。”

2023 年红杉预测文章:https://www.sequoiacap.com/article/ai-in-2024/ 如今,AI 的生态已经趋于稳固。

在大模型竞赛中,已经出现了五个“最终角逐者”。英伟达备受期待的 Blackwell 芯片将于本月发货。许多在 2024 年初规划的数据中心正全力进入建设阶段。TSMC(台积电)正在建设新的晶圆产能,而博通也在开发定制 AI 芯片:整个供应链已经切换到了高速运转模式。从医疗保健到法律,再到保险,各个行业都在启动新的 AI 计划。 如果说 2024 年是 AI 的元年,那么现在,AI 的基础设施已经稳固就位。AI 的潜力正在凝结成真实而具体的事物——体现在遍布美国各地的数据中心上,从宾夕法尼亚州的塞勒姆,到德克萨斯州的朗德罗克,再到威斯康星州的芒特普莱森特。如果说 2024 年充满了新思想,那么 2025 年将着重于筛选这些想法,看看哪些真正可行。

下面,我们对未来一年提出三项预测:

1. 大语言模型供应商异军突起,各有千秋——2025 年将引发渐进分化与激烈角逐 2024 年,大模型竞赛的核心目标是达到与 GPT-4 相当的水平。五家公司实现了这一目标(或接近实现)并由此成为“最终入围者”:微软/OpenAI、亚马逊/Anthropic、谷歌、Meta 和 xAI 。其他公司则退出了竞争,最引人注目的是 Inflection、Adept 和 Character。 为了达到 GPT-4 的水平,这些公司基本采用了相同的策略:尽可能收集更多数据,使用尽可能多的 GPU 进行训练,并优化预训练/后训练架构以最大化性能。随着 2024 年人才在各组织间自由流动,几乎不存在什么商业秘密。 随着各个参与者准备迎接下一轮 LLM 军备竞赛(可能涉及计算规模的十倍增长),这些实验室正在发展出差异化的优势。可以说,他们已经为即将到来的战役“各选武器”。

在 2025 年,这些独特的策略将导致不同的结果,一些玩家将脱颖而出,而其他则可能落后。

谷歌 – 垂直整合:谷歌进入 2025 年的优势在于垂直整合。谷歌是唯一拥有自主一流芯片的玩家:TPU 在 2025 年有机会与英伟达 GPU 一较高下。谷歌还建设自己的数据中心,训练自己的模型,并拥有非常强大的内部研究团队。与分别和 OpenAI 和 Anthropic 合作的微软和亚马逊不同,谷歌通过掌控价值链的每个环节来争夺胜利。

OpenAI – 品牌:我们看过一些关于 ChatGPT、Claude 和 Gemini 的品牌认知度调查,差距相当明显。OpenAI 拥有 AI 领域最强大的品牌,无可争议。这使其成为大型 AI 玩家中收入最强劲的引擎,据报道 OpenAI 的收入已超过 36 亿美元。如果 AI 的成功最终取决于消费者认知度和企业市场分发能力,OpenAI 可能会继续拉大与竞争对手的差距。

Anthropic – 人才:2024 年见证了研究人才从 OpenAI 的大规模出走,同时涌向 Anthropic。随着 Jon Schulman、Durk Kingma 和 Jan Leike 在 2024 年都从 OpenAI 转投 Anthropic,Anthropic 在研究人才中的影响力不断提升。公司还进行了一些重要的高管招聘,包括任命 Instagram 联合创始人 Mike Kreiger 为首席产品官。在 GPT-3 发明者 Dario Amodei 的领导下,Anthropic 已将自己打造成 AI 科学家青睐的目的地。

xAI – 数据中心建设:我们在 Steel, Servers, and Power 一文中写到了数据中心建设对 AI 竞赛下一阶段的重要性。随着 xAI 在创纪录的时间内部署了 10 万个 GPU 的巨型集群,该公司现在成为了数据中心扩展的领跑者。xAI 及其竞争对手的下一个里程碑将是 20 万集群,然后是 30 万集群。如果”scale is all you need”这个说法成立,xAI 将有望继续其快速崛起。

Meta – 开源:Meta 已经通过 Instagram、WhatsApp 和 Facebook 拥有强大的分发优势,选择全力投入开源,Meta 是大玩家中唯一采取这种方式的公司。Meta 的 Llama 模型拥有热情的粉丝,关于闭源与开源的争论仍在持续。如果前沿进展开始放缓,Meta 将凭借其开源模型在这些能力的快速传播上占据优势。 在大模型竞赛中,严酷的裁决就在眼前,各个玩家的竞争格局和姿态已经趋于稳定。在 2025 年,我们将看到哪些策略被证明是有先见之明的,哪些又将证明是命运多舛。

2. AI 搜索正在成为杀手级应用——2025 年将迎来快速扩张 自 ChatGPT 问世以来,我们一直在寻找 AI 的杀手级应用(Killer App,行业黑话,简而言之就是很牛逼的消费者都愿意买单的产品)。

什么样的产品交互创新,能经受住时间的考验? 2024 年,从 AI 女友到 AI 租房助手,再到语音 Agent 和 AI 会计,各种不同的应用都经历了市场检验。 我们认为在 2025 年将快速普及的一个案例是 AI 搜索引擎。Perplexity 自推出以来发展迅猛,月活跃用户达到 1000 万。OpenAI 在十月份推出了 ChatGPT 搜索,这是对其现有搜索类功能的扩展。《华尔街日报》最近发表了一篇文章,标题是 Googling is for Old People。具有讽刺意味的是,这个对谷歌的挑战恰好出现在公司深陷反垄断诉讼之际。 Googling is for Old People:https://www.wsj.com/tech/googling-is-for-old-people-thats-a-problem-for-google-5188a6ed AI

搜索是对一个传统互联网杀手级应用技术的强大重塑。互联网搜索是一种基于网络索引的导航技术。AI 搜索则是一种基于大语言模型的信息技术,能够阅读并从语义层面理解知识。对白领工作者来说,这将是巨大的福音。

AI 搜索可能会使当前这个一统天下的市场出现分化。我们可以想象这样一个世界:每个专业都有自己专门的 AI 搜索引擎——分析师和投资者默认使用 Perplexity,律师会使用 Harvey 这样的平台,医生则会使用 OpenEvidence 这样的解决方案。循着这个思路,我们可以把 Midjourney 看作是对“像素宇宙”的搜索,Github Copilot 是对“代码宇宙”的搜索,而 Glean 则是对“文档宇宙”的搜索(Agent Universe 是对“Agent 智能体”的搜索)。

与传统搜索不同,AI 搜索可以在语义层面深入得多,因此其功能强大程度要高出一个数量级,带来显著的增量生产力提升。 文本响应作为一个产品表现形式,其深度超出了表面所见。并非所有的文本响应都是一样的。

我们认为大语言模型能够在多个维度实现真正的产品差异化,创业者将围绕这些能力打造针对特定客户群体的独特产品体验:

意图提取:通过领域专业化,可以更准确地将响应与用户意图匹配。例如,医生和患者问同一个问题时会需要看到不同类型的响应。

专有数据:在白领领域,独特的数据集将很重要,如律师的判例法、分析师的财务数据或保险承保人的天气数据。在商业环境下,得到正确答案是最基本的要求。

格式化:结果呈现给用户的方式,例如响应的详略程度、要点的使用、多模态内容的使用、对源的引用等。比如,会计师和记者消化接收信息的方式就不同。

界面设计:代码搜索需要存在于 IDE 中,会计政策搜索需要存在于会计 SaaS 平台中。语义搜索受益于用户现有工作流和数据的上下文。不同领域需要不同的界面交互。 新的特定领域 AI 搜索引擎将尽可能地映射其目标用户的“思维模式”。医生、律师和会计师的思维方式并不相同。当我们成为某个领域的专家时,我们提取知识和做出决策的模式开始出现差异。医生面对医学文献,律师面对法案,投资者面对财报。我们在每个领域解析、分析和基于这些知识做出决策的方式都是不同的。

消费者市场和企业市场很可能会出现分化。作为消费者,我们都有大致相同的需求,这就解释了 ChatGPT 惊人的 PMF(产品市场契合度)。然而,作为专业人士,我们有不同的需求。不难想象,每个知识工作者每天至少会使用两个 AI 搜索引擎——一个用于工作,另一个用于其他一切。

3. 2025 年投资回报率将持续面临问题,资本支出将开始趋于稳定 我们曾撰文探讨过 AI’s $200B question 和 AI’s $600B question,探讨了科技巨头的巨额资本支出,以及最终用户收入不足以支撑这些现金支出的回报问题。 AI’s $200B question:https://www.sequoiacap.com/article/follow-the-gpus-perspective/ AI’s $600B question:https://www.sequoiacap.com/article/ais-600b-question/

步入 2024 年,科技巨头们担心 AI 会威胁到他们在云计算业务中的寡头地位。正如我们在 Game Theory of AI CapEx 中所写,这些公司觉得别无选择,必须积极投入以确保在 AI 未来中的持续的主导地位。如果他们不投入,其他人会投入,他们就会落后。 Game Theory of AI CapEx:https://www.sequoiacap.com/article/ai-optimism-vs-ai-arms-race/ 进入 2025 年,局势发生了戏剧性的变化。

科技巨头们已经牢牢掌控了 AI 革命。他们不仅控制了支撑 AI 的绝大多数数据中心,还在大模型公司中持有重要股权,同时也是新兴 AI 创业公司的主要股东。 随着科技巨头信心增强,我们认为 2025 年将是 AI 资本支出的稳定之年。如果说 2024 年是争相签订土地和电力各种协议,那么 2025 年将是落地执行之年。铲子已经插进土里,这些公司将专注于按时按预算完成新项目。然后他们需要向客户销售这些新的 AI 能力,并帮助企业利用它取得成功。 自 ChatGPT 出现以来,资本支出水平大约翻了一番,2025 年我们可能会看到一些正常化。第三季度发布的最新资本支出数据显示,微软和谷歌内部的趋势线已经开始趋于稳定。亚马逊和 Meta 仍在加速,但可能在 2025 年初达到稳定状态。(尽管 Meta 在下图中看起来平稳,但该公司已发布相关指导文章,预计第四季度资本支出将增加)。

来源:财报记录,公开信息 几大巨头的竞争博弈的格局也逐渐形成。每个科技巨头都密切关注着他们的竞争对手。如果行业看起来正在迈向“新常态”,这对所有人来说都可能是个好消息。这将进一步支持 2025 年达到新的平衡,而不是继续增加资本支出。 随着新的数据中心产能在 2025 年投入使用,AI 算力价格应该会继续大幅下降。这对创业公司来说是个好消息,会激励全新的创新。正如我们过去指出的,创业公司主要是算力的消费者而非生产者,因此他们从产能过剩中受益。科技巨头实际上正在创造一个将惠及整个 AI 生态的补贴。

人们经常将云计算公司与镀金时代(指 19 世纪末到 20 世纪初期间,美国经济快速增长和工业化进程加速的时期)的铁路寡头进行比较。如果说数据中心确实是数字经济的铁路,那么到 2025 年底,新的 AI 铁路将安全就位。剩下的问题是,什么样的货物会在这些铁路上运行,以及我们如何利用这项新技术为客户和最终用户创造价值。 让我们与特工宇宙一起(这句额外加的),期待未来能够利用 AI 的基础设施,创造出改变人们生活的惊人新能力。