即使投资者一度抱持怀疑,大型科技公司、国家政府和创投仍以前所未有的规模向人工智慧投入资金。要理解箇中原因,我们需要了解人工智慧本身正在发生的变化。技术正从传统的大型语言模型转向推理模型和人工智慧代理。

训练传统的大型语言模型(你在大多数人工智慧聊天机器人的免费版本中遇到的那种)需要大量的电力和运算时间。但我们正快速找到减少它们在人类调用时执行所需资源的方法。推理模型基于大型语言模型,不同之处在于它们的实际运行消耗更多资源,包括微晶片和电力。

推理模型崛起:运算需求更胜以往

自 OpenAI 在 9 月预览其第一个推理模型 o1 以来,人工智慧公司一直在竞相发布能够与之竞争的系统。这包括 DeepSeek 的 R1(在今年年初震撼了人工智慧界以及许多科技和电力公司的估值),以及伊隆·马斯克的 xAI(刚刚推出了其 Grok 3 推理模型)。

DeepSeek 引发了一场恐慌,因为它表明可以用比其他模型低得多的成本训练人工智慧模型,这可能会减少对资料中心和昂贵的高阶晶片的需求。但 DeepSeek 实际上做的是将人工智慧产业推向资源密集型推理模型,这意味着运算基础设施仍然非常需要。

由于其增强的功能,这些推理系统很可能很快成为人们在许多任务中使用人工智慧的预设方式。OpenAI 执行长阿特曼表示,该公司人工智慧模型的下一次重大升级将包括高阶推理功能。

为什么推理模型以及它们所支援的产品(如「深度研究」工具和人工智慧代理)需要更多的电力?答案在于它们的工作方式。

推理模型运算资源需求高百倍

NVIDIA 人工智慧产品管理副总裁卡里·布里斯基在最近的一篇官方文章中写道,人工智慧推理模型可以轻鬆使用比传统大型语言模型多 100 倍的运算资源。这种倍增效应来自于推理模型花费数分钟甚至数小时与自己对话(并非使用者都能看到),形成一个漫长的「思维链」。模型使用的运算资源量与生成的单词数成正比,因此生成 100 倍单词来回答问题的推理模型将使用更多的电力和其他资源。

当推理模型去存取网路时,情况会变得更加资源密集,例如 Google、Open AI 和 Perplexity 的「深度研究」模型。

这些对运算能力的需求只是开端。反映这一点,Google、微软和 Meta Platforms 计划在 2025 年集体支出至少 2150 亿美元的资本支出,其中大部分用于人工智慧资料中心。这将比他们去年的资本支出增加 45%。

为了展示对未来人工智慧需求的预测,我们可以列出一个简单的等式。

等式中的第一个值是处理人工智慧(如 ChatGPT)中的单个资讯 tokens 所需的运算资源量。

DeepSeek 引发产业转向:资源密集型推理模型成主流

一月,在中国人工智慧模型 DeepSeek R1 发布后,每个 tokens 的成本(包括运算能力和美元)似乎会暴跌。DeepSeek 及其随附的论文表明,以一种比美国人工智慧实验室先前揭露的方法更有效的方式训练和交付人工智慧是可能的。

从表面上看,这似乎表明人工智慧未来对运算能力的需求将是当前数量的十分之一甚至更少。但推理模型在回答查询时增加的需求可能会弥补这一点。最简单地说,如果基于 DeepSeek 见解的新型更高效人工智慧模型将人工智慧的运算能力需求削减十分之一,但推理模型成为标準并将这些模型的需求增加 100 倍,那么未来人工智慧的电力需求仍然会增加 10 倍。

这只是起点。随着企业发现新型人工智慧模型功能更强大,他们越来越频繁地调用它们。这正在将运算能力的需求从训练模型转向使用它们,即人工智慧产业所说的「推理」。

为其他公司提供人工智慧运算资源的 Baseten 执行长图欣·斯里瓦斯塔瓦表示,向推理的转变已经开始。他的客户包括在其应用程式和服务中使用人工智慧的科技公司,例如 Descript(允许内容创作者直接从录音的文字纪录中编辑音讯和影片)和 PicnicHealth(一家处理医疗纪录的新创公司)。斯里瓦斯塔瓦说,Baseten 的客户发现,随着他们自己产品的需求快速增长,他们需要更多的人工智慧处理能力。

「对于一位客户,我们在六个月前将他们的成本降低了约 60%,但在三个月内,他们的消耗量已经高于最初的消耗量,」他补充道。

Open AI、Google 和 Meta 等公司所有大型人工智慧实验室仍在竞相通过训练功能更强大的人工智慧模型来超越彼此。无论成本如何,目标都是尽可能多地佔领仍处于萌芽状态的人工智慧市场。

Fractional AI 执行长克里斯·泰勒说:「我认为前沿实验室需要不断投入大量资金以推动前沿发展,这是完全有可能的。」该公司总部位于旧金山,帮助其他软件公司建构和整合客制化人工智慧。与 Baseten 和蓬勃发展的人工智慧生态系统中的许多其他公司一样,他的公司依靠这些尖端模型为其客户提供成果。

创投和 Theory Ventures 创办人汤玛斯·童古兹表示,在未来几年内,新的创新和更多人工智慧专用微晶片可能意味着向最终客户交付人工智慧的系统比现在高效一千倍。他补充说,投资者和大型科技公司正在押注,由于推理模型和快速採用,未来十年人工智慧模型的需求量可能会增加一兆倍或更多。

童古兹说:「你键盘上的每一次按键,或你对着麦克风发出的每一个音素,都将由至少一个人工智慧转录或操作。」他补充说,如果是这样,人工智慧市场很快就会比现在大 1000 倍。