人工智慧(AI)产业掀起一股新热潮,一个新名词「博士级AI」正席捲硅谷。根据美国科技媒体《The Information》报导,AI龙头OpenAI可能计画推出多款专业AI代理产品,其中最高阶方案每月订阅费高达2万美元(约新台币64万元),主打支援「博士级研究」。其他方案则包括每月2000美元(约新台币6.4万元)的「高收入知识工作者」助理,以及每月1万美元(约新台币32万元)的软件开发代理。这一系列天价计画也引发外界对「博士级AI」定义与价值的激烈讨论。
「博士级AI」是什么?
OpenAI尚未正式证实这些价格,但「博士级AI」的概念并非首次出现。简单来说,这类AI指的是具备博士级专业能力的模型,能独立完成高难度任务,例如进行尖端学术研究、撰写複杂程式码并除错,甚至分析大规模数据并生成详尽报告。OpenAI宣称,这类模型解决的问题,通常需要人类花费多年学术训练才能胜任。
这种能力从何而来?OpenAI以自家模型在基準测试中的表现作为依据。例如,其o1系列模型在科学、程式设计与数学测试中,成绩堪比人类博士生。该公司还开发了一款名为「Deep Research」的工具,能生成带引用的研究论文,在涵盖逾百个科目、3000多题的「人类最后考试」中拿下26.6%的得分。去年12月推出的o3与o3-mini模型更进一步,採用「私有思维链」(private chain of thought)技术,让AI模拟人类的推理过程,逐步解决问题后给出答案。
OpenAI强调,这种技术模仿了人类研究者在面对複杂问题时的思考模式,而非立即吐出答案。他们认为,投入更多「推理时间计算」(inference-time compute),AI的回答品质会更好。因此,每月2万美元的高价,可能是在买AI针对艰难问题的「深度思考时间」。
亮眼的基準测试成绩
OpenAI的o3模型在多项测试中创下佳绩。例如,在ARC-AGI视觉推理基準测试中,o3于高计算环境下得分87.5%,接近人类85%的水準;在2024年美国邀请数学考试中拿下96.7%,仅错一题;在研究生级的GPQA Diamond测试(涵盖生物、物理、化学)中得分87.7%。更令人惊叹的是,在EpochAI的Frontier Math基準测试中,o3解决了25.2%的数学问题,而其他模型最高不超过2%,显示其数学推理能力大幅领先。
这些成绩让OpenAI信心满满,认为「博士级AI」能应用于医疗研究数据分析、气候模拟,甚至承担研究工作的例行任务,为企业带来巨大价值。据报导,OpenAI投资者软银今年将砸下30亿美元(约新台币960亿元)採购这些代理产品,显示市场对此寄予厚望。
然而,这种高定价策略也可能与OpenAI的财务困境有关。据悉,该公司去年因运营成本与服务支出,亏损约50亿美元(约新台币1600亿元)。过去数年,OpenAI以相对亲民的价格(如ChatGPT Plus每月20美元,约新台币640元)培养用户习惯,如今推出企业级高价方案,能否让用户接受,仍是未知数。相较之下,竞争对手Claude Pro每月30美元(约新台币960元),即使ChatGPT Pro订阅费200美元(约新台币6400元),与新方案相比仍是小巫见大巫。
「博士级」真的名副其实?
儘管基準测试成绩亮眼,专家与网友对「博士级AI」标籤存疑。这些模型虽能快速处理与整合资讯,但在创造性思维、批判性怀疑及原创研究——真正博士工作的核心——上的表现仍受质疑。更令人担忧的是,AI常出现「虚构」(confabulation),即生成看似合理却错误的资讯,这在讲求精準的研究领域是致命缺陷。每月花费64万新台币,企业是否能信任AI不犯错,成为一大隐忧。
社群媒体上,许多人调侃不如直接聘请真博士。xAI开发者Hieu Pham在推特上写道:「别忘了,大多数博士生,包括那些远超当前AI的顶尖人才,月薪远不到2万美元。」确实,在台湾,一名博士生的奖学金或起薪约在5万至7万台币之间,与OpenAI的订阅费相比,性价比显得更高。
虚拟博士 vs. 真博士
「博士级AI」的出现,让人不禁思考:硅谷是否过分高估了虚拟博士的价值?这些AI无需休息、不用保险,且能力有望持续进化、成本逐渐下降,确实具备长期优势。但现阶段,它们更像高效的工具,而非能取代人类博士的「全能研究者」。对台湾学术界与产业来说,这股AI浪潮或许是个启发:如何结合AI与本地人才,创造更大价值,可能比单纯追逐「博士级AI」更值得关注。
随着OpenAI的计画逐步明朗,这场虚拟与真实博士的价值之争,恐怕才刚开始。