ADVERTISEMENT

 

最新消息!人工智慧(AI)巨头OpenAI週四(28日)震撼发布GPT-4.5,这款被誉为历来最强大的大型语言模型(LLM)研究预览版,专为聊天应用量身打造。不过,OpenAI也坦言,GPT-4.5堪称是史上最烧钱的模型。

值得注意的是,GPT-4.5仍属于传统大型语言模型,而非近期备受瞩目的「推理模型」。包括OpenAI、DeepSeek、Anthropic等科技大厂,都已竞相推出推理模型。这类模型主打「思维链」或类意识流的文本生成技术,透过反思自身假设与结论,力求在回应使用者或产出内容前,抓Bug、除错。

儘管如此,OpenAI共同创办人兼执行长奥特曼(SamAltman)在社群平台X(前身为推特)上盛讚,GPT-4.5是「首款让我感觉像在跟真人对话的模型。我多次惊叹AI竟能给出真正实用的建议。」

奥特曼也提醒,由于GPU供货吃紧,OpenAI不得不限缩GPT-4.5的存取权限。他坦言:「坏消息是:这是一款超级庞大且极度昂贵的模型。我们原планировали同步向Plus和Pro用户全面开放,但用户量爆量成长,导致GPU资源捉襟见肘。我们计画下週加码数万颗GPU,后续将逐步向Plus订阅用户解锁。(很快就会有数十万颗GPU陆续到位,我相信大家会物尽其用,榨乾我们部署的每一颗GPU。)这并非我们理想的营运模式,但需求爆冲实在难以神準预测。」

自美东时间週四起,GPT-4.5将率先向OpenAI最顶级的订阅服务ChatGPTPro(月费200美元)用户开放,并同步释出给所有付费API层级的开发者抢先体验。OpenAI也预计在下週将服务範围扩大至价格相对亲民的Plus和Team方案(月费20/30美元)。

功能方面,GPT-4.5支援搜寻功能和画布模式,使用者也能上传档案和图片。但多模态功能(例如语音模式、影片和萤幕共享)暂时缺席,短期内恐难上线。

无监督式学习再进化AI技术大跃进

GPT-4.5代表人工智慧训练领域的显着突破,尤其在无监督式学习方面突飞猛进,大幅提升模型辨识模式、建立关联及产出创新洞见的能力。

OpenAI研究人员透露,GPT-4.5透过基于较小型AI模型生成的数据进行训练,有助于强化其「世界模型」。他们也表示,该模型同步运用多个数据中心进行预训练,意味着它採用了类似竞争对手NousResearch的分散式方法。

这种训练模式显然助攻GPT-4.5学会产出更自然、更直觉的互动,同时更精準掌握使用者意图,并展现更高竿的情商。该模型在OpenAI先前关于人工智慧扩展的研究基础上再创高峰,进一步验证了「增加数据和运算能力有助于提升人工智慧效能」的硬道理。

相较于前代模型及其他同级产品,GPT-4.5预估能大幅降低幻觉现象(幻觉率仅37.1%,相较之下GPT-4为61.8%),大幅提升在处理广泛议题时的可靠度。

GPT-4.5的杀手级特色

根据OpenAI说法,GPT-4.5旨在打造亲切自然、直觉流畅的对话体验。它对语义细微差异和上下文有更强大的掌握能力,能实现更拟人化的互动,并更有效地与使用者协作。

GPT-4.5透过扩充的知识库和敏锐的线索解读能力,在多个领域展现亮眼效能,包括:

——写作辅助:优化内容、提升清晰度、激发创意

——程式设计支援:侦错、提出程式码改进建议、自动化工作流程

——问题解决:提供详尽解释,并协助制定实际决策

此外,GPT-4.5也导入全新的对齐技术,强化其对人类偏好和意图的理解能力,进一步优化使用者体验。

如何抢先体验GPT-4.5?

自美东时间週四起,ChatGPTPro用户即可在网页、手机及桌机端的模型选择选单中,自由选用GPT-4.5。OpenAI计画在下週将该模型扩展至Plus和Team用户。

针对开发者,GPT-4.5将透过OpenAI的API介面释出,包括ChatCompletionsAPI、AssistantsAPI和BatchAPI。它完整支援函数呼叫、结构化输出、串流传输、系统讯息和图像输入等关键功能,使其成为多种人工智慧驱动应用的万用工具。不过,GPT-4.5目前尚不支援语音模式、影片或萤幕共享等多模态功能。

定价策略与企业决策影响

企业和团队领导者可充分利用GPT-4.5带来的多元功能。凭藉更低的幻觉率、更强的可靠性和自然流畅的对话能力,GPT-4.5有望助攻各行各业升级转型:

——优化客户互动:企业可将GPT-4.5整合至客服系统,实现更即时、更自然的互动,同时降低错误率

——强化内容生成:行销和公关团队可高效产出高品质、符合品牌调性的内容

——精简营运流程:AI驱动的自动化功能,可助攻侦错、优化工作流程并辅助策略决策

——高扩展性与客制化:API介面让企业能量身打造,客制化符合特定需求的AI解决方案

然而,对于有意透过GPT-4.5开发应用的第三方开发者而言,GPT-4.5的API定价贵到吓人,每百万tokens输入/输出要价75美元/180美元,相较之下,GPT-4o的定价仅2.50美元/10美元。

随着其他竞品模型接连问世,例如Anthropic的Claude3.7、Google的Gemini2Pro,以及OpenAI自家的推理「o」系列(o1、o3-miniHigh、o3),GPT-4.5的效能提升是否足以弥补其高昂成本,尤其是在透过API串接使用时,将成为后续值得关注的焦点。

AI研究人员与资深用户早期反应褒贬不一

GPT-4.5的发布在社群平台上掀起AI研究人员和科技爱好者的热烈讨论,尤其在该模型的「系统卡」(systemcard,即概述其训练和评估的技术文件)提前外洩后,文件中意外曝光一系列官方公告前的基準测试结果。

OpenAI在外洩事件后发布的最终版系统卡,与外洩版本存在显着差异,删除了外洩版中「GPT-4.5并非前沿模型,但它是OpenAI规模最大的LLM,运算效率较GPT-4提升10倍以上」的说法。OpenAI发言人表示,这种说法并不精确。

人工智慧模型供应商NousResearch的共同创办人Teknium(化名)对OpenAI的新模型表示失望,直言在多语言理解(MMLU)和实际编码基準测试中,GPT-4.5相较其他领先的大型语言模型(LLM),进步幅度微乎其微。Teknium质疑:「距离GPT-4发布已经超过2年,OpenAI投入的资金规模扩大上千倍……究竟发生了什么?」

此外,有人认为,GPT-4.5在软件工程基準测试中表现逊于o3-mini,这让人质疑这次发布是否代表了真正的技术进步。

然而,也有部分用户为GPT-4.5的潜力辩护,认为其价值不应仅仅仰赖基準测试的结果。

软件开发人员Haider(@slow_developer)强调,GPT-4.5相较GPT-4在运算效率上提升了10倍,且其在综合任务处理能力上优于OpenAI专注STEM领域的o系列模型。

AI新闻发布者AndrewCurran(@AndrewCurran_)则从定性角度出发,预测GPT-4.5将在写作和创造性思维领域树立新标竿,并盛讚其为OpenAI的「杰作」。

这些讨论凸显了人工智慧领域一个更广泛的争论:技术进步是否应单纯透过基準测试来衡量,还是应更侧重于推理能力、创造力和拟人化互动等定性方面的改进?

仍处于研究预览阶段

OpenAI将GPT-4.5定位为研究预览版,以深入了解其优势与局限性。该公司表示,将持续探索用户与模型的互动方式,并挖掘非常规应用场景。

OpenAI声称:「我们发布GPT-4.5作为研究预览版,以更深入了解其优势与局限性。扩展无监督式学习将持续推动人工智慧的进步,提升準确性、流畅性和可靠性。」

随着OpenAI不断精进其模型,GPT-4.5为未来的人工智慧进步奠定了基础,尤其是在推理和工具使用代理方面。儘管GPT-4.5已展现令人印象深刻的能力,OpenAI仍积极评估其在生态系统中的长期角色。

凭藉更广泛的知识库、更高的情商和更自然的对话能力,GPT-4.5将为各领域的用户带来显着改进。OpenAI期待看到开发者、企业和团队如何将该模型整合到他们的工作流程和应用中。

随着人工智慧技术的不断进步,GPT-4.5标誌着OpenAI在追求更强大、更可靠、更符合用户需求的语言模型道路上迈出了重要一步,为企业领域的创新带来了新契机。