OpenAI发布新“推理”模型和编程智能体
+ 查看更多

该公司新发布两款AI“推理”模型o3和o4-mini，试图在AI领域维持其领先地位。

Jeremy Kahn

■

OpenAI发布了两款号称“迄今最强大”的AI推理模型，以及一款辅助编程的开源AI智能体，试图在竞争激烈的AI领域维持其领先地位。

这款名为Codex CLI的开源编程智能体，是OpenAI自2019年以来首次推出的重要开源工具。

另外两款新模型分别是其o3模型的完整版本（被OpenAI称为最先进的AI系统），以及一个体积更小但更高效的o4-mini模型。

OpenAI总裁格雷格·布罗克曼在周三的新品发布会上表示：“这是首批被顶尖科学家认可能够真正产生有价值、有创新性的想法的模型。”

这些模型将即刻向付费用户开放，包括ChatGPT Plus和Pro服务的订阅用户，以及使用企业版Teams和API产品的机构。

此次新模型的发布正值OpenAI维持AI领域领先地位面临压力的时刻。今年早些时候，中国公司深度求索（DeepSeek）打破了人们对OpenAI等美国AI实验室长期技术领先的这一固有认知。深度求索的R1模型不仅具备OpenAI o系列模型的“思维链”推理能力，更凭借其开源特性（可免费下载和轻松定制）赢得众多企业青睐。相较之下，OpenAI的多数模型只能通过专有应用程序编程接口（API）付费访问。

与此同时，OpenAI还面临其他闭源模型提供商更加激烈的竞争。2月，AI公司Anthropic率先推出一款模型，既能快速提供类似直觉反应的回答，也能根据提示语要求进行“思维链”逐步推理。这种动态决定何时需要推理和何时需要更快提供回答的能力，正是OpenAI尚未攻克的难题。上个月，谷歌（Google）发布了Gemini 2.5 Pro推理模型，在多项基准测试中击败了OpenAI的o3-mini模型。

周三，OpenAI试图重新夺回在推理模型领域的领先地位。OpenAI宣称其o3和o4-mini模型现已在多项基准测试中领先，尽管这些结果尚未获得第三方验证。该公司还宣称，其模型能够自主调用其他软件工具，如网页浏览、编程环境等，无需用户特别给出指令。

OpenAI在周三的直播中演示了o3模型的能力。研究人员展示了o3模型在分析2015年一份物理研究海报的照片后，自主进行网页搜索，查找更多最新相关研究并对比研究结果。他们还展示了模型自主决定运行Python代码解决数学和编程难题的场景。

OpenAI表示，o3和o4-mini模型可直接对草图、图表甚至模糊的低质量照片进行视觉推理，并能在推理过程中操作图像处理。

而Codex CLI编程智能体设计为本地运行，通过云端接入o3和o4-mini模型进行推理，同时支持调用其他本地部署的软件工具。Codex CLI不仅能建议代码片段，还能自主选择使用不同工具来完成任务。

公司还透露，Codex CLI即将可以使用本周早些时候发布的GPT-4.1模型的功能。

为鼓励开发者使用Codex CLI，OpenAI设立了100万美元基金，将为有潜力的项目提供价值2.5万美元的API积分支持。

OpenAI表示，训练o3模型所使用的算力是前代最强推理模型o1的10倍。

■