OR 新媒|oror.vip跨平台阅读首选
2025-04-19 06:08
科技

OpenAI发布新“推理”模型和编程智能体

该公司新发布两款AI“推理”模型o3和o4-mini,试图在AI领域维持其领先地位。
open-AI-CEO-萨姆·阿尔特曼
Jeremy Kahn



OpenAI发布了两款号称“迄今最强大”的AI推理模型,以及一款辅助编程的开源AI智能体,试图在竞争激烈的AI领域维持其领先地位。

这款名为Codex CLI的开源编程智能体,是OpenAI自2019年以来首次推出的重要开源工具。

另外两款新模型分别是其o3模型的完整版本(被OpenAI称为最先进的AI系统),以及一个体积更小但更高效的o4-mini模型。

OpenAI总裁格雷格·布罗克曼在周三的新品发布会上表示:“这是首批被顶尖科学家认可能够真正产生有价值、有创新性的想法的模型。”

这些模型将即刻向付费用户开放,包括ChatGPT Plus和Pro服务的订阅用户,以及使用企业版Teams和API产品的机构。

此次新模型的发布正值OpenAI维持AI领域领先地位面临压力的时刻。今年早些时候,中国公司深度求索(DeepSeek)打破了人们对OpenAI等美国AI实验室长期技术领先的这一固有认知。深度求索的R1模型不仅具备OpenAI o系列模型的“思维链”推理能力,更凭借其开源特性(可免费下载和轻松定制)赢得众多企业青睐。相较之下,OpenAI的多数模型只能通过专有应用程序编程接口(API)付费访问。

与此同时,OpenAI还面临其他闭源模型提供商更加激烈的竞争。2月,AI公司Anthropic率先推出一款模型,既能快速提供类似直觉反应的回答,也能根据提示语要求进行“思维链”逐步推理。这种动态决定何时需要推理和何时需要更快提供回答的能力,正是OpenAI尚未攻克的难题。上个月,谷歌(Google)发布了Gemini 2.5 Pro推理模型,在多项基准测试中击败了OpenAI的o3-mini模型。

周三,OpenAI试图重新夺回在推理模型领域的领先地位。OpenAI宣称其o3和o4-mini模型现已在多项基准测试中领先,尽管这些结果尚未获得第三方验证。该公司还宣称,其模型能够自主调用其他软件工具,如网页浏览、编程环境等,无需用户特别给出指令。

OpenAI在周三的直播中演示了o3模型的能力。研究人员展示了o3模型在分析2015年一份物理研究海报的照片后,自主进行网页搜索,查找更多最新相关研究并对比研究结果。他们还展示了模型自主决定运行Python代码解决数学和编程难题的场景。

OpenAI表示,o3和o4-mini模型可直接对草图、图表甚至模糊的低质量照片进行视觉推理,并能在推理过程中操作图像处理。

而Codex CLI编程智能体设计为本地运行,通过云端接入o3和o4-mini模型进行推理,同时支持调用其他本地部署的软件工具。Codex CLI不仅能建议代码片段,还能自主选择使用不同工具来完成任务。

公司还透露,Codex CLI即将可以使用本周早些时候发布的GPT-4.1模型的功能。

为鼓励开发者使用Codex CLI,OpenAI设立了100万美元基金,将为有潜力的项目提供价值2.5万美元的API积分支持。

OpenAI表示,训练o3模型所使用的算力是前代最强推理模型o1的10倍。


相关内容
+
读者评论
MORE +

热门排行榜
OR
+
open-AI-CEO-萨姆·阿尔特曼
2025-04-19 06:08
科技

OpenAI发布新“推理”模型和编程智能体

该公司新发布两款AI“推理”模型o3和o4-mini,试图在AI领域维持其领先地位。
Jeremy Kahn



OpenAI发布了两款号称“迄今最强大”的AI推理模型,以及一款辅助编程的开源AI智能体,试图在竞争激烈的AI领域维持其领先地位。

这款名为Codex CLI的开源编程智能体,是OpenAI自2019年以来首次推出的重要开源工具。

另外两款新模型分别是其o3模型的完整版本(被OpenAI称为最先进的AI系统),以及一个体积更小但更高效的o4-mini模型。

OpenAI总裁格雷格·布罗克曼在周三的新品发布会上表示:“这是首批被顶尖科学家认可能够真正产生有价值、有创新性的想法的模型。”

这些模型将即刻向付费用户开放,包括ChatGPT Plus和Pro服务的订阅用户,以及使用企业版Teams和API产品的机构。

此次新模型的发布正值OpenAI维持AI领域领先地位面临压力的时刻。今年早些时候,中国公司深度求索(DeepSeek)打破了人们对OpenAI等美国AI实验室长期技术领先的这一固有认知。深度求索的R1模型不仅具备OpenAI o系列模型的“思维链”推理能力,更凭借其开源特性(可免费下载和轻松定制)赢得众多企业青睐。相较之下,OpenAI的多数模型只能通过专有应用程序编程接口(API)付费访问。

与此同时,OpenAI还面临其他闭源模型提供商更加激烈的竞争。2月,AI公司Anthropic率先推出一款模型,既能快速提供类似直觉反应的回答,也能根据提示语要求进行“思维链”逐步推理。这种动态决定何时需要推理和何时需要更快提供回答的能力,正是OpenAI尚未攻克的难题。上个月,谷歌(Google)发布了Gemini 2.5 Pro推理模型,在多项基准测试中击败了OpenAI的o3-mini模型。

周三,OpenAI试图重新夺回在推理模型领域的领先地位。OpenAI宣称其o3和o4-mini模型现已在多项基准测试中领先,尽管这些结果尚未获得第三方验证。该公司还宣称,其模型能够自主调用其他软件工具,如网页浏览、编程环境等,无需用户特别给出指令。

OpenAI在周三的直播中演示了o3模型的能力。研究人员展示了o3模型在分析2015年一份物理研究海报的照片后,自主进行网页搜索,查找更多最新相关研究并对比研究结果。他们还展示了模型自主决定运行Python代码解决数学和编程难题的场景。

OpenAI表示,o3和o4-mini模型可直接对草图、图表甚至模糊的低质量照片进行视觉推理,并能在推理过程中操作图像处理。

而Codex CLI编程智能体设计为本地运行,通过云端接入o3和o4-mini模型进行推理,同时支持调用其他本地部署的软件工具。Codex CLI不仅能建议代码片段,还能自主选择使用不同工具来完成任务。

公司还透露,Codex CLI即将可以使用本周早些时候发布的GPT-4.1模型的功能。

为鼓励开发者使用Codex CLI,OpenAI设立了100万美元基金,将为有潜力的项目提供价值2.5万美元的API积分支持。

OpenAI表示,训练o3模型所使用的算力是前代最强推理模型o1的10倍。


相关内容
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......