OpenAI发布具有类人推理能力的o1模型
+ 查看更多

有了这个模型，OpenAI的工具应该能够解决多步骤问题，包括复杂的数学和编码问题。

RACHEL METZ，彭博社

■

OpenAI正发布一款新人工智能模型，内部称为“草莓”，可以执行一些类似人类的推理任务，寄希望于在竞争激烈的市场中保持领先地位。

该公司周四在一篇博文中说，这款名为“o1”的新模型在回应用户询问之前，会花更多时间计算答案。有了这个模型，OpenAI的工具应该能够解决多步骤问题，包括复杂的数学和编码问题。

该公司表示：“作为一个早期模型，它还不具备很多使ChatGPT变得有用的功能，比如浏览网页获取信息、上传文件和图片等。但对于复杂推理任务来说，这是一项重大进步，代表了人工智能能力的新水平。鉴于此，我们将计数器重置回1，并将该系列命名为OpenAI o1。”

付费ChatGPT Plus和团队用户将于周四通过OpenAI的热门聊天机器人访问该模型的预览版。彭博社此前报道称，该公司最快将于本周发布这款新模型。

该模型发布之际，总部位于旧金山的OpenAI正寻求筹集数十亿美元的资金，并在开发更复杂的人工智能系统的竞赛中面临着日益激烈的竞争。OpenAI并不是唯一一家致力于开发此类功能的公司；竞争对手Anthropic和谷歌也在其先进的人工智能模型中标榜了“推理”能力。

OpenAI在其博文中举例说明了该人工智能模型对编码、英语和数学等主题的问题的回答，并要求它解决一个简单的填字游戏。OpenAI的研究科学家诺姆·布朗（Noam Brown）在X上发表了一系列文章，表示该公如今发布这个模型的预览版，部分原因是为了了解人们是如何使用它的，以及它在哪些方面需要改进。

使用OpenAI更新的人工智能系统的体验将与人们对该公司聊天机器人ChatGPT的期望有所不同。在对用户的提示做出回应之前，新软件会暂停几秒钟，在用户看不见的幕后，它会考虑一些相关的提示，然后总结出似乎是最好的答案。这种技术有时被称为“思维链”提示。

一段时间以来，OpenAI一直致力于让计算机执行多步骤操作。例如，在2023年5月，该公司发布了一篇博文和一篇随附的研究论文，介绍了其为提高人工智能系统解决数学问题的能力所做的努力。根据这篇论文，该公司训练一个模型的方法是，奖励它在得出答案过程中的每一个正确步骤，而不仅仅是奖励它生成了准确答案。

■