OR 新媒|oror.vip跨平台阅读首选
2024-09-15 06:05
科技

OpenAI发布具有类人推理能力的o1模型

有了这个模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。
OpenAI将推出搜索引擎SearchGPT,直接挑战谷歌
RACHEL METZ,彭博社


OpenAI正发布一款新人工智能模型,内部称为“草莓”,可以执行一些类似人类的推理任务,寄希望于在竞争激烈的市场中保持领先地位。

该公司周四在一篇博文中说,这款名为“o1”的新模型在回应用户询问之前,会花更多时间计算答案。有了这个模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。

该公司表示:“作为一个早期模型,它还不具备很多使ChatGPT变得有用的功能,比如浏览网页获取信息、上传文件和图片等。但对于复杂推理任务来说,这是一项重大进步,代表了人工智能能力的新水平。鉴于此,我们将计数器重置回1,并将该系列命名为OpenAI o1。”

付费ChatGPT Plus和团队用户将于周四通过OpenAI的热门聊天机器人访问该模型的预览版。彭博社此前报道称,该公司最快将于本周发布这款新模型。

该模型发布之际,总部位于旧金山的OpenAI正寻求筹集数十亿美元的资金,并在开发更复杂的人工智能系统的竞赛中面临着日益激烈的竞争。OpenAI并不是唯一一家致力于开发此类功能的公司;竞争对手Anthropic和谷歌也在其先进的人工智能模型中标榜了“推理”能力。

OpenAI在其博文中举例说明了该人工智能模型对编码、英语和数学等主题的问题的回答,并要求它解决一个简单的填字游戏。OpenAI的研究科学家诺姆·布朗(Noam Brown)在X上发表了一系列文章,表示该公如今发布这个模型的预览版,部分原因是为了了解人们是如何使用它的,以及它在哪些方面需要改进。

使用OpenAI更新的人工智能系统的体验将与人们对该公司聊天机器人ChatGPT的期望有所不同。在对用户的提示做出回应之前,新软件会暂停几秒钟,在用户看不见的幕后,它会考虑一些相关的提示,然后总结出似乎是最好的答案。这种技术有时被称为“思维链”提示。

一段时间以来,OpenAI一直致力于让计算机执行多步骤操作。例如,在2023年5月,该公司发布了一篇博文和一篇随附的研究论文,介绍了其为提高人工智能系统解决数学问题的能力所做的努力。根据这篇论文,该公司训练一个模型的方法是,奖励它在得出答案过程中的每一个正确步骤,而不仅仅是奖励它生成了准确答案。

■ 
                                                                                         
相关内容
+
读者评论
MORE +

热门排行榜
OR
+
OpenAI将推出搜索引擎SearchGPT,直接挑战谷歌
2024-09-15 06:05
科技

OpenAI发布具有类人推理能力的o1模型

有了这个模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。
RACHEL METZ,彭博社


OpenAI正发布一款新人工智能模型,内部称为“草莓”,可以执行一些类似人类的推理任务,寄希望于在竞争激烈的市场中保持领先地位。

该公司周四在一篇博文中说,这款名为“o1”的新模型在回应用户询问之前,会花更多时间计算答案。有了这个模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。

该公司表示:“作为一个早期模型,它还不具备很多使ChatGPT变得有用的功能,比如浏览网页获取信息、上传文件和图片等。但对于复杂推理任务来说,这是一项重大进步,代表了人工智能能力的新水平。鉴于此,我们将计数器重置回1,并将该系列命名为OpenAI o1。”

付费ChatGPT Plus和团队用户将于周四通过OpenAI的热门聊天机器人访问该模型的预览版。彭博社此前报道称,该公司最快将于本周发布这款新模型。

该模型发布之际,总部位于旧金山的OpenAI正寻求筹集数十亿美元的资金,并在开发更复杂的人工智能系统的竞赛中面临着日益激烈的竞争。OpenAI并不是唯一一家致力于开发此类功能的公司;竞争对手Anthropic和谷歌也在其先进的人工智能模型中标榜了“推理”能力。

OpenAI在其博文中举例说明了该人工智能模型对编码、英语和数学等主题的问题的回答,并要求它解决一个简单的填字游戏。OpenAI的研究科学家诺姆·布朗(Noam Brown)在X上发表了一系列文章,表示该公如今发布这个模型的预览版,部分原因是为了了解人们是如何使用它的,以及它在哪些方面需要改进。

使用OpenAI更新的人工智能系统的体验将与人们对该公司聊天机器人ChatGPT的期望有所不同。在对用户的提示做出回应之前,新软件会暂停几秒钟,在用户看不见的幕后,它会考虑一些相关的提示,然后总结出似乎是最好的答案。这种技术有时被称为“思维链”提示。

一段时间以来,OpenAI一直致力于让计算机执行多步骤操作。例如,在2023年5月,该公司发布了一篇博文和一篇随附的研究论文,介绍了其为提高人工智能系统解决数学问题的能力所做的努力。根据这篇论文,该公司训练一个模型的方法是,奖励它在得出答案过程中的每一个正确步骤,而不仅仅是奖励它生成了准确答案。

■ 
                                                                                         
相关内容
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......