OR 新媒|oror.vip跨平台阅读首选
2024-12-18 17:49
科技

OpenAI向开发者开放满血版o1:推理成本暴降60%

当地时间12月18日,OpenAI 开启了第9天技术分享直播,正式宣布将o1模型引入其API。虽然目前只面向部分开发者,但仍被称为OpenAI连续直播这么久以来“最有用的一天”。
张一鸣的路,OpenAI走得通吗?
连政


当地时间12月18日,OpenAI 开启了第9天技术分享直播,正式宣布将o1模型引入其API。虽然目前只面向部分开发者,但仍被称为OpenAI连续直播这么久以来“最有用的一天”。

面向开发者,已大幅降低思考成本

据悉,本次发布的OpenAI模型o1取代了9月份发布的预览版o1-preview,它相对于此前模型,大大增强推理和纠错功能。而完全版o1还支持函数调用、开发人员消息、结构化输出和视觉功能。

具体而言,o1相对于o1-preview,开发者们现在可以将其无缝连接到外部数据和API;同时,o1还能够生成可靠遵守自定义JSON构架的响应;并可以指定模型要遵循的说明或上下文,如定义语气、样式和其他行为指导。此外,o1还可以对图象进行推理,解锁尤其是制造业、科学和编码领域的应用前景。

由于拥有在输出内容前自我核实纠错的功能,推理模型一般都会需要更长的思考时间,因此价格也非常昂贵。然而相对于o1-preview,本次发布的o1完整版,其思考成本大幅降低了60%。并且,新增的API参数“reasoning_effort”允许用户控制模型在回答问题前的思考时间。

不过,o1模型目前只面向API使用权限5级的开发者,这意味着想率先体验o1,必须要满足“在OpenAI的产品上花费至少1000美元”、“且付费后使用30天”等要求。

专业领域超越人类博士,已被专家警告

早在今年9月底,OpenAI发布o1-preview和o1-mini时,就曾评估称,o1在编程问题中能拿到89%百分位的成绩,在美国数学奥林匹克资格赛中跻身前500名。而风险处理前的o1原始模型组在涉化学、生物、放射以及核(CBRN)武器等生物威胁上同样表现“优秀”,达到了“中等”(medium)风险水平,全面超过了人类博士专家,准确率达到72%,而人类专家的得分仅为69.5%。

OpenAI还透露,他们要求6名生物威胁领域的专家通过一周时间中多轮对话体验o1-preview涉化生放核风险内容,专家们都表示,o1在回答互联网之外的问题时非常有用;甚至还有2人表示,o1可以帮助其获取互联网中找不到的信息。

对此,人工神经网络和深度学习专家约书亚·本吉奥(Yoshua Bengio)就表示,如果o1真的如同OpenAI所言达到了化生放核的“中等”风险水平,那么进一步加强了全面出台“SB-1047法案”的重要性。该法案是此前加州为增强大模型安全、透明性、使用规范而拟定的条例,但因实施上存在一些问题(如犯罪分子利用大模型犯罪,开发商也会被处罚)最终被否决。

随着人工智能推理能力的提升,就会出现被恶意滥用的风险,本吉奥警告称“这尤其危险”。

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
读者评论
MORE +

热门排行榜
OR
+
张一鸣的路,OpenAI走得通吗?
2024-12-18 17:49
科技

OpenAI向开发者开放满血版o1:推理成本暴降60%

当地时间12月18日,OpenAI 开启了第9天技术分享直播,正式宣布将o1模型引入其API。虽然目前只面向部分开发者,但仍被称为OpenAI连续直播这么久以来“最有用的一天”。
连政


当地时间12月18日,OpenAI 开启了第9天技术分享直播,正式宣布将o1模型引入其API。虽然目前只面向部分开发者,但仍被称为OpenAI连续直播这么久以来“最有用的一天”。

面向开发者,已大幅降低思考成本

据悉,本次发布的OpenAI模型o1取代了9月份发布的预览版o1-preview,它相对于此前模型,大大增强推理和纠错功能。而完全版o1还支持函数调用、开发人员消息、结构化输出和视觉功能。

具体而言,o1相对于o1-preview,开发者们现在可以将其无缝连接到外部数据和API;同时,o1还能够生成可靠遵守自定义JSON构架的响应;并可以指定模型要遵循的说明或上下文,如定义语气、样式和其他行为指导。此外,o1还可以对图象进行推理,解锁尤其是制造业、科学和编码领域的应用前景。

由于拥有在输出内容前自我核实纠错的功能,推理模型一般都会需要更长的思考时间,因此价格也非常昂贵。然而相对于o1-preview,本次发布的o1完整版,其思考成本大幅降低了60%。并且,新增的API参数“reasoning_effort”允许用户控制模型在回答问题前的思考时间。

不过,o1模型目前只面向API使用权限5级的开发者,这意味着想率先体验o1,必须要满足“在OpenAI的产品上花费至少1000美元”、“且付费后使用30天”等要求。

专业领域超越人类博士,已被专家警告

早在今年9月底,OpenAI发布o1-preview和o1-mini时,就曾评估称,o1在编程问题中能拿到89%百分位的成绩,在美国数学奥林匹克资格赛中跻身前500名。而风险处理前的o1原始模型组在涉化学、生物、放射以及核(CBRN)武器等生物威胁上同样表现“优秀”,达到了“中等”(medium)风险水平,全面超过了人类博士专家,准确率达到72%,而人类专家的得分仅为69.5%。

OpenAI还透露,他们要求6名生物威胁领域的专家通过一周时间中多轮对话体验o1-preview涉化生放核风险内容,专家们都表示,o1在回答互联网之外的问题时非常有用;甚至还有2人表示,o1可以帮助其获取互联网中找不到的信息。

对此,人工神经网络和深度学习专家约书亚·本吉奥(Yoshua Bengio)就表示,如果o1真的如同OpenAI所言达到了化生放核的“中等”风险水平,那么进一步加强了全面出台“SB-1047法案”的重要性。该法案是此前加州为增强大模型安全、透明性、使用规范而拟定的条例,但因实施上存在一些问题(如犯罪分子利用大模型犯罪,开发商也会被处罚)最终被否决。

随着人工智能推理能力的提升,就会出现被恶意滥用的风险,本吉奥警告称“这尤其危险”。

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......