OR 新媒|oror.vip跨平台阅读首选
2024-07-18 16:11
商业与经济

AI大模型不“香”了?企业现在青睐这类模型

企业正在寻找更简单、更低成本的方式来部署AI。
日常工作中的七个难题,AI帮我解决了
Isabelle Bousquette


越来越多的公司正部署较小型及中型生成式AI模型,更青睐这种规模缩小、成本效益高的技术,而不是在AI热潮早期掀起波澜的那种热炒的大型模型。

OpenAI的GPT-4等基础模型开发成本超过1亿美元,使用超过一万亿个参数(这是其规模的一个衡量标准),较小型模型与之不同,使用较少的数据进行训练,通常是为特定任务而设计的。

几乎所有的模型提供商都在转向提供更多此类模型,包括微软(Microsoft)、谷歌(Google)以及Mistral、Anthropic和Cohere等初创公司。

首席信息官们表示,对于一些最常见的AI用例(通常涉及文件分类等小范围的重复性任务)来说,较小型及中型模型更有意义。而且由于较小型模型使用的算力较少,运行成本也更低。

企业在慢慢转向部署更多AI用例的同时,也面临着对这种昂贵技术控制成本和回报的压力,上述转变正是发生在这种背景之下。

网络安全、内容分发和云计算公司Akamai的首席技术官Robert Blumofe说:“在整个万维网上训练出来的巨型大语言模型可能会严重大材小用。”他说,对于企业用例来说,“你并不需要一个知道《教父》(The Godfather)所有演员、知道所有电影、知道所有电视节目的AI模型。”

Google Cloud全球生成式AI产品上市策略副总裁Oliver Parker表示,在过去三个月里,他已经看到企业转向中型模型,部分原因是这些模型符合捕捉更多企业用例的标准。

非银行抵押贷款服务商和发起人Mr. Cooper首席信息官Sridhar Sharma说,Mr. Cooper正在其呼叫中心测试中型模型的功能,以分析语音数据,帮助座席人员了解对话的可能走向,以及客户可能会问的问题。

Sharma说:“我们不需要仅仅因为某个东西更大就对其进行过度设计,”并称Mr. Cooper也在使用大型基础模型来处理更复杂的用例。

到目前为止,道明银行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型来帮助呼叫中心工作人员更快地回答客户咨询。道明银行首席AI科学家Maksims Volkovs称,该行最近还与AI模型提供商Cohere签订了合作协议,将研究是Cohere的小型模型还是中型模型在该用例和其他用例中更有效、更具成本效益。

Volkovs说,他将从成本、准确性和延迟方面对Cohere的模型和OpenAI的产品进行评估。Volkovs说,他预计中型模型将在某些情景下胜出。

他说,在准确性和成本之间进行权衡应该更有利。

营销服务公司WPP的首席技术官Stephan Pretorius说,一些企业一年前还倾向于使用少数大模型。他说,当企业在有限的试点范围内使用大模型时,这种做法还算不错,但现在随着范围的扩大,大模型的成本很快就会失控。WPP正在使用谷歌Gemini系列中的几个模型,包括中型模型Flash。

Flash适合用于分析不同国家的购物习惯,并利用分析结果为给定产品撰写合适的网络文案。例如,在英国销售的睫毛膏的文案最好能突出防水功能。撰写这样的文案正是中型模型大显身手之处,Pretorius说。

Pretorius说,对于需要海量数据、创造力和进行解释的复杂用例,大模型仍然具有实用价值。他举例称,大模型适用于读取莎士比亚(Shakespeare)的所有作品,并分析女性角色与男性角色在不同时期的对比情况。但这并不在WPP的任务清单上。

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
读者评论
MORE +

热门排行榜
OR
+
日常工作中的七个难题,AI帮我解决了
2024-07-18 16:11
商业与经济

AI大模型不“香”了?企业现在青睐这类模型

企业正在寻找更简单、更低成本的方式来部署AI。
Isabelle Bousquette


越来越多的公司正部署较小型及中型生成式AI模型,更青睐这种规模缩小、成本效益高的技术,而不是在AI热潮早期掀起波澜的那种热炒的大型模型。

OpenAI的GPT-4等基础模型开发成本超过1亿美元,使用超过一万亿个参数(这是其规模的一个衡量标准),较小型模型与之不同,使用较少的数据进行训练,通常是为特定任务而设计的。

几乎所有的模型提供商都在转向提供更多此类模型,包括微软(Microsoft)、谷歌(Google)以及Mistral、Anthropic和Cohere等初创公司。

首席信息官们表示,对于一些最常见的AI用例(通常涉及文件分类等小范围的重复性任务)来说,较小型及中型模型更有意义。而且由于较小型模型使用的算力较少,运行成本也更低。

企业在慢慢转向部署更多AI用例的同时,也面临着对这种昂贵技术控制成本和回报的压力,上述转变正是发生在这种背景之下。

网络安全、内容分发和云计算公司Akamai的首席技术官Robert Blumofe说:“在整个万维网上训练出来的巨型大语言模型可能会严重大材小用。”他说,对于企业用例来说,“你并不需要一个知道《教父》(The Godfather)所有演员、知道所有电影、知道所有电视节目的AI模型。”

Google Cloud全球生成式AI产品上市策略副总裁Oliver Parker表示,在过去三个月里,他已经看到企业转向中型模型,部分原因是这些模型符合捕捉更多企业用例的标准。

非银行抵押贷款服务商和发起人Mr. Cooper首席信息官Sridhar Sharma说,Mr. Cooper正在其呼叫中心测试中型模型的功能,以分析语音数据,帮助座席人员了解对话的可能走向,以及客户可能会问的问题。

Sharma说:“我们不需要仅仅因为某个东西更大就对其进行过度设计,”并称Mr. Cooper也在使用大型基础模型来处理更复杂的用例。

到目前为止,道明银行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型来帮助呼叫中心工作人员更快地回答客户咨询。道明银行首席AI科学家Maksims Volkovs称,该行最近还与AI模型提供商Cohere签订了合作协议,将研究是Cohere的小型模型还是中型模型在该用例和其他用例中更有效、更具成本效益。

Volkovs说,他将从成本、准确性和延迟方面对Cohere的模型和OpenAI的产品进行评估。Volkovs说,他预计中型模型将在某些情景下胜出。

他说,在准确性和成本之间进行权衡应该更有利。

营销服务公司WPP的首席技术官Stephan Pretorius说,一些企业一年前还倾向于使用少数大模型。他说,当企业在有限的试点范围内使用大模型时,这种做法还算不错,但现在随着范围的扩大,大模型的成本很快就会失控。WPP正在使用谷歌Gemini系列中的几个模型,包括中型模型Flash。

Flash适合用于分析不同国家的购物习惯,并利用分析结果为给定产品撰写合适的网络文案。例如,在英国销售的睫毛膏的文案最好能突出防水功能。撰写这样的文案正是中型模型大显身手之处,Pretorius说。

Pretorius说,对于需要海量数据、创造力和进行解释的复杂用例,大模型仍然具有实用价值。他举例称,大模型适用于读取莎士比亚(Shakespeare)的所有作品,并分析女性角色与男性角色在不同时期的对比情况。但这并不在WPP的任务清单上。

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......