AI大模型不“香”了？企业现在青睐这类模型
+ 查看更多

企业正在寻找更简单、更低成本的方式来部署AI。

Isabelle Bousquette

■

越来越多的公司正部署较小型及中型生成式AI模型，更青睐这种规模缩小、成本效益高的技术，而不是在AI热潮早期掀起波澜的那种热炒的大型模型。

OpenAI的GPT-4等基础模型开发成本超过1亿美元，使用超过一万亿个参数（这是其规模的一个衡量标准），较小型模型与之不同，使用较少的数据进行训练，通常是为特定任务而设计的。

几乎所有的模型提供商都在转向提供更多此类模型，包括微软(Microsoft)、谷歌(Google)以及Mistral、Anthropic和Cohere等初创公司。

首席信息官们表示，对于一些最常见的AI用例（通常涉及文件分类等小范围的重复性任务）来说，较小型及中型模型更有意义。而且由于较小型模型使用的算力较少，运行成本也更低。

企业在慢慢转向部署更多AI用例的同时，也面临着对这种昂贵技术控制成本和回报的压力，上述转变正是发生在这种背景之下。

网络安全、内容分发和云计算公司Akamai的首席技术官Robert Blumofe说：“在整个万维网上训练出来的巨型大语言模型可能会严重大材小用。”他说，对于企业用例来说，“你并不需要一个知道《教父》(The Godfather)所有演员、知道所有电影、知道所有电视节目的AI模型。”

Google Cloud全球生成式AI产品上市策略副总裁Oliver Parker表示，在过去三个月里，他已经看到企业转向中型模型，部分原因是这些模型符合捕捉更多企业用例的标准。

非银行抵押贷款服务商和发起人Mr. Cooper首席信息官Sridhar Sharma说，Mr. Cooper正在其呼叫中心测试中型模型的功能，以分析语音数据，帮助座席人员了解对话的可能走向，以及客户可能会问的问题。

Sharma说：“我们不需要仅仅因为某个东西更大就对其进行过度设计，”并称Mr. Cooper也在使用大型基础模型来处理更复杂的用例。

到目前为止，道明银行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型来帮助呼叫中心工作人员更快地回答客户咨询。道明银行首席AI科学家Maksims Volkovs称，该行最近还与AI模型提供商Cohere签订了合作协议，将研究是Cohere的小型模型还是中型模型在该用例和其他用例中更有效、更具成本效益。

Volkovs说，他将从成本、准确性和延迟方面对Cohere的模型和OpenAI的产品进行评估。Volkovs说，他预计中型模型将在某些情景下胜出。

他说，在准确性和成本之间进行权衡应该更有利。

营销服务公司WPP的首席技术官Stephan Pretorius说，一些企业一年前还倾向于使用少数大模型。他说，当企业在有限的试点范围内使用大模型时，这种做法还算不错，但现在随着范围的扩大，大模型的成本很快就会失控。WPP正在使用谷歌Gemini系列中的几个模型，包括中型模型Flash。

Flash适合用于分析不同国家的购物习惯，并利用分析结果为给定产品撰写合适的网络文案。例如，在英国销售的睫毛膏的文案最好能突出防水功能。撰写这样的文案正是中型模型大显身手之处，Pretorius说。

Pretorius说，对于需要海量数据、创造力和进行解释的复杂用例，大模型仍然具有实用价值。他举例称，大模型适用于读取莎士比亚(Shakespeare)的所有作品，并分析女性角色与男性角色在不同时期的对比情况。但这并不在WPP的任务清单上。

注：本文仅代表作者个人观点

■