中国人工智能企业创造性压低模型成本
+ 查看更多

从零一万物等初创企业，到阿里巴巴等科技巨头，中国人工智能企业想方设法将“推理”成本降低至美国同行的一个零头。

埃莉诺•奥尔科特

■

由于面临美国芯片限制和比西方同行更少的预算，中国人工智能公司正在降低成本以创建具有竞争力的模型。

01.ai和 DeepSeek 等初创公司通过采取一些策略来降低价格，例如专注于较小的数据集来训练人工智能模型，以及聘请廉价但熟练的计算机工程师。

阿里巴巴、百度和字节跳动等大型科技集团也展开了价格战，以降低推理成本（即调用大型语言模型生成响应的价格），价格下降了 90% 以上，仅为美国同行的一小部分。

尽管中国公司不得不应对华盛顿对最高端 Nvidia AI 芯片出口的禁令，但这种芯片被视为在美国开发最尖端模型的关键。

总部位于北京的01.ai由前谷歌中国区总裁李开复领导，该公司表示，通过构建以较少数据量进行训练、需要较少计算能力的模型并优化硬件，该公司已经降低了推理成本。

李开复向英国《金融时报》表示：中国的优势在于制造出真正价格实惠的推理引擎，然后让其应用广泛传播。

本周，在加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员发布的排名中，01.ai 的 Yi-Lightning 模型与 x.AI 的 Grok-2 在 LLM 公司中并列第三，但落后于 OpenAI 和谷歌。

评估基于用户对不同模型对查询答案的评分。字节跳动、阿里巴巴和 DeepSeek 等其他中国公司也在法学硕士排名榜上名列前茅。

01.ai 的 Yi-Lightning 的推理成本为每百万代币 14 美分，而 OpenAI 的较小模型 GPT o1-mini 的推理成本为 26 美分。与此同时，OpenAI 规模更大的 GPT 4o 的推理成本为每百万代币 4.40 美元。用于生成响应的代币数量取决于查询的复杂性。

李还表示，Yi-Lightning 的预训练成本为 300 万美元，初始模型训练之后可以针对不同用例进行微调或定制。这只是 OpenAI 等公司对其大型模型所报成本的一小部分。

他补充说，其目标不是拥有最佳模型，而是一个具有竞争力的模型，开发人员使用它来构建应用程序的成本要低 5 到 10 倍。

01.ai、DeepSeek、MiniMax、Stepfun等许多中国人工智能团体都采用了所谓的专家模型方法，这一策略首先由美国研究人员推广。

该方法不是在从互联网和其他来源抓取数据的庞大数据库上一次性训练一个密集模型，而是结合了许多针对行业特定数据进行训练的神经网络。

研究人员认为，专家模型方法是实现与密集模型相同智能水平但计算能力较低的关键方法。但这种方法更容易失败，因为工程师必须协调多个专家的训练过程，而不是在一个模型中。

由于难以获得稳定充足的高端人工智能芯片供应，中国人工智能企业在过去一年中一直在竞相开发最高质量的数据集，以训练这些专家，从而使自己在竞争中脱颖而出。

李表示，01.ai 的数据收集方法超越了传统的互联网抓取方法，包括扫描书籍和抓取通讯应用程序微信上的文章，而这些在开放网络上是无法访问的。

他说，工程师对数据进行标记和排序需要做很多吃力不讨好的工作，但他补充说，中国拥有大量廉价的工程人才，比美国更适合做这些工作。

李说：中国的优势不在于在预算不受限制的情况下，进行前所未有的突破性研究。中国的优势在于建设得好、建设得快、建设得可靠、建设得便宜。

■