OR 新媒|oror.vip跨平台阅读首选
2024-09-19 12:00
科技

中美大语言模型竞逐:全球视角下的机遇与挑战

蒋镇辉、李佳欣:随着大语言模型被应用到越来越多领域,如何在中美两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。
中国AI人工智能企业创造性压低模型成本
蒋镇辉、李佳欣


随着大语言模型被应用到越来越多的领域,如何在中美两国的竞争动态中找到平衡点并推动合作,将成为未来几年的发展关键。

自从 ChatGPT 问世以来,大语言模型LLM(Large Language Model)迅速成为全球科技竞赛的焦点。这些模型不仅在对话类比、数据处理、创意任务等方面展现出非凡的能力,更被视为迈向通用人工智能AGI(Artificial General Intelligence)——即具备人类般认知和推理能力的人工智能—— 的关键一步。 这场技术革命激发全球投资热潮,也将中美两国在人工智能领域的竞争推向新的高度。根据斯坦福大学发布的《2024人工智能指数报告》,美国在基础模型研发方面持续大幅领先,而中国无论在AI专利申请和成功获取专利数量上均位居榜首,反映两国在技术创新发展中有不同路径与策略【注1】。在这一背景下,深入了解并比较中美两国大语言模型的发展现状,不仅有助于洞悉这场竞争的格局,还为未来国际合作提供了新的视角与机会。

中美LLM竞争格局:中英文环境的比较

大语言模型的多语言表现是衡量其全球竞争力的重要标准。虽然ChatGPT在英文环境中表现出色,但在其他语言环境中的能力仍需进一步验证【注2】; 同样,源自中国团队或原生于中文的大模型在本土语境中表现优异【注3】,但在英文测试中可能仍有不足,全面了解这些模型在不同语言环境中的表现尤其重要。为此,我们通过系统性的评估框架,在2024年上半年对16个具代表性的大语言模型进行了中英文表现的比较【注4】【注5】。这些模型来自中美两国的技术巨头、顶尖大学,以及人工智能领域的新锐初创企业。

在英文环境的测试中,GPT-4 Turbo凭借其卓越的自然语言能力和学科专长排名第一; 而Gemini Pro和Llama 2则分别位列第二和第三。中国的文心一言4(ERNIE Bot 4)是英文测试中表现最佳的国产模型,综合排名仅达第五位,略高于Claude 2和GPT-3.5 Turbo,唯未能超越GPT-4【注5】。 在中文测试中,文心一言4则超越GPT-4 Turbo排名第一,整体表现最佳【注4】。总体来看,中国的领先模型在中文环境中的表现强劲,但在其他语言环境下仍有较大提升空间。

新动态:多模态与跨领域应用的兴起

随着大语言模型技术不断成熟,LLM正迅速向多模态与跨领域应用扩展,成为AI发展的新蓝海。多模态能力让模型不仅能够处理文本,还能理解和生成图像、音频和视频内容,大大拓宽了其应用场景。例如,OpenAI最新推出的GPT-4o能够同时处理文本、语音和视觉信息,为增强现实、智能监控和自动驾驶等应用提供了新的可能性。

与此同时,LLM的跨领域应用也在不断加速。微软与OpenAI合作,把GPT-4深度集成到办公软件中,帮助用户提高工作效率; 百度的文心大模型不仅用于搜索引擎,还被广泛纳入企业客服和智能家居等场景。此外,垂直领域LLM也层出不穷。例如上海人工智能实验室(上海AI实验室)与瑞金医院合作推出“浦医2.0”(OpenMEDLab2.0)医疗多模态基础模型群,旨在赋能智能影像诊断、虚拟手术、智慧临床决策等应用场景建设,为未来的“AI医院”提供支持。这些应用案例不仅充分展示LLM的多样化潜力,也催生市场对高性能、高安全性AI模型的强烈需求。

未来发展方向:中美差异与合作机遇

展望未来,大语言模型的发展将重点围绕多模态能力的进一步深化、跨领域应用的扩展,以及安全性与伦理责任的提升。目前,美国在基础技术开发和创新应用上具有明显优势,其模型往往在技术前沿上表现出色; 而中国的模型更强调针对本土语言环境的优化和实际应用的适应性。随着LLM被应用到越来越多领域,如何在两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。

中美两国的竞争和合作不仅影响着各自的科技生态,也对全球AI产业的发展方向产生深远影响。在此背景下,香港凭借其独特的国际化背景,以及金融、科技和区位优势,有望成为全球竞争与合作中的重要桥梁。通过推动技术、人才和政策的多方协作,香港将会在国际研究交流、技术转移和产业合作中发挥重要作用,带领探索人工智能的无限潜力。

注1:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf

注2:http://arxiv.org/abs/2302.04023

注3:https://cevalbenchmark.com/static/leaderboard_zh.html

注4:https://www.hkubs.hku.hk/aimodelrankings/report

注5:https://www.hkubs.hku.hk/aimodelrankings/report/en

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
读者评论
MORE +

热门排行榜
OR
+
中国AI人工智能企业创造性压低模型成本
2024-09-19 12:00
科技

中美大语言模型竞逐:全球视角下的机遇与挑战

蒋镇辉、李佳欣:随着大语言模型被应用到越来越多领域,如何在中美两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。
蒋镇辉、李佳欣


随着大语言模型被应用到越来越多的领域,如何在中美两国的竞争动态中找到平衡点并推动合作,将成为未来几年的发展关键。

自从 ChatGPT 问世以来,大语言模型LLM(Large Language Model)迅速成为全球科技竞赛的焦点。这些模型不仅在对话类比、数据处理、创意任务等方面展现出非凡的能力,更被视为迈向通用人工智能AGI(Artificial General Intelligence)——即具备人类般认知和推理能力的人工智能—— 的关键一步。 这场技术革命激发全球投资热潮,也将中美两国在人工智能领域的竞争推向新的高度。根据斯坦福大学发布的《2024人工智能指数报告》,美国在基础模型研发方面持续大幅领先,而中国无论在AI专利申请和成功获取专利数量上均位居榜首,反映两国在技术创新发展中有不同路径与策略【注1】。在这一背景下,深入了解并比较中美两国大语言模型的发展现状,不仅有助于洞悉这场竞争的格局,还为未来国际合作提供了新的视角与机会。

中美LLM竞争格局:中英文环境的比较

大语言模型的多语言表现是衡量其全球竞争力的重要标准。虽然ChatGPT在英文环境中表现出色,但在其他语言环境中的能力仍需进一步验证【注2】; 同样,源自中国团队或原生于中文的大模型在本土语境中表现优异【注3】,但在英文测试中可能仍有不足,全面了解这些模型在不同语言环境中的表现尤其重要。为此,我们通过系统性的评估框架,在2024年上半年对16个具代表性的大语言模型进行了中英文表现的比较【注4】【注5】。这些模型来自中美两国的技术巨头、顶尖大学,以及人工智能领域的新锐初创企业。

在英文环境的测试中,GPT-4 Turbo凭借其卓越的自然语言能力和学科专长排名第一; 而Gemini Pro和Llama 2则分别位列第二和第三。中国的文心一言4(ERNIE Bot 4)是英文测试中表现最佳的国产模型,综合排名仅达第五位,略高于Claude 2和GPT-3.5 Turbo,唯未能超越GPT-4【注5】。 在中文测试中,文心一言4则超越GPT-4 Turbo排名第一,整体表现最佳【注4】。总体来看,中国的领先模型在中文环境中的表现强劲,但在其他语言环境下仍有较大提升空间。

新动态:多模态与跨领域应用的兴起

随着大语言模型技术不断成熟,LLM正迅速向多模态与跨领域应用扩展,成为AI发展的新蓝海。多模态能力让模型不仅能够处理文本,还能理解和生成图像、音频和视频内容,大大拓宽了其应用场景。例如,OpenAI最新推出的GPT-4o能够同时处理文本、语音和视觉信息,为增强现实、智能监控和自动驾驶等应用提供了新的可能性。

与此同时,LLM的跨领域应用也在不断加速。微软与OpenAI合作,把GPT-4深度集成到办公软件中,帮助用户提高工作效率; 百度的文心大模型不仅用于搜索引擎,还被广泛纳入企业客服和智能家居等场景。此外,垂直领域LLM也层出不穷。例如上海人工智能实验室(上海AI实验室)与瑞金医院合作推出“浦医2.0”(OpenMEDLab2.0)医疗多模态基础模型群,旨在赋能智能影像诊断、虚拟手术、智慧临床决策等应用场景建设,为未来的“AI医院”提供支持。这些应用案例不仅充分展示LLM的多样化潜力,也催生市场对高性能、高安全性AI模型的强烈需求。

未来发展方向:中美差异与合作机遇

展望未来,大语言模型的发展将重点围绕多模态能力的进一步深化、跨领域应用的扩展,以及安全性与伦理责任的提升。目前,美国在基础技术开发和创新应用上具有明显优势,其模型往往在技术前沿上表现出色; 而中国的模型更强调针对本土语言环境的优化和实际应用的适应性。随着LLM被应用到越来越多领域,如何在两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。

中美两国的竞争和合作不仅影响着各自的科技生态,也对全球AI产业的发展方向产生深远影响。在此背景下,香港凭借其独特的国际化背景,以及金融、科技和区位优势,有望成为全球竞争与合作中的重要桥梁。通过推动技术、人才和政策的多方协作,香港将会在国际研究交流、技术转移和产业合作中发挥重要作用,带领探索人工智能的无限潜力。

注1:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf

注2:http://arxiv.org/abs/2302.04023

注3:https://cevalbenchmark.com/static/leaderboard_zh.html

注4:https://www.hkubs.hku.hk/aimodelrankings/report

注5:https://www.hkubs.hku.hk/aimodelrankings/report/en

注:本文仅代表作者个人观点     

■ 
                                                                                         
相关内容
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......