OR 新媒|oror.vip跨平台阅读首选
2023-07-09 07:19
科技

华为发布盘古大模型3.0:“不作诗,只做事”

“AI最不应该替代的就是作诗作画,这是人类应该呈现的东西,为什么要把它交给机器?”
华为传呼机爆炸事件后,中国又一次“什么都没做就赢了”?
陆柯言

■7月7日,在华为开发者大会(Cloud)期间,华为正式发布盘古大模型3.0。华为云CEO张平安表示,不同于时下流行的ChatGPT,盘古大模型3.0是一个完全面向行业的大模型系列,包括“5+N+X”三层架构:

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求;

L1层是N个行业大模型,华为云可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型;

L2层则提供了更多细化场景的模型,专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,提供“开箱即用”的模型服务。

张平安介绍,盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,客户和合作伙伴能够直接调用。

根据华为现场展示的气象行业案例,过去预测台风未来10天的路径,要花费5小时、在3000台服务器的高性能计算机集群进行仿真。而在预训练盘古气象大模型的支持下,只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

张平安在接受媒体采访时表示,不想拿盘古大模型和ChatGPT相比。“Chat意为聊天,但我们没有时间聊天。参数再多、对话能力做得再好,但如果解决不了实际问题,也没有多大用处。AI最不应该替代的就是作诗作画,这是人类应该呈现的东西,为什么要把它交给机器?”

华为之所以切入行业大模型,一方面是基于过去在To B领域的经验,另一方面也将得益于华为在算力基础设施上的布局。算力是大模型必不可少的“发动机”,盘古大模型的算力则来自华为昇腾AI集群。

华为公布的数据显示,目前基于昇腾AI澎湃算力,原生研发、适配的大模型超过30个,占据中国大模型近一半数量。

受制裁影响,华为并不能使用行业主流的GPU架构,而是基于其自研的达芬奇架构推出了AI训练芯片昇腾系列。2019年,华为宣布昇腾910芯片正式商用。华为在当时形容,昇腾910是业界“算力最强”的AI处理器。

在近日举办的世界人工智能大会上,华为宣布昇腾AI集群全面升级。集群规模从最初的4000卡集群扩展至16000卡。华为称,这是业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期。

发布会上,华为昇腾AI云服务也正式推出。据介绍,昇腾AI云服务提供2000P FLOPS的算力,支持主流AI框架和90%以上的算子,训练效率高于业界主流GPU的1.1倍。

华为昇腾计算业务总裁张迪煊在接受媒体采访时表示,现在国内算力需求旺盛,许多大厂能拿到算力,但许多小企业拿不到。张平安也提到,目前英伟达芯片货期长、价格高昂,华为希望为行业提供另一种选择。

华为在算力基础设施上投入颇高。目前,华为已在上海、武汉、西安等25个城市,基于昇腾AI建设了人工智能计算中心,提供算力基础设施服务。

张平安表示,华为在算力方面的投入非常大。“如果用(算力)的人少,我们就会亏。但不能因为现在亏损,我们就不投入。相信我们把AI的生成算力做好了之后,中国很多AI算力都会用我们,现在谈收益还为时太早。”■ 
                                                                                       
相关内容
OR
+
读者评论
MORE +

热门排行榜
OR
+
华为传呼机爆炸事件后,中国又一次“什么都没做就赢了”?
2023-07-09 07:19
科技

华为发布盘古大模型3.0:“不作诗,只做事”

“AI最不应该替代的就是作诗作画,这是人类应该呈现的东西,为什么要把它交给机器?”
陆柯言

■7月7日,在华为开发者大会(Cloud)期间,华为正式发布盘古大模型3.0。华为云CEO张平安表示,不同于时下流行的ChatGPT,盘古大模型3.0是一个完全面向行业的大模型系列,包括“5+N+X”三层架构:

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求;

L1层是N个行业大模型,华为云可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型;

L2层则提供了更多细化场景的模型,专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,提供“开箱即用”的模型服务。

张平安介绍,盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,客户和合作伙伴能够直接调用。

根据华为现场展示的气象行业案例,过去预测台风未来10天的路径,要花费5小时、在3000台服务器的高性能计算机集群进行仿真。而在预训练盘古气象大模型的支持下,只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

张平安在接受媒体采访时表示,不想拿盘古大模型和ChatGPT相比。“Chat意为聊天,但我们没有时间聊天。参数再多、对话能力做得再好,但如果解决不了实际问题,也没有多大用处。AI最不应该替代的就是作诗作画,这是人类应该呈现的东西,为什么要把它交给机器?”

华为之所以切入行业大模型,一方面是基于过去在To B领域的经验,另一方面也将得益于华为在算力基础设施上的布局。算力是大模型必不可少的“发动机”,盘古大模型的算力则来自华为昇腾AI集群。

华为公布的数据显示,目前基于昇腾AI澎湃算力,原生研发、适配的大模型超过30个,占据中国大模型近一半数量。

受制裁影响,华为并不能使用行业主流的GPU架构,而是基于其自研的达芬奇架构推出了AI训练芯片昇腾系列。2019年,华为宣布昇腾910芯片正式商用。华为在当时形容,昇腾910是业界“算力最强”的AI处理器。

在近日举办的世界人工智能大会上,华为宣布昇腾AI集群全面升级。集群规模从最初的4000卡集群扩展至16000卡。华为称,这是业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期。

发布会上,华为昇腾AI云服务也正式推出。据介绍,昇腾AI云服务提供2000P FLOPS的算力,支持主流AI框架和90%以上的算子,训练效率高于业界主流GPU的1.1倍。

华为昇腾计算业务总裁张迪煊在接受媒体采访时表示,现在国内算力需求旺盛,许多大厂能拿到算力,但许多小企业拿不到。张平安也提到,目前英伟达芯片货期长、价格高昂,华为希望为行业提供另一种选择。

华为在算力基础设施上投入颇高。目前,华为已在上海、武汉、西安等25个城市,基于昇腾AI建设了人工智能计算中心,提供算力基础设施服务。

张平安表示,华为在算力方面的投入非常大。“如果用(算力)的人少,我们就会亏。但不能因为现在亏损,我们就不投入。相信我们把AI的生成算力做好了之后,中国很多AI算力都会用我们,现在谈收益还为时太早。”■ 
                                                                                       
相关内容
OR
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......