21世纪经济报道记者倪雨晴 深圳报道
(资料图)
在人工智能领域,华为一直是主导者的角色。
7月6日,在2023世界人工智能大会开幕式上,华为轮值董事长胡厚崑表示,人工智能的发展,关键要“走深向实”。 当前阶段,华为在人工智能上有两个着力点,其一是构建强有力的算力底座,支撑中国人工智能产业的发展;其二是从通用大模型到行业大模型,让人工智能服务好千行百业,服务好科学研究。
从中可以看到华为在人工智能领域的两大策略方向,一方面是基于此前的计算战略,以鲲鹏和昇腾技术为基础,强化算力,另一方面是在产业大模型上发力,并以工业、科研领域作为新赛道的突破点。
对于ChatGPT的浪潮,华为创始人任正非曾指出,未来在AI大模型方面会风起云涌,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。
在他看来,模型的应用有时比模型本身还有前途,华为会做AI的底层算力平台,但应用平台不是华为的选项,“在2%的平台贡献里,我们占一点点就行。ChatGPT对我们的机会是什么?它会把计算撑大,把管道流量撑大,这样我们的产品就有市场需求。”
算力底座加速
胡厚崑谈道,人工智能的发展过程中,算力是基础。但在中国当前的情况下,算力在可获取性和成本方面,都面临着不小的挑战。
同时,多年前华为就认为随着摩尔定律放缓,传统计算模式已无法满足所有应用场景的需求,世界需要异构、云边端协同且无处不在的多样性计算,当前正处于计算架构创新的黄金十年。
因此,华为发展基于Arm架构的服务器CPU鲲鹏芯片,和昇腾AI芯片,并且围绕鲲鹏和昇腾构建新的计算生态。四年前,华为就提出了计算战略,瞄准了人工智能的算力底座,如今随着生成式AI的来临,昇腾算力体系正加速潜行。
大模型的发展带来了算力需求爆炸式增长,胡厚崑表示,当前中国大模型中有一半是由昇腾AI来支撑的。据华为昇腾计算业务CTO周斌介绍,昇腾AI基础软硬件平台已孵化和适配了30多个主流大模型,可承载ChatGPT或GPT-4的算力需求,实现了20倍模型压缩、1%精度损失、推理时延小于50ms能力。
不过AI集群建设也面临算力规模、液冷、跨域协同和可靠性四大关键技术挑战。为了应对挑战,华为也在加速生态建设,本届WAIC论坛上,华为联合产业链推出了昇腾AI大模型训推一体化解决方案,解决大模型开发及应用成本高、周期长、技术难度大等行业痛点,推进大模型在各行业落地应用。
算力集群之外,堪称人工智能操作系统的AI框架也十分关键。华为的AI框架昇思MindSpore同时也面临着谷歌的TensorFlow、Meta的Pytorch框架的激烈竞争。作为业界的AI开源框架,TensorFlow是2015年开源,Pytorch在2016年开源,MindSpore则在2020年开源,MindSpore要如何后来居上?
对此,在近期的人工智能框架生态峰会上,昇思MindSpore开源社区的理事长丁诚接受21世纪经济报道记者采访时谈道:“作为后发框架,要想技术得到超越或者领先,核心就是找到AI技术变革的下一条新赛道,只有当新赛道出现的时候才有弯道超车的机会。下一个可能的技术变化点是科学智能,即AI For Science方面的合作。MindSpore2.0版本当中提出了科学计算融合架构,目的就是想在这个赛道里面能获得更多的技术领先的机会,打造自己的原生生态。”
行业大模型竞赛
与此同时,胡厚崑表示,在深耕算力的同时,还要真正让人工智能走进千行百业,服务科学研究。他进一步说道:“一方面,要打好基础,持续提升通用大模型的能力,另一方面,我们在此基础上,要建好行业模型,将行业专有知识、经验与大模型能力充分结合,提供更专业精准的解决方案。”
从通用大模型到行业大模型,企业的比拼也愈发激烈,B端的产业应用落地成为重要角逐点。需要指出的是,行业大模型和ChatGPT相比属于另一个赛场。ChatGPT是GPT系列大模型的一个应用场景,可以直接面向C端用户群体,而行业大模型的应用场景更多聚焦在B端的千行百业。
此前,百度、科大讯飞等已经联合多家企业和机构发布了数十个行业大模型,涵盖电力、燃气、金融、航天、教育等方面。
华为云的盘古大模型也已经应用于多个领域。据介绍,目前,华为云盘古大模型已经深入金融、制造、政务、电力、煤矿、医疗、铁路等10多个行业,支撑400多个业务场景的AI应用落地。
胡厚崑透露,在7月7日的华为开发者大会上,华为云将发布盘古大模型3.0版本,赋能千行百业。事实上,在OpenAI引爆热潮之前,华为等大企业就已经在钻研AI大模型,此前几年大模型在学术界早就是热门话题,2023年才彻底引燃大众市场。
胡厚崑希望,大模型不仅能用在工厂、港口、银行等行业场景,也能走进实验室和研究所,助力科学研究。
随着生成式AI的日新月异,人工智能将为产业输入新动能。
关键词: