YEF2024大会论坛纪实:大模型与国产算力论坛
5月16日,YEF2024宛如一场盛大的科技派对,于宁波开幕,千位青年人才与行业专家共聚长江三角洲南翼经济中心,探讨前沿技术,激发创新活力,智启新局。作为本次活动的重头戏,两场大会论坛其中之一,“大模型与国产算力”于当天上午同期举行。YEF2024大会对该论坛进行了专题直播,据统计,有超过3万人通过CCF微信视频号在线观看,爱奇艺人气值更突破58万!
本次论坛由CCF杰出会员、副理事长,北京并行科技股份有限公司董事长陈健博士主持。邀请CCF会士、副理事长,中国科学院院士,清华大学教授胡事民;CCF会士、学术工委主任,清华大学教授陈文光;CCF杰出会员,国家超级计算长沙中心副主任、长江学者、二级教授博导彭绍亮;CCF杰出会员、合肥副主席,科大讯飞研究院执行院长王士进等嘉宾出席,并发表各自主题报告演讲。值得一提的是,各位嘉宾还共同出席大会论坛Panel环节,就相关行业问题开展现场研讨。
陈健主持大会论坛
胡事民在《以深度学习框架为抓手、构建大模型训练与应用的国产生态》中指出,人工智能发展有四驾马车:算力、框架、算法、数据,它们的汇聚促进了人工智能创新发展,所以,人工智能发展应该具有全局观,不要只关注应用端的大模型发展,而要从硬件、框架、模型算法和应用四个层面来看,因为它们各自都对人工智能生态的发展有着重要影响。
硬件领域,国产芯片的发展之路较为艰辛,要融入既有行业生态难度较大,但我们的发展脚步很快,技术路线多样,未来一定是机遇与挑战并存。国产框架方面,仍面临严重生态屏障,我们需要进一步降低框架学习成本,完善软件,实现对下游硬件和上层算法很好的支持,而且,还需要基于国产框架的基础骨干网络的创新与应用,这才有利于改变人工智能生态目前的局面。模型算法方面,尽管国内学者的论文在业内占据了非常名列前茅的位置,但仍要进一步加强创新。应用层面,虽然目前市场发展繁荣,但我们要意识到,底层硬件和软件仍有短板,且都是亟需我们解决的问题。
报告中,胡事民还介绍了清华大学计图框架的优势,包括速度快、内存节省以及通过元算子这套机理做了对国产硬件的适配,并提出了框架间迁移的办法,希望以计图框架为核心,基于国产硬件促进人工智能算法应用的创新,来推动开源开放,构建中国人工智能的生态。
胡事民作大会论坛分享
陈文光以《国产智能算力训练大模型的经验与教训》为题的报告中表示,过去四五年中,自身所在团队已经分别在两个国产平台上训练了大模型,并总结了经验。首先是新神威计算机,这是神威·太湖之光的下一代超级计算机,拥有10万节点。在该平台上,团队训练了一个名为“八卦炉”的系统,该系统能够训练174万亿参数的MOE模型,是目前世界上最大的稀疏模型之一。其次是鹏城云脑2,基于华为鲲鹏920处理器和昇腾910A加速器,该系统拥有4096个加速卡,半精度峰值达到1E ops。
在硬件性能方面,昇腾910A的单卡算力峰值达到256T,但FP16的精度范围较小,这在后续训练中带来了挑战。尽管如此,国产算力平台在机器之间的带宽上与英伟达的A100集群相比仍具有竞争力。在软件层面,国产超算和智算平台的软件生态与英伟达相比尚不成熟。在并行策略上,国产平台的限制较多,需要综合考虑显存容量、通信能力、计算能力和冲算策略等因素。综合来看,国产智能算力平台在大模型训练方面取得了显著进展,但仍面临算子实现、并行策略选择和容错等挑战。
陈文光作大会论坛分享
彭绍亮在题为《Web 3.0 时代下的算力网络和生成式人工智能大模型》的报告中,提出了构建算力共享网络的愿景,旨在提升国家算力基础设施能力,实现东数西算,提供稳定算力供给。这一网络将云计算、智算和超算中心融合,以解决算力和存储通信能力的统一抽象和智能调度问题。
并介绍了由国家超算长沙中心创建的全球第一个名为“Metaverse”的国际期刊,旨在推动Web3.0时代超算、智算、大数据和大模型应用的融合。此外,还承担了很多国家重点研发计划,推动算力资源的全国乃至全球共享。在垂直大模型领域,彭绍亮介绍了面向医药领域开发的“神农GPT”,并已实现了开源,标志着国内大模型技术的信心和透明度。
同时,彭绍亮还介绍了数字孪生技术在智慧城市建设中的应用,如实时多元异构的智慧城市、智慧交通实时渲染平台,这些技术已在长沙等地落地,实现多模态数据融合和AI驱动。强调了教育与AI结合的重要性,并介绍了与北师大合作的教育领域大模型“睿道”,旨在提升教育质量,特别是帮助二三线城市提高教育水平。展示了建筑设计领域大模型的应用,通过预训练模型帮助设计师进行在线图像生成,大幅缩短设计周期。
彭绍亮作大会论坛分享
王士进在《讯飞星火大模型技术及国产训练推理工作进展》报告中表示,自2022年底以来,讯飞围绕大模型技术进行了持续的攻关,从2023年到2024年进行了系列发布。特别值得关注的是,从2024年1月30日发布的3.5版本开始,讯飞的所有版本都基于国产化算力,包括3.5Plus版本以及即将于6月27日发布的4.0版本。
王士进指出,讯飞星火大模型不仅在自然语言处理领域取得了显著成效,还在语音、图像和机器人技术等领域实现了技术融合。例如,通过结合大模型和语音技术,讯飞语音大模型显著提升了语音识别、合成和同传的效果。在图文识别领域,讯飞将大模型与OCR技术结合,不仅提升了识别效果,还增强了对复杂版面的自动切分和识别能力。在机器人领域,大模型与机器人技术的结合为空间感知和人际交互带来了翻天覆地的变化。讯飞开放平台提供了一个机器人创造平台,实现了视觉、语言、动作一体化的大模型。
面对未来行业的发展前景,王士进在报告发言中分别从硬件本身提升算力密度和效率、集群智能化运维、以及算法和底层算子层面的优化等各个方面提出思考。并强调了构建AI生态的重要性,呼吁更多行业中更多专家与团队积极参与,提升国产底层技术的综合实力。
王士进作大会论坛分享
在当天大会论坛的Panel环节,各位嘉宾围绕国内大模型训练的算力需求在未来5至10年的变化,国产算力能否满足当前大模型训练发展需求,以及未来国产算力如何与英伟达算力同台PK性价比等问题展开了讨论,专家观点汇总如下:
✦
● 中国大模型训练的算力需求在未来5-10年会如何变化,预计年复合增长率如何?会发生断崖式下跌吗?
王士进:大模型训练对算力的需求持续增长,多模态数据的增长速度呈几何倍数,但面临AI运营成本提升的挑战,需考虑业务模型的可持续性。算力需求不会出现“断崖式”下降。大模型训练仍在精进发展,行业对算力的需求将持续增长,数据维度及规模都会不断扩大。
彭绍亮:超算中心面临智算用户需求的快速增长,未来也仍会保持增长,对硬件和人才的需求更是供不应求。考虑通过技术层面提升超算能力,及建立算力交易平台实现全球算力统一调度。
陈文光:国内算力需求在未来几年内将持续增长,受数据及行业发展的动态需求影响,某些模型甚至需要“从头训”。但长期看可能会经历波动,需与美国等先进基础设施对齐以保持竞争力。
胡事民:国内出现对算力需求的“断崖式”下跌不太可能,同时,国产算力厂商在行业生态建设上仍有提升空间。
✦
✦
● 国产算力的发展与挑战
胡事民:国产算力面临生态和工艺上的挑战,但通过不断的使用和迭代可以逐步提升性能。强调了国产大模型公司的竞争和未来算力需求的变化。
王士进:国产算力的发展需要更多参与者的加入,通过优化算子和深度学习框架适配提升性能。
✦
✦
● 生态建设的重要性
彭绍亮:生态建设是国产算力发展的关键,需要从科研项目、经费和人员等多方面加大投入,鼓励学生和研究人员使用国产平台。
陈文光:底层开放对于生态建设至关重要,建议芯片厂商更加开放底层技术以促进生态的健康发展。
✦
✦
● 国产算力的未来展望
王士进:呼吁大家积极参与国产算力的发展,通过集体努力实现提升。
彭绍亮:强调从个人和应用层面做起,逐步构建国产算力生态。
陈文光:国产算力通过不断的使用和迭代将越来越好。
胡事民:强调构建良好的人工智能生态是国产算力发展的未来。
✦
陈健作为本次论坛主持人在总结环节表示,综合各位专家观点来看,国内算力需求在未来5至10年内将保持高增长。国产算力的性价比及生态建设方面都有待加强,这是实现国产替代的核心关键。
撰稿人:CCF 杰出会员、副理事长,北京并行科技股份有限公司董事长陈健
•
在YEF2024思想秀上,嘉宾栾家带来了一份特殊的“礼物”,他在演讲中分享了一首由AI作词作曲和演唱的原创音乐。让我们来欣赏这首作品吧!
✦
交响合唱《智慧的火光》
——为CCF青年精英大会“思想秀”而作
艺术指导:栾家
作词、作曲、演唱:AI
破晓初光,梦开始地方,
智慧如潮,汇聚力量。
每个念头,跳跃思想,
编织未来旅途,青春共启航。
智慧的火光,照亮前行路,
启智新局,风起云涌时。
智慧的火光,照亮前行路,
梦想编码,指引未来志。
✦