如同蒸汽动力和电力的广泛使用推动人类社会进入机械化时代和电气化时代,在智能时代算力将成为社会发展的关键生产力。如同从电力跨越到电力网,算力网是算力基础设施发展的必然趋势,各类计算设施通过算力网进行统一调配,从而以更高效率赋能千行万业。这将会带动一批核心关键技术的突破,类似“特高压”之于电力网一般,使我国在算力技术上走向国际领先。本次报告主要介绍由鹏城实验室主导的“中国算力网” 重大创新工程项目的建设目标,现有工作基础,以及未来展望。
在数字化、智能化浪潮中,算力正成为高质量发展的重要驱动力。一方面,各类融合化技术将与行业深度融合,通过一体化服务模式有效整合多元化算力资源,构建算网融合产业新生态,培育竞争优势,不断加速模式创新,促进传统产业数字化转型升级。另一方面,随着技术迭代发展,计算解决问题的范式不断变化。从早期的数学模型驱动到数据驱动,再到AI赋能,高性能计算与AI的融合重塑计算科学、IT产业和社会发展格局。一个是计算资源与网络资源的融合,另一个是人工智能与高性能计算的融合,两个‘融合’共同促进我国算力网建设。
中国算力网(China Computing NET,简称C²NET)目标是构建自主创新的技术与标准体系,建设覆盖智算中心、超算中心、数据中心等大型异构算力资源互联互通、协同调度与高效计算的国家级算力基础设施,推动实现数字经济时代算力供给模式的变革。本报告将报告OpenI启智开源社区如何依托中国算力网为底座,为开发者建立一个高效协作的开源服务环境。
随着ChatGPT的火爆,人类第一次让每个人都接触到了超算算力,都体会到了超算算力加持下的人工智能对生活众多方面生产效率的大幅度提升,这也导致近期全国乃至全球高端超算算力面临极度紧缺的情况,算力网络是解决当前算力问题的最优模式,只要还有可用超算算力,算力网络就可以保证支撑用户完成计算任务。并行科技在过去十年以算力网络服务模式,聚集国内外优质超算和智算算力资源,实现算力资源、应用资源、数据资源的共享与交易,面向终端用户提供多样化的算力服务,根据沙利文2022年行业分析报告, 并行科技超算算力服务营业额已经成为中国第一。并行科技对“算力网络”模式的探索与实践,和积极响应国家近年来的“东数西算”发展政策,为行业发展提供了一套行之有效的“破题方法”。它将前沿科技拓展至丰富的商业应用中,这将点燃算力服务市场的星火,为新的发展照亮前程。
以国家超算中心、人工智能计算中心为代表的算力中心,借助构建创新的高速互联专网,实现了CPU、GPU、内存等多样化算力资源的无缝集成与高效互联,促进了数据、算力、算法、模型及服务的全面共享与快速流通,这些已成为推动大模型训练与广泛应用不可或缺的基石。然而,当广泛分布的算力中心,包括人工智能计算中心、超算中心以及“东数西算”工程的枢纽节点等,共同参与到众多大模型的训练与服务任务中时,将遭遇分布式算力高效调度、数据传输延迟、私有拥塞控制策略优化以及数据隐私安全保护等挑战。 在此背景下,当前的算力服务是否能够充分适应大模型时代的来临,成为了一个亟待探讨的议题。为此,本论坛将汇聚国内外顶尖院士、知名高校学者及国际领先企业的智慧,聚焦算力服务新型基础设施建设的迫切需求,深入研讨大模型时代下的算力技术创新、服务模式的革新以及跨领域的应用实践,旨在开创一个适应大模型时代的算力服务新范式,引领未来算力服务的发展方向。
对于用户算力使用情况的度量是算力基础设施化的一个关键要素。本文分析了当前度量指标的不足,梳理了用户侧算力度量的挑战与需求,提出了一种算力度量指标BOPs(Basic OPerations,基本操作数),并介绍了其在算力网度量中的应用。