返回首页
您的位置:首页 > 新闻 > CCF聚焦

CNCC | AI时代的异构融合操作系统:聚散终有时,融合亦有期?

阅读量:100 2024-10-09 收藏本文


图片

CNCC2024



论坛简介:

AI时代的异构融合操作系统:聚散终有时,融合亦有期?

举办时间:10月24日13:30-17:30

地点:秋苑-教室区(西7)

注:如有变动,请以官网(https://ccf.org.cn/cncc2024)最终信息为准



操作系统是连接软件和硬件的桥梁,也是计算机系统的核心组件。操作系统的发展,既受芯片硬件演进的驱动,也深受应用场景变化的影响。


近年来,针对特定应用领域或领域特定问题定制研发新型体系结构与计算系统已经成为计算机体系结构方向的发展趋势和创新高地;而以人工智能、自动驾驶为代表的应用创新,也进一步从性能、利用率、可靠性等方面对操作系统提出了更多更高的要求。


来自软硬件的变化趋势,需要操作系统在架构和关键技术寻找突破,对不同类型异构算力进行整合优化,实现算力、内存、互联带宽等硬件资源的有效利用,同时降低应用充分发挥异构算力的开发门槛和长期维护成本。


本论坛面向异构融合计算的典型场景,通过报告分享和panel discussion,探讨操作系统在算力、内存、互联等硬件变化下应对挑战的关键架构和技术机会。








论坛日程


顺序

主题

主讲嘉宾

单位

1

异构智算时代的操作系统演进

秦彬娟

华为技术有限公司

2

异构融合OS及多样性内存管理框架

刘瀚骋

北京航空航天大学

3

异构计算环境下的分布式深度学习训练

李东升

国防科技大学

4

软硬芯异构融合操作系统的多个维度

夏虞斌

上海交通大学


Panel环节:AI时代的异构融合操作系统,聚散终有时,融合亦有期?

主持人:胡欣蔚

华为

华为

刘瀚骋

北京航空航天大学

李东升

国防科技大学

夏虞斌

上海交通大学




论坛主席及嘉宾介绍


 论坛主席

图片


图片

胡欣蔚

CCF系统软件专委执行委员,openEuler 社区技术委员会主席,华为ICT操作系统首席专家


2011年加入华为,现为 ICT 操作系统首席专家,中央软件院架构与设计管理部部长;2020 年起任 openEuler社区技术委员会主席;2021年度CCF杰出工程师奖。曾在 SuSE Linux 等公司担任研发负责人,具有长期的操作系统、高可用软件、底层软件等领域工作经验和技术积累;对处理器、体系架构、OS、容器等具有广阔的技术视野。


 论坛共同主席

图片


图片

李建欣

CCF杰出会员、青工委副主任、大数据专委常委,北航计算机学院教授,党委书记


北航计算机学院教授,党委书记,国家杰出青年基金项目获得者,曾在MSRA访问研究员、CMU机器学习系访问学者,现任国家信标委人工智能分委会科学智算标准组组长,国家数标委首届委员,CCF青工委副主任,大数据专委常委,CAAI组织工委副主任、教育工作委员会常委,IEEE Transactions on Computers编委等。主要研究方向大数据计算、人工智能等,主持2030新一代人工智能重大项目、NSFC联合重点基金等,在TPAMI、TKDE、TC、KDD和NeurIPS等发表论文百余篇,获AAAI 2021、IWQoS 2022、DependSys 2017最佳论文奖,CIKM 2022最佳论文提名奖等。曾获国家级科技二等奖3项,省部级一等奖4项。入选北京市科技新星、教育部新世纪优秀人才和青年长江学者,教育部-华为智能基座优秀教师等,获评全国科技系统抗疫先进个人和集体、中国电子学会优秀科技工作者(十佳)等。


 论坛讲者

图片


图片

秦彬娟

华为庞加莱实验室主任


华为庞加莱实验室主任,20+ CT/IT领域工作经验,当前主要负责异构融合OS创新。

报告题目:异构智算时代的操作系统演进


摘要面向数智时代从通算/单节点 到 通算智算融合/分布式超节点的演进趋势,如何释放异构资源池算力及加速AI应用落地,成为操作系统演进需要考虑的关键问题。

本次报告主要探讨如何打造通算智算异构融合OS,将各种异构算力统一融合池化,达成池化系统动态满载(负载动态匹配核心资源池化,利用率最高);通过异构融合调度,达成多样性算力最优配比(最适合的数据用最适合的算力去算,算效最高)。


图片

刘瀚骋

北京航空航天大学计算机学院科研助理


北京航空航天大学计算机学院科研助理,主要从事操作系统和可编程网络硬件相关研究,负责了多项和资源池化、异构融合内存管理、可编程网络硬件的科研与工程项目。

报告题目:异构融合OS及多样性内存管理框架


摘要:随着AI大模型和科学智算领域发展,混合GPU、AI加速器等异构计算硬件构成数据中心核心基座,新互联技术则推动异构算力融合成为下一代OS变革。互联已能实现纳秒级延迟和数百GBps吞吐的跨节点访问,实现和传统单机互联总线接近的性能,导致体系结构传统Scale Up和Scale Out界限消失。在硬件演进过程中,OS需引入新抽象以支持上层应用更好利用硬件能力:①任务在异构计算设备上调度;②多样性内存的管理。FarMMU(Far Memory Management Unit)是项目组联合华为研发的高性能分布式多样性内存管理框架,充分利用底层硬件特性实现多样性内存管理框架,既能成为多样性算力调度等其他底座能力的基础,也能直接提升现有应用运行效率,旨在异构算力中心中实现高性能分布式多样性内存管理,进行大模型推理时静态和动态参数的管理。


图片

李东升

CCF杰出会员、体系结构专委会副主任、大数据专委会委员,国防科技大学计算机学院教授、并行与分布计算全国重点实验室副主任


国防科技大学计算机学院教授、并行与分布计算全国重点实验室副主任。国家杰出青年基金、首批国家优秀青年基金、全国优博获得者,入选教育部新世纪优秀人才计划。主要从事并行与分布式计算、高性能数据中心、数据智能处理等方面研究工作,在《中国科学》、IEEE/ACM Transactions等学术期刊和会议上发表学术论文100 余篇,主持研制的系统在国家重要领域得到应用。获国家科技进步二等奖、军事科技进步一等奖、湖南省自然科学一等奖、湖南省教学成果特等奖、中国青年科技奖、国务院政府特殊津贴等。

报告题目:异构计算环境下的分布式深度学习训练


摘要:智能时代的操作系统需要提供对异构计算环境下的分布式深度学习训练的高效支持。报告将分析大规模分布式深度学习训练面临的技术挑战,探讨分布式深度学习训练中并行任务划分、通信调度优化、内存优化等方面的前沿技术进展,并对操作系统的智能化服务能力发展进行展望。


图片

夏虞斌

CCF杰出会员,国家级青年人才计划入选者,上海市优秀学术带头人,上海交通大学教授


上海交通大学教授,博士生导师,CCF杰出会员,国家级青年人才计划入选者,上海市优秀学术带头人,“挑战杯”全国特等奖优秀指导老师,上海交通大学卓越教学奖获得者,上海交通大学-OpenHarmony技术俱乐部主任。长期担任OSDI、EuroSys等操作系统国际会议的评审委员会委员。

报告题目:软硬芯异构融合操作系统的多个维度


摘要计算机系统在软硬芯多个层次的异构性正在加剧,这对操作系统在计算机整体性能、效率、安全性等多个维度提出了全新的挑战。本次报告将介绍操作系统对异构资源的抽象、调度与协同方法,以及对异构系统在低时延、高安全等方面的系列优化与改进工作。




关于CNCC2024




CNCC2024将于10月24-26日在浙江省东阳市横店镇举办,大会主题为“发展新质生产力,计算引领未来”。大会为期三天,包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势,分享创新成果。预计参会者超过万人。

图片