CNCC|软硬一体化协同设计加速多领域技术进步
CNCC2022将于12月8日至10日在贵州省贵阳市国际生态会议中心举办,今年CNCC技术论坛数量达到122个,内容涵盖了“计算+行业、人工智能、云计算、教育、安全”等30个方向。本文特别介绍将于12月10日举办的【软硬一体化】技术论坛。
报名及了解更多技术论坛信息请识别下图二维码进入CNCC2022官网。目前早鸟票限时优惠报名正在进行,抓住机会立享大幅优惠!
在过去的几十年,工艺和体系结构的进步共同促进了CPU性能和能效的不断提升。随着CMOS工艺接近极限以及Dennard缩放比例的总结,计算进入后摩尔定律时代,单纯依靠工艺进步所带来的计算性能增长的红利已逐渐枯竭,越来越依赖体系结构上的创新和软硬件一体化来满足持续增长的计算力需求。在Amdahl法则下,性能的提升不仅要求体系结构创新依赖于对负载的深度理解以实现架构的定制,而且软硬件一体化通过软件和硬件的交叉迭代来来挖掘多约束条件下硬件的潜力。
软硬件协同设计面临性能、延迟、功耗、可靠性、隔离、安全等多约束条件下的折中问题,以及用户使用算力的方式与体系结构设计之间存在着巨大鸿沟的问题。用户倾向于使用具有动态类型和存储管理,以及平台无关的高级语言来使用硬件,不幸的是这些语言的可解释性和执行效率非常低,在编译器自动优化技术不成熟的今天,无法充分发挥定制硬件的能力和很好的满足多方面约束。通过使用领域特定结构设计思路和领域特定语言可以以高效的方式来描述负载,有效开发负载中的并行性,更好的利用内存层次结构和利用领域知识改进数据表示以提高数据和计算吞吐量,提升用户体验。
本论坛将探讨多个领域结构上的软硬件一体化设计,包括云基础设施处理器、异构加速器的软硬件协同优化、ESSD软硬一体实践、大芯片chiplet设计技术和RISC-V,探讨特定领域结构的软硬件一体化设计思路、挑战以及前景。
论坛安排
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 云基础设施处理器 | 杨航 | 阿里云 |
2 | 异构加速器的软硬协同优化 | 郑晓 | 阿里云 |
3 | ESSD软硬一体实践 | 鲁振伟 | 阿里云 |
4 | 软件直管闪存 | 陆游游 | 清华大学 |
5 | 大芯片chiplet设计技术 | 韩银和 | 中科院计算所体系结构国家重点实验室 |
6 | 一个高性能的RISC-V解释器 | 余子濠 | 中科院计算所 |
论坛主席
蒋林泉
阿里云 研究员/神龙计算平台负责人
阿里云神龙计算平台负责人,负责支撑云计算的通用计算、异构计算、大数据以及高性能计算的数据面技术竞争力,通过软硬一体系统核心技术,从平台,软件,硬件,芯片的系统深度结合, 在性能、成本、弹性等云计算领域打造垂直核心竞争力。他管理着亚太最大规模的云计算集群,做到了世界领先的SLA,用x86的硬件做到小型机的稳定性,服务全世界100万企业客户,直接间接对整个中国的云计算基础设施具备很大的影响力。
报告及讲者介绍
杨航
阿里云 资深技术专家
主导4代神龙MOC/CIPU系统设计和软件研发,完成阿里巴巴集团和阿里云全量IaaS计算资源技术升级到神龙MOC/CIPU架构。
报告题目:云基础设施处理器
阿里云智能总裁张建锋在2022阿里云峰会发布云基础设施处理器CIPU(Cloud Infrastructure Processing Unit),将其定义为替代CPU成为云计算的管控和加速中心。在这个全新体系架构下,CIPU向下对数据中心的计算、存储、网络资源快速云化并进行硬件加速,向上接入飞天云操作系统,将全球数百万台服务器构建为一台超级计算机。
此次技术分享,希望通过对CIPU的深入技术解读,回答业界普遍关心的关键问题:CIPU到底是什么?CIPU主要解决哪些问题?CIPU从何而来,未来又将往何处去?
郑晓
阿里云 资深技术专家
现为神龙计算平台异构计算架构师,有着多年系统虚拟化工作经验,专注GPU虚拟化细分行业。设计研发了业内首个GPU实例热升级功能,发布阿里云智能第一款分片虚拟化产品。发表有多篇国际顶会论文,拥有多项国际专利。
报告题目:异构加速器的软硬协同优化
随着AI,科学计算,超算等应用逐步在数据中心普及与推广,以GPU为主要加速器的各类异构器件都开始关注如何发挥本身加速器件100%的效率的同时,又能安全、易用、高性能地融入数据中心,与复杂的云操作系统、系统软件、基础设施协同工作。本次报告将从异构器件与基础设施协同工作出发,分层次探讨了异构器件与虚拟化的协同,与DPU等新型器件的协同,如何与阿里云弹性RDMA技术的结合,以及GPU本身软件在AI方向软件栈的部分优化讨论。
鲁振伟
阿里云 高级技术专家
近10年一直从事分布式存储相关设计和研发工作,全程参与了阿里云存储计算分离、ESSD 100W IOPS分布式存储等重点;目前担任块存储端接入研发负责人,专注高性能云盘和软硬一体相关工作。
报告题目:ESSD软硬一体实践
随着云计算的蓬勃发展,数据规模迎来爆发式增长,对云上分布式存储提出了巨大挑战。阿里云ESSD提供高稳定、高性能、高弹性和高可靠的块存储服务,针对数据中心基础设施飞速发展,结合企业上云和云原生架构的节点,采用软硬一体协同设计,不断优化存储性能和IO体验。
陆游游
清华大学计算机系 副教授
主要研究计算机系统与存储系统,在FAST、OSDI、SOSP、USENIX ATC、ASPLOS等国际顶级会议期刊上发表论文30余篇,曾获得国际会议最佳论文奖和最佳论文提名奖各一项。担任FAST、USENIX ATC、EuroSys等国际会议程序委员会委员。曾获2016年CCF优秀博士学位论文奖、2016年CCF技术发明一等奖、ACM中国操作系统分会新星奖、教育部技术发明一等奖等。
报告题目:软件直管闪存
闪存带来了存储系统的颠覆性革新需求。本报告介绍本研究团队提出的软件直管闪存新架构、I/O栈及系统软件设计,主要包括闪存在存储结构上的变革,介绍软件直管闪存架构,以及其演进出的Open-Channel SSD、ZNS SSD等;闪存在I/O栈上的设计,如何从软硬件角度提供高效的存储系统性能;最后从软件系统设计的角度介绍存储系统的整体设计。最后总结基于闪存的存储系统设计中的机遇与难点。
韩银和
CCF容错专委会主任
中科院计算所 研究员
国家杰出青年基金获得者,智能计算机中心主任。主要研究领域是集成电路设计、智能计算机。在这些领域共发表了110多篇学术论文,包含多篇ISCA、HPCA、DAC、ICCAD等体系结构和芯片领域顶级会议论文。韩银和获得过2012年国家技术发明二等奖、全国百篇优博提名(奖)、中科院优博、计算机学会优博等,担任青年计算机科技论坛(CCF YOCSEF)主席(2016-2017)。
报告题目:大芯片chiplet设计技术
科学计算、大数据、云计算和智能计算等都要求有高芯片算力。然而,由于光刻设备限制、成本限制和良率限制而产生芯片“面积墙”问题,使得monolithic设计难以为继。本报告介绍了我们基于芯粒集成设计大芯片的方法,实现大于光刻口径的芯片面积,介绍大芯片发展面临的并行、存储、互连等体系结构科学问题,并介绍我们目前开展的之江大芯片项目,通过新的多芯粒体系结构,实现集成万核目标,突破体系结构和集成设计等方面的关键技术。
余子濠
中国科学院计算技术研究所 工程师
负责中国科学院大学“一生一芯”计划的培养方案制定和课程主讲。主要研究方向包括数据中心云计算架构QoS保障及二进制翻译,国家重点研发计划项目“软件定义的云计算基础理论与方法”和中国科学院战略性先导科技专项(C类)项目“处理器与基础软件关键技术”的核心成员。参与编写《计算机组成与设计(基于RISC-V架构)》等4本教材。
报告题目:一个高性能的RISC-V解释器
支持RISC-V的主流指令集模拟器可分为两类,一类是以spike为代表的解释型模拟器,它们机制简单,但运行速度较慢;另一类是以QEMU为代表的二进制翻译型模拟器,它们运行速度快,但机制复杂。本工作提出一个高性能解释器NEMU,通过trace cache、跳转表、针对RISC-V常用指令等优化技术, NEMU可在保持机制简单的条件下达到很高的解释效率。测试结果表明,与Spike相比,NEMU运行SPEC CPU 2006整数基准测试的性能是其5.16倍,运行浮点基准测试的性能是其7.71倍。
CNCC是级别高、规模大的高端学术会议,探讨计算及信息科学技术领域最新进展和宏观发展趋势,展示计算领域学术界、企业界最重要的学术、技术成果,搭建交流平台,促进科技成果转换,是学术界、产业界、教育界的年度盛会。今年邀请嘉宾包括ACM图灵奖获得者、田纳西大学教授Jack Dongarra,以及高文、管晓宏、江小涓、钱德沛、徐宗本、张平等多位院士及专家,还有七百余位国内外名校学者、名企领军人物、各领域极具影响力的业内专家,CNCC在计算领域的水准及影响力逐年递增。本届CNCC的主题是:算力、数据、生态。
CNCC2022将汇聚国内外顶级专业力量、专家资源,为逾万名参会者呈上一场精彩宏大的专业盛宴。大会期间还将举办“会员之夜”大型主题狂欢活动,让参会者畅快交流,燃爆全场。如此盛会,岂能缺席!等你来,马上行动,欢迎参会报名!