返回首页
您的位置:首页 > 新闻 > CCF聚焦

智能存储——提升算力和突破I/O墙丨CNCC技术论坛

阅读量:532 2020-10-14 收藏本文

本论坛将于10月23日下午13:30-17:30在杭州未来科技城学术交流中心(CNCC杭州分会场)举行,共邀清华大学、华中科技大学、上海交通大学、阿里巴巴达摩院和之江实验室等机构的专家学者共同研讨。


今年CNCC将于10月22-24日召开,除了有北京主会场外,今年还设立了沈阳、杭州、济南三个分会场。各个分会场的技术论坛也十分好看。10月23日下午13:30-17:30在杭州未来科技城学术交流中心(CNCC杭州分会场)举行的智能存储--提升算力和突破I/O墙技术论坛就将邀请清华大学、华中科技大学、上海交通大学、阿里巴巴达摩院和之江实验室等机构的专家学者共聚一堂,共同研讨。



后摩尔时代,云计算、大数据处理、人工智能等面临算力短缺和日益严重的“I/O墙”问题,另外,新型芯片如类脑计算芯片、存算一体芯片、光子计算芯片等,呈现新的计算范式,需重构计算/存储系统软、硬件。


论坛将讨论大规模高性能计算/存储系统软、硬件构造技术,例如,面向大数据的存算融合技术,高性能固态存储系统的构建,面向新非易失存储的系统软件栈构建,企业级云原生分布式数据库系统软硬件一体化设计,云存储系统多可用区数据容灾等,从软硬件协同和全I/O栈入手缓解“存储墙”问题,提升智能时代算力、能效比。此次论坛邀请的学术界和工业界专家都来自国内著名的大研究团队,对计算机系统结构特别是信息存储领域前沿研究和发展将起促进作用。


论坛主席



曾令仿

之江实验室新型智能计算系统中心研究员。2006年博士毕业于华中科技大学,曾为新加坡国立大学博士后研究员,华中科技大学副教授,德国美因茨大学Visiting Professor。主要从事高性能存储系统、大数据与计算智能和隐私增强信息存储等相关研究。主持和参加国家重点研发计划、973、863重大、国家自然科学基金、教育部创新团队、企业合作等项目。在FAST、SC、SIGMOD、TPDS、ToS等发表论文60余篇,出版专著一部。2006年获SC06 高性能存储挑战竞赛Finalist Award(排名第一)。2011年获湖北省技术发明一等奖(排名第四)。CCF高级会员及杰出讲者,TPDS评审委员会委员。


讲者简介



冯丹

华中科技大学计算机科学与技术学院院长,教授,博士生导师,长江学者特聘教授,国家杰出青年基金获得者。武汉光电国家研究中心信息存储与光显示功能实验室主任,信息存储系统教育部重点实验室主任。从事计算机系统结构、非易失存储技术、大规模网络存储系统、云存储、磁盘阵列体系结构等方面的研究工作。承担了包括973、863、国家自然科学基金等多个项目的研究工作,取得多项成果。先后两次担任973项目首席科学家,担任863重大项目“海量存储系统关键技术”总体专家组组长,国家自然科学基金委创新群体“大数据存储系统与技术”负责人,教育部创新团队“信息存储系统与技术”学术带头人等。在国内外重要学术刊物及学术会议上发表有关学术论文200余篇,著作2部,获得60项发明专利授权,10余项软件著作版权。研究成果获国家技术发明二等奖2项,省部一等奖3项,国际存储竞赛决赛奖1项。


演讲题目:面向大数据的存算融合技术研究


摘要:随着“大数据”时代来临,图计算、图像处理以及人工智能等应用高速发展,数据呈爆炸式增长趋势,大数据的处理需求加剧了传统冯诺依曼体系结构“存储墙”瓶颈。探索新型非冯诺依曼体系结构,减少数据在存储器和处理器间的传输提升系统能效的技术,已成为当前研究热点。报告将在面向大数据的近数据处理、存算一体化研究现状及发展趋势的基础上,介绍我们的研究工作。包括:基于固态盘控制器的近数据处理技术、基于NVM的存算一体化算法映射及优化方法等。


舒继武

清华大学计算机系长聘教授,教育部长江学者特聘教授,国家杰出青年基金获得者,IEEE Fellow,中国计算机学会会士、信息存储技术专业委员会主任,灾备技术国家工程实验室副主任,中国大数据智能计算专家委员会副主任;国际期刊《ACM Trans. on Storage》和《IEEE Trans. on Computers》的Associate Editor;承担过国家重点研发项目、863计划、973课题、自然科学基金重点项目等,并与华为、阿里、快手、中兴等多个公司有合作项目。获国家科技进步二等奖和国家发明技术二等奖各1次。


演讲题目:高性能固态存储系统的构建探索


摘要:近10年来,固态存储(Solid-State Drive, SSD)性能有极大的提升,其带宽高达GB/s级别,同时延迟低至数十微秒。此外,高性能固态存储(NVMe SSD)提出了新的硬件特性以辅助系统软件设计。高性能固态存储的不断革新,系统软件开销在整个存储系统中占比越来越重。因此,设计高效的系统软件是构建高性能固态存储系统的关键问题。本报告分别从基础IO栈和文件系统两个方面,介绍如何结合新硬件特性构建高效系统存储软件:(1)快速旁路保序的新型IO栈,将存储顺序从传统IO栈中分离并通过快速旁路保证,提升数据写入的并行性;(2)软硬件协同的双接口文件系统,利用SSD中的非易失内存,加速文件系统的非对齐小写而提高性能。


陈海波

上海交通大学特聘教授,并行与分布式系统研究所所长,领域操作系统教育部工程研究中心主任,国家杰出青年基金获得者、ACM杰出科学家。主要研究领域为操作系统和系统安全。曾获教育部技术发明一等奖(第一完成人)、CCF青年科学家奖、全国优秀博士学位论文奖等。目前担任ACM SIGOPS ChinaSys主席、CCF系统软件专委会副主任、ACM旗舰杂志《Communications of the ACM》中国首位编委与Special Sections领域共同主席、《ACM Transactions on Storage》编委。曾任ACM SOSP 2017年大会共同主席、ACM CCS 2018系统安全领域主席、ACM SIGSAC奖励委员会委员等。按照csrankings.org的统计,其在操作系统领域近5年(2015-2019)发表的高水平会议(SOSP/OSDI, EuroSys, Usenix ATC和FAST)论文数居世界第一。


演讲题目:面向非易失内存的系统软件栈:研究与展望


摘要:该报告将简要介绍上海交通大学IPADS团队近期在面向非易内存的系统软件栈的一系列研究,包括文件系统、键值存储、事务处理与数据分析等,通过去层次化抽象、去通信化同步与基于RDMA的原位计算等方法,将当前事务处理、数据分析等典型应用时延降低超过一个数量级。最后,我将展望面向新非易失存储的系统软件栈的发展方向。


李飞飞

阿里巴巴集团副总裁, ACM杰出科学家。阿里云智能事业群数据库产品事业部与达摩院数据库与存储实验室负责人。曾获ACM与IEEE以及其他多个奖项,获ACM SoCC 2019最佳论文奖runner up, IEEE ICDE 2014 10年最有影响力论文奖, ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、IEEE ICDE 2004最佳论文奖、世界互联网大会2019全球领先科技成果奖,浙江省科技进步一等奖等。带领团队研发了阿里云企业级云原生数据库系统包括云原生关系型数据库PolarDB、云原生数据仓库AnalyticDB、云原生数据湖分析DLA、云原生多模数据库Lindorm、云原生智能化管控平台、数据库生态工具等。担任多个国际及国内一流学术期刊和学术会议的编委、主席。中国计算机学会CCF大数据专家委员会副主任,数据库专业委员会常委。担任多个国际一流学术期刊和学术会议的编委、主席(VLDB 2021与IEEE ICDE 2021工业界主席)。


演讲题目:企业级云原生分布式数据库系统


摘要:在云计算时代,云原生分布式数据库开始崛起,提供弹性扩展、高可用、分布式等特性。为了满足弹性扩展、弹性计算、以及按需按量使用等企业级应用需求,云原生数据库需要利用软硬件一体化设计, 同时探索新的体系架构例如通过分布式shared-storage来实现shared-everything和存储计算分离,一写多读的扩展能力。在高并发、对水平拓展有强需求的应用场景下,云原生数据库同时也需要探索基于shared-nothing的分布式架构来提供分布式数据库能力来处理分布式查询和分布式事务处理。同时, 金融级高可用、异地多活等技术挑战也是云原生数据库所必须提供的关键能力。同时也深度结合了大数据技术、机器学习以及安全可信等最新技术,提供面对未来下一代企业级云原生分布式数据库系统。


吴晨涛

上海交通大学计算机科学与工程系教授、博士生导师,入选上海交通大学晨星计划奖励。华中科技大学、美国弗吉尼亚联邦州立大学(Virginia Commonwealth University)双博士。研究方向主要为云存储和大数据存储系统。上海市计算机学会存储专委会副主任、CC存储专委会常务委员。主持和参与了20多项国家973、863、自然科学基金、美国自然科学基金项目。在国际重要杂志和会议发表论文60余篇,包括TC、TPDS、HPCA、DSN、SRDS、IPDPS等。曾获2018年上海市技术发明一等奖和2019年国家技术发明二等奖。


演讲题目:云存储系统多可用区数据恢复策略的优化


摘要:在基于数据中心的云存储系统中,数据被划分存储在多个可用区(Availability Zone, AZ)内。一般而言,一个可用区指的是单个数据中心、单层楼的数据中心或若干个机柜,采用多可用区的数据分布方案可大幅提高数据的可用性并降低I/O的响应延迟。然而,当前的多可用区环境存在着数据恢复慢、网络开销大的问题。本报告主要针对多可用区环境云存储系统的数据恢复问题,提出两种不同策略:(1)带权重的数据恢复路径优化;(2)基于数据流图优化多可用区的并行数据恢复。并通过大量相关的实验证明了优化策略的有效性。


CCF推荐

【精品文章】



CCF颁奖典礼限量门票开售