ADL151《下一代数据存储技术》开启报名

阅读量:24
李红梅


CCF学科前沿讲习班

The CCF Advanced Disciplines Lectures

CCFADL第151期

主题 下一代数据存储技术

2024年8月22日-24日 北京


本期CCF学科前沿讲习班《下一代数据存储技术》,将系统性介绍面向新型硬件与支撑新兴应用的下一代数据存储技术,通过讲解最新研究进展,帮助学员理解下一代数据存储技术的基本概念、主要挑战和解决方法,并通过实际案例介绍不同存储技术在数据库、大模型等领域的应用前景,开阔科研视野,增强实践能力。


本期ADL邀请了七位来自著名高校与企业科研机构活跃在前沿领域的专家学者做主题报告。第一天聚焦数据库的数据管理与存储,由阿里巴巴集团阿里云数据库产品事业部负责人李飞飞、加拿大西蒙弗雷泽大学助理教授王添正介绍云原生数据管理与存储以及事务存储引擎。第二天聚焦新硬件使能的数据存储,由华中科技大学教授华宇、上海交通大学助理教授魏星达讲授大内存系统和基于硬件加速的数据存储。第三天聚焦数据存储新型架构与技术,由华为公司数据库架构师张金玉、北京大学助理教授张杰、清华大学副教授陆游游讲授池化数据存储、近数据处理以及非易失存储系统。



学术主任:李国良/陆游游 清华大学

主办单位:中国计算机学会




活动日程:


2024822日(周四)

9:00-9:15

开班仪式

9:15-9:30

全体合影

9:30-12:30

专题讲座1

Data+AI与云原生时代的数据管理与存储

李飞飞 阿里云数据库产品事业部负责人

12:30-13:30

午餐

13:30-16:30

专题讲座2

Modern transactional storage engines on modern storage devices

王添正 加拿大西蒙弗雷泽大学助理教授

2024823日(周五)

9:00-12:00

专题讲座3

智能赋能的大内存系统

华宇 华中科技大学教授

12:00-13:00

午餐

13:00-16:00

专题讲座4

使用新型硬件加速分布式数据存储:从键值存储、事务处理到向量存储

魏星达 上海交通大学助理教授

2024824日(周六)

9:00-12:00

专题讲座5

三层池化云原生数据库

张金玉 华为公司数据库架构师

12:00-13:00

午餐

13:00-14:30

专题讲座6

从存储研究的角度看:近数据计算架构设计

张杰 北京大学助理教授

14:30-16:00

专题讲座7

非易失存储系统的研究与探索

陆游游 清华大学副教授


本期ADL主题《下一代数据存储技术》,由清华大学教授李国良与副教授陆游游担任学术主任,邀请到李飞飞(阿里云数据库产品事业部负责人,阿里巴巴集团)、华宇(教授,华中科技大学)、王添正(助理教授,加拿大西蒙弗雷泽大学)、张杰(助理教授,北京大学)、魏星达(助理教授,上海交通大学)、陆游游(副教授,清华大学)、张金玉(华为数据库架构师,华为公司)7位专家做专题讲座。





特邀讲者




李飞飞

阿里巴巴集团

阿里云数据库产品事业部负责人


讲者简介:CCF会士,阿里云数据库产品事业部负责人。ACM Fellow, IEEE Fellow。获数据库与大数据系统方向多项国际顶级学术科研与技术会议最佳论文/成果奖(IEEE ICDE 2024 Industry and Application Best Paper Award, ACM SIGMOD 2024 Industry Track Best Paper Award, ACM SIGMOD 2023 Beset Paper Award, EDBT 2022 10 Years Test of Time Award, IEEE ICDCS 2020 Best Paper Award、ACM SoCC Best Paper Award Runner Up、ACM SIGMOD 2016 Best Paper Award, ACM SIGMOD 2015 Best System Demonstration Award, IEEE ICDE 2014 10 Years Most Influential Paper Award, IEEE ICDE 2004 Best Paper Award), 作为第一完成人获得世界互联网大会2019全球领先科技成果奖、浙江省科技进步一等奖、中国电子学会科技进步一等奖等。担任多个国际及国内一流学术期刊和学术会议的编委、主席,中国计算机学会CCF大数据专家委员会、数据库专业委员会常委。带领团队研发了以云原生数据库PolarDB为核心的阿里云瑶池数据库产品矩阵,实现了中国数据库市场份额第一,作为国内唯一数据库厂商连续4次进入Gartner全球Cloud DBMS市场分析报告领导者象限。


报告题目:Data+AI与云原生时代的数据管理与存储


报告摘要:在云计算+AI时代,云原生分布式数据库因其弹性扩展、高可用、分布式等特性而获得了大量应用。为满足弹性扩展、弹性计算、按需按量使用、AI推理、RAG构建等企业级应用需求,云原生数据库需要探索新的体系架构,如通过分布式共享存储shared-storage来实现shared-everything的架构和存储计算分离、基于shared-nothing分布式架构来提供分布式查询和分布式事务处理,基于向量数据库引擎和in-DB推理来支持Data+AI的推理应用以及RAG应用。同时,金融级高可用、异地多活、以及多源异构的多模数据管理等技术挑战也是云原生数据库必须提供的关键能力。数据库系统在快速的向云原生化、平台化、一体化、智能化的四化方向演进。基于对以上技术挑战的不断探索和实践,我们自研了云原生数据库PolarDB,提供企业级云原生分布式数据库能力,提供一站式一体化的数据库能力。同时我们也自研了企业级云原生数据仓库AnalyticDB(ADB)以及云原生多模数据库Lindorm。PolarDB/ADB/Lindorm经受了阿里巴巴双十一世界级的交易峰值挑战并在阿里云上取得了商业化成功。同时,深度结合机器学习和安全加密等最新技术,提供面对未来下一代企业级应用的智能化、安全的一站式Data+AI云原生数据平台。





王添正

加拿大西蒙弗雷泽大学

助理教授


讲者简介:Tianzheng Wang is an assistant professor in the School of Computing Science at Simon Fraser University (SFU) in Metro Vancouver, Canada. His research centres around the making of database systems in the context of modern hardware, new programming language features and primitives, and new applications. His work also often extends to related areas such as operating systems, parallel programming and distributed systems. Tianzheng Wang received his Ph.D. and M.Sc. degrees in Computer Science from the University of Toronto in 2017 and 2014, respectively. He received his B.Sc. in Computing degree (First Class Honours) from Hong Kong Polytechnic University in 2012. Prior to joining SFU, he spent one year (2017-2018) at Huawei Canada Research Centre (Toronto) as a research engineer. In addition to adoptions by major cloud vendors and startups, his work has been recognized by two ACM SIGMOD Research Highlight Awards (2020 and 2022), a 2019 IEEE TCSC Award for Excellence in Scalable Computing (Early Career Researchers) and nominations for best/memorable paper awards.


报告题目:Modern transactional storage engines on modern storage devices


报告摘要:The past five years have seen radical changes in the storage hierarchy, with new devices that have come and gone (e.g., persistent memory), traditional devices riding on new process and interconnects (e.g., NVMe flash SSDs) and new deployment shapes (e.g., CXL and disaggregated memory/storage). This leads to a deeper and more complex storage hierarchies that exhibit various speed gaps between each other and the CPU. Transactional storage engines - the core of many data-intensive systems such as relational DBMSs and key-value stores - must cope with such changes to effectively hide latency, increase throughput and improve device utilization. In this talk, we will take an overview of recent trends in storage devices, and discuss recent transactional storage engine designs aimed at reaching the aforementioned goals. Beyond performance, we will also highlight other aspects, such as backward compatibility and programmability, which are important indicators of real-world adoption for these techniques.





华宇

华中科技大学

教授


讲者简介:华中科技大学教授,国家杰出青年科学基金获得者,CCF杰出会员和杰出演讲者。主要研究新型存储器件、高性能存储系统和安全架构。在OSDI、ASPLOS、MICRO、FAST、HPCA等会议上发表多篇学术论文。在ICDCS 2021、ACM APSys 2019等国际会议上担任程序主席/副主席,在OSDI、SIGCOMM、FAST、NSDI、MICRO、ASPLOS、EuroSys等国际会议上担任程序委员,是ACM Transactions on Storage期刊的编委。研究成果获得教育部自然科学一等奖等3项省部级科技奖励,以及FAST 2023等4项国际会议和期刊的最佳论文奖。


报告题目:智能赋能的大内存系统


报告摘要:大内存系统是现有的一体化内存、互联内存、池化内存等内存形式的扩展和延伸,不仅具有传统内存高性能的优势,而且在持久性、一致性、原子性等方面具有独特的设计要求,这促使相关工作需要从计算域、存储域和安全域等多维视角全面分析和研究大内存系统的本质特征,而其智能赋能的突破口和软硬件生态体系也是计算机体系结构和系统软件所关注的重要科学问题。报告将以AI for Caching为总体研讨目标,聚焦大内存系统的体系架构、事务处理、智能接口、数据结构、互联协议、安全加密等关键技术,为未来大内存系统的进一步发展提供思路。





魏星达

上海交通大学

助理教授


讲者简介:上海交通大学助理教授。主要研究方向为分布式系统和操作系统,最近主要的关注点为如何在AI和Serverless下,提升计算和存储基础系统软件的性能、可靠性和运行成本。在包括OSDI/SOSP、Eurosys、NSDI等会议上发表多篇论文。曾获Eurosys2024最佳论文,2022年华为火花奖,2021年ACM SIGOPS Dennis M. Ritchie Award优胜奖,2020年华为奥林帕斯先锋奖等多个奖项。博士论文获2021年ACM 中国优秀博士学位论文提名奖,ACM ChinaSys优秀博士论文奖。担任包括ASPLOS和NSDI在内的多个期刊审稿人及国际会议程序委员会成员。


报告题目: 使用新型硬件加速分布式数据存储:从键值存储、事务处理到向量存储


报告摘要:计算离不开存储,而新型硬件和应用的演进推动着存储系统的发展。本次报告将从两方面介绍最近几年的相关发展:首先,我将介绍如何利用新型互联硬件RDMA大幅提升键值存储和数据库事务处理的性能。其次,我将介绍向量索引中存在的性能和索引放大的权衡,即需要数据集大小6倍的索引大小才能达到最优性能;以及如何利用新型存储介质(如NVM,CXL和RDMA)去实现低索引大小的高性能向量搜索。





张金玉

华为公司

华为数据库架构师


讲者简介:华为GaussDB数据库技术专家,云原生数据库架构师。专注于数据库存储引擎技术,参与fastdb内存数据库,列存数据库,行存数据库内核设计和开发。


报告题目:三层池化云原生数据库


报告摘要:当前主流的云数据库采用存算分离的架构支持一写多读能力,业务很难做到透明使用,需要区分读写,且写能力不能很好扩展。GaussDB云原生数据库采用计算内存存储三层池化架构实现分层弹性扩展,通过GaussStore分布式存储实现数据共享,使得每个计算节点都可以访问全部数据;通过分布式缓冲池,分布式锁,Lamport时钟等技术实现计算节点对等透明读写能力;通过memory checkpoint和disk checkpoint双检查点技术以及按需回放页面技术实现极致高可用。同时GaussDB云原生存数据库还支持多租户可插拔数据库(PDB), 通过数据和WAL隔离,可以很容易实现克隆和迁移PDB.





张杰

北京大学

助理教授


讲者简介:张杰博士,北京大学计算机学院助理教授、博士生导师、特聘研究员,入选国家高层次人才计划海外青年项目,获得英特尔中国学术英才计划荣誉学者、ACM SIGCSE新星奖。长期从事存储系统和专用处理器的研究和设计,致力于从计算机体系结构层面出发,解决大数据和人工智能时代对于高性能存储系统的需求,突破冯诺依曼体系结构下数据迁移的瓶颈以及内存墙的限制。在国际会议及期刊上发表了50余篇论文,包括计算机体系结构与系统顶级会议ISCA、OSDI、 HPCA、 MICRO、ASPLOS、FAST、ATC、Eurosys。


报告题目:从存储研究的角度看:近数据计算架构设计


报告摘要:随着大数据时代的到来,人工智能、图计算、大数据等新型应用对服务器集群的算力和存储能力提出了更高的要求。然而,传统的冯诺依曼体系结构及配套的系统软件存在数据迁移开销大的天然劣势,无法满足新型应用的实际需求。当今的内存和存储系统正经历了重大的技术转变。基于这种技术的提升,研究人员需要重新思考和设计现有的系统组织和硬件架构。本次报告主要是从存储研究的角度解析近数据计算架构设计,我们将从多个维度回顾学术界在过去十余年的设计思路,并且分享我们在近数据计算领域的研究进展。





陆游游

清华大学

副教授


讲者简介:清华大学计算机系副教授、博士生导师。主要研究方向是计算机存储系统,在FAST、OSDI、SOSP等国际顶级会议上发表论文50余篇,曾获得NVMSA’14最佳论文奖、MSST’15最佳论文提名奖、SIGMOD’23研究亮点论文奖。研制高性能文件系统SuperFS,部署于鹏城云脑II,蝉联世界超算存储IO500榜单第一名(目前仍位居第一)。担任FAST、USENIX ATC、EuroSys等国际会议程序委员会委员。曾入选CCF优博、首届中国科协青托工程等计划,获国家自然科学基金重点项目、优青项目和国家重点研发计划青年科学家项目资助,获省部级奖两项。


报告题目:非易失存储系统的研究与探索


报告摘要:数据的存储与处理是高性能计算、大数据和人工智能系统的核心动力之一。近年来,非易失性存储硬件技术发展迅速:以闪存和持久性内存为代表的非易失性存储硬件提供了电子式的数据访问方式,其低延迟、高带宽的特性为存储系统设计带来了新的机遇。本次报告将系统性介绍非易失存储系统的相关研究进展:1) 闪存存储系统与相关技术,包括软件直管的开放通道闪存存储架构、多核并发的闪存文件系统、数控分离的保序与原子性机制等;2)持久性内存存储系统与相关技术,包括编程模型、数据结构、空间管理、文件系统和分布式持久性内存文件系统等。






学术主任




李国良

清华大学

教授


李国良,清华大学教授,计算机系副主任,博士生导师,国家杰出青年科学基金获得者,IEEE Fellow,openGauss 社区技术委员会主席。曾担任VLDB Journal、IEEE TKDE等编委,SIGMOD 2021大会主席,VLDB 2021 Demo 主席,ICDE 2022 Industry Chair, 多次担任SIGMOD、VLDB、KDD、ICDE、WWW、IJCAI、AAAI等会议的程序委员会委员。获得过数据库领域重要国际会议SIGMOD23、VLDB23、VLDB20、KDD18、ICDE18最佳论文提名,DASFAA23最佳论文、CIKM’17的最佳论文奖、DASFAA’14的最佳论文提名奖、APWeb’14最佳论文奖、EDBT’13大数据比赛冠军。获国家科技进步二等奖(2018)、江苏省科技进步一等奖(2019)、电子学会科技进步一等奖(2022)、CCF科技进步特等奖(2022)。





陆游游

清华大学

副教授


清华大学计算机系副教授、博士生导师。主要研究方向是计算机存储系统,在FAST、OSDI、SOSP等国际顶级会议上发表论文50余篇,曾获得NVMSA’14最佳论文奖、MSST’15最佳论文提名奖、SIGMOD’23研究亮点论文奖。研制高性能文件系统SuperFS,部署于鹏城云脑II,蝉联世界超算存储IO500榜单第一名(目前仍位居第一)。担任FAST、USENIX ATC、EuroSys等国际会议程序委员会委员。曾入选CCF优博、首届中国科协青托工程等计划,获国家自然科学基金重点项目、优青项目和国家重点研发计划青年科学家项目资助,获省部级奖两项。




时间:2024年8月22日-24日

地址:北京•中科院计算所一层报告厅(北京市海淀区中关村科学院南路6号)



乘坐北京地铁10号线到“知春里站”下车出A口,步行10分钟即到。


报名须知:


1、报名费:CCF会员2800元,非会员3600元。食宿交通(费用)自理。根据交费先后顺序,会员优先的原则录取,额满为止。本期ADL为线下活动,请到北京现场参会。(如果确有特殊情况,不能到现场参会,可以线上参会,请会前发邮件到adl@ccf.org.cn邮箱说明情况。线上线下报名注册费用相同。线上会议室号将在会前1天通过邮件发送。)

2、报名截止日期:2024年8月20日。报名请预留不会拦截外部邮件的邮箱,如qq邮箱。会前1天将通过邮件发送会议注意事项和微信群二维码。

3、咨询邮箱 : adl@ccf.org.cn


缴费方式:


在报名系统中在线缴费或者通过银行转账:

银行转账(支持网银、支付宝):

开户行:招商银行股份有限公司北京海淀科技金融支行

户名:中国计算机学会

账号:110943026510701

报名缴费后,报名系统中显示缴费完成,即为报名成功,不再另行通知。


报名方式:


请选择以下两种方式之一报名:

1、扫描(识别)以下二维码报名:

2、点击报名链接报名:

https://conf.ccf.org.cn/ADL151

【相关阅读】ADL152《具身智能》开启报名

读完这篇文章后,您心情如何?