CNCC | “端”启未来:自动驾驶的革命,邀你一探究竟!
CNCC2024
论坛简介:
端启未来——端到端自动驾驶技术新趋势
举办时间:10月25日13:30-17:30
地点:夏苑-泰国馆一楼
注:如有变动,请以官网(https://ccf.org.cn/cncc2024)最终信息为准
端到端自动驾驶技术代表了自动驾驶领域的一个巨大飞跃,它通过先进的算法和人工智能技术,实现了从感知环境到做出驾驶决策的全链条自动化。同时利用大量行驶数据,不断优化模型,提高对复杂交通场景的处理能力。尽管面临安全性、泛化能力等诸多挑战,端到端自动驾驶正逐步推动智能交通系统向更智能、更安全和更高效方向发展,预示着未来出行方式的变革。
本论坛以“端到端自动驾驶技术新趋势”为主题,邀请业界资深专家及学界教授从不同视角分享最新研究成果及技术洞察,并就端到端对自动驾驶带来的机遇与挑战进行深入探讨。
论坛日程
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 开场致辞 | 盛克华 | 滴滴自动驾驶公司 |
2 | 端到端自动驾驶系统架构设计与技术探讨 | 陈亦伦 | 清华大学智能产业研究院 |
3 | Frontiers and Challenges in End-to-end Autonomous Driving | 李弘扬 | 上海人工智能实验室 |
4 | The Evolution of Motion Transformer: Advancing Motion Prediction in Autonomous Driving | 蒋理 | 香港中文大学(深圳) |
5 | 端到端闭环自动驾驶从实验室走向落地 | 杨学 | 上海人工智能实验室 |
6 | Panel:端到端自动驾驶技术新趋势 | 主持人: 史少帅(滴滴自动驾驶公司) 嘉宾:陈亦伦、李弘扬、蒋理、杨学 |
论坛主席及嘉宾介绍
论坛主席
史少帅
滴滴自动驾驶公司高级专家工程师 & AI Research负责人
简介:现为滴滴自动驾驶AI Research团队负责人,博士毕业于香港中文大学多媒体实验室,研究方向为计算机视觉与深度学习。在CVPR/TPAMI等顶级会议和期刊上发表30余篇论文,被引量超过9000次;曾获谷歌博士奖学金、世界人工智能大会云帆奖等荣誉;多次入选斯坦福大学与爱思唯尔数据库共同发布的全球前2%顶尖科学家年度影响力榜单。
论坛讲者
陈亦伦
清华大学智能产业研究院
简介:清华大学智能产业研究院(AIR)智能机器人方向首席专家,AIR创新中心主任,AIR无锡创新中心执行主任,博士毕业于美国密西根大学电子工程系,本科及硕士毕业于清华大学电子工程系。他曾发表论文30余篇,同行引用2000余次,发明专利16项,已获评上海市人工智能正高级工程师,浙江省千人计划特聘专家等。陈博士有丰富的企业管理与产品研发经历,此前他曾担任华为公司智能汽车解决方案事业部自动驾驶系统CTO、首席科学家,负责华为高阶自动驾驶技术解决方案设计,从0到1主导完成了华为第一代自动驾驶系统的全栈研发;还曾任大疆创新机器视觉总工程师,景焱智能技术副总裁、美国伊顿公司技术专家与项目群负责人等职位。
报告题目:端到端自动驾驶系统架构设计与技术探讨
摘要:从自动驾驶演进历程、当代技术主要挑战、趋势和机遇、设计思路、核心模块以及参考工程设计等角度进行技术探讨。从现有自动驾驶系统的问题出发,讨论端到端自动驾驶的系统架构与核心模块,包括具身智能基础大模型、4D 全场景感知网络和端到端自动驾驶大模型等。针对实车测试和部署结果做出进一步讨论,以及探讨未来的技术趋势和关键可能方向。
李弘扬
上海人工智能实验室
简介:上海AI实验室OpenDriveLab负责人、香港大学助理教授。研究方向为端到端驾驶、通用具身智能。2019年在香港中文大学获得博士学位。他主导的端到端自动驾驶项目UniAD,获得IEEE CVPR 2023最佳论文奖。UniAD在工业界和学术界都产生了明显的社会经济效益,包括特斯拉推出的FSD V12。他提出的俯视图感知工作BEVFormer,获得了2022年百强影响力人工智能论文榜单,并得到英伟达CEO黄仁勋、Mobileye CEO Shashua教授在相关公开演讲的单独提及。主持国家自然基金委青年基金、上海市东方英才计划(领军项目)。多次担任CVPR、NeurIPS、ICLR、ACM MM等会议领域主席,其中获得NeurIPS 2023 Notable Area Chair称号。他是《自然·通讯》的审稿人。上海交通大学国家卓越工程师学院行业导师。IEEE高级会员;IEEE汽车委员会自动驾驶国际标准工作组组长。
报告题目:Frontiers and Challenges in End-to-end Autonomous Driving
摘要:End-to-end autonomous driving (E2E AD) has become a popular hit recently. Compared to conventional modular based design, the main advantages of E2E AD descend from the global optimization across sub-modules in the system, and the unanimous objective towards planning and control task. Some leading corporations from industry have also adopted such an end-to-end philosophy and rolled out to customers on the product end. In this talk, we will first walkthrough the key milestones and roadmap of E2E AD, including the first prototypical work UniAD, proposed by OpenDriveLab and recognized as IEEE CVPR 2023 Best Paper. Then the pivotal challenges (generalization, world model, etc.) that the community currently are confronted with are discussed. With the prevalence of foundation models, how to utilize LLM/VLM techniques and distill common knowledge from experienced human experts are covered as well.The talk would be concluded with some future perspectives on building towards a general and intelligent system in a wide span of downstream applications for the next couple years.
蒋理
香港中文大学(深圳)
简介:现为香港中文大学(深圳)数据科学学院助理教授。她于2021年获得香港中文大学博士学位,其后在Max Planck研究所担任博士后研究员。她的研究方向集中在计算机视觉、人工智能、和机器学习领域,如三维场景理解、自动驾驶、表征学习和多模态学习等。她的研究成果发表在CVPR、ICCV、ECCV、NeurIPS、TPAMI和IJCV等顶级会议和期刊中,并多次获选口头报告与亮点论文,谷歌学术引用量8000余次。其关于自动驾驶运动预测的研究在2022-2024年的CVPR Waymo Open Dataset Motion Prediction Challenge中连续三届获得第一名。
报告题目:The Evolution of Motion Transformer: Advancing Motion Prediction in Autonomous Driving
摘要:Motion prediction is a vital component of autonomous driving systems, enabling them to navigate complex traffic scenarios effectively. This challenging task involves modeling the diverse interactions among multiple agents and the surrounding environment to predict multi-modal future trajectories. In this talk, we will begin by exploring the Motion Transformer (MTR), a state-of-the-art framework in motion prediction that was recognized as an Oral Paper at NeurIPS 2022 and the champion of the 2022 Waymo Open Dataset Motion Prediction Challenge. Following this, we will discuss MTR++, which extends the capabilities of MTR by enabling the simultaneous prediction of scene-compliant futures for all agents, modeling future behavior interactions within a unified transformer architecture. Lastly, we will delve into MTR v3, which further advances motion prediction by incorporating raw sensor data, aligning with the growing importance of world models that aim to capture the state and dynamics of the environment.
杨学
上海人工智能实验室
简介:上海人工智能实验室研究员,主要研究基础视觉,多模态大模型。在TPAMI/IJCV/CVPR/NeurIPS等CCF-A类期刊和会议上发表30余篇,包含一篇Paper Digest最具影响力AAAI21论文榜首,谷歌学术引用超过6200次。曾获CCF/上海交通大学优博、CCF-CV学术新锐学者,并于2022和2023年入选全球前2%顶尖科学家榜单。
报告题目:端到端闭环自动驾驶从实验室走向落地
摘要:多模态自动驾驶是当前人工智能产业落地的一个热点领域,本报告将介绍讲者及团队在这一领域的近期研究成果。主要覆盖显式端到端模型、隐式端到端模型、预训练模型及融合隐式世界模型的相关技术与实验结果。相关工作在CVPR、ICCV、ECCV、ICLR、NeurIPS、TPAMI等发表,并与相关企业进行了合作商业落地。
关于CNCC2024
CNCC2024将于10月24-26日在浙江省东阳市横店镇举办,大会主题为“发展新质生产力,计算引领未来”。大会为期三天,包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势,分享创新成果。预计参会者超过万人。