返回首页
您的位置:首页 > 新闻 > CCF新闻 > ADL

ADL166《世界模型基础与应用》开启报名

阅读量:7 2025-11-13 收藏本文


CCF学科前沿讲习班

 CCF Advanced Disciplines Lectures

CCFADL第166期

主题 世界模型基础与应用

2025年12月5日-7日 北京


本期CCF学科前沿讲习班ADL166期《世界模型基础与应用》,将深入探讨世界模型的基础理论,前沿研究与应用实践。讲习班内容涵盖世界模型的基础理论和方法,同时重点解析其在具身智能、自动驾驶和人形机器人等关键领域的最新进展与应用。本期ADL将分享世界模型的基础问题、世界模型驱动的具身智能系统、构建世界模型的几何表征方法、世界模型的3D感知与生成、面向自动驾驶的可量产解决方案、通用人形角色的运动与交互控制策略等核心技术。通过系统性的理论讲解与丰富的实践案例,帮助学员全面把握世界模型的基础知识、技术脉络和应用领域。


本期ADL将对世界模型的基本原理、核心方法及前沿进展进行介绍。通过理论授课与专题研讨相结合的多元教学方式,帮助学员建立完整的世界模型知识体系,开阔科研视野,增强实践能力。我们邀请到了本领域8位来自于著名高校与企业科研机构的重量级专家学者做主题报告。他们将对世界模型的基本理论框架、关键技术突破与前沿应用场景进行深入浅出的讲解,为听众展示世界模型在具身智能、自动驾驶等关键领域的技术实现与应用场景, 帮助听众掌握主流方法的实现路径与应用技巧。


学术主任:山世光/高林 中国科学院计算技术研究所

主办单位:中国计算机学会




活动日程:




本期ADL主题《世界模型基础与应用》,由中国科学院计算技术研究所研究员,计算所智能信息处理实验室主任,智能算法安全全国重点实验室副主任山世光研究员担任学术主任,中国科学院计算技术研究所,计算所泛在计算系统研究中心副主任、中国科学院大学岗位教授高林研究员担任学术副主任。本期ADL邀请到徐凯(教授,国防科技大学)、俞扬(教授,南京大学)、龙明盛(长聘副教授,清华大学)、王靖博(青年科学家,上海人工智能实验室)、徐英豪(资深研究科学家,蚂蚁灵波科技)、马月昕(助理教授,上海科技大学)、秦红星(教授,重庆大学)、赵昊(助理教授,清华大学)8位专家做专题讲座。




学术主任


山世光

国科学院计算技术研究所

个人简介:山世光,博士,中国科学院计算所所务委员,研究员,博士生导师,计算所智能信息处理实验室主任,智能算法安全全国重点实验室副主任。他是IEEE Fellow,国家级领军人才,基金委优青,国务院特殊津贴专家,首届腾讯科学探索奖获得者,CCF青年科学家奖获得者。研究领域为人工智能,特别是计算机视觉、模式识别、深度学习、情感计算、大模型架构及垂域化、AI安全、具身智能、AI4Science等。研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖,2022年度CSIG自然科学一等奖,2024年度CSIG自然科学一等奖。现任CCF青工委副主任,CAAI模式识别专委会副主任。

高林

中国科学院计算技术研究所

个人简介:高林,中国科学院计算技术研究所研究员、博士生导师、泛在计算系统研究中心副主任、中国科学院大学岗位教授。在清华大学获得博士学位。研究方向为计算机图形学、三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文100余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任亚洲图形学学会秘书长,CSIG智能图形专委秘书长,SIGGRAPH技术论文程序委员会委员,CVPR领域主席,IEEE TVCG编委,作为项目负责人承担国家重点研发计划、国家自然科学基金委优青等项目,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖等奖励。




特邀讲者


徐凯

国防科技大学

报告题目:世界模型驱动的具身智能


报告摘要:在真实世界中学习具身操作技能代价昂贵,目前广泛采用的做法是基于仿真环境的学习和由虚到实迁移。但构建一个通用且高保真的仿真环境仍然非常困难,即便为某个单项任务构建相应的仿真环境也很难。同时,为使仿真训练的智能体能够由虚到实迁移,常需要在包括几何、结构、材质、动力学等的高维空间中进行采样,维数灾难问题突显。如能对目标环境快速构建一个机理化的专用世界模型,则只需在机理引导下对该模型进行小范围域随机化,即可支持鲁棒可泛化的策略学习。本报告分析和综述世界模型的发展脉络和最新进展,并探讨两种世界模型驱动的具身智能范式:1)直接在目标环境中采集“任务无关”的操作轨迹数据,学习符合物理规律的专用世界模型,用于多种下游任务的学习,其核心问题是如何基于稀疏轨迹数据学习符合物理规律的精准世界模型;2)首先基于大规模仿真预训练通用世界基础模型,再针对目标环境进行快速适配得到专用世界模型,用于目标环境多种下游任务的学习,其核心问题是如何实现通用世界模型的精准高效适配。最后尝试探讨和展望未来方向。


讲者简介:徐凯,国防科技大学教授。普林斯顿大学访问学者。研究方向为计算机图形学、三维视觉、具身智能、数字孪生等。在国际上较早开展了数据驱动三维感知、建模与交互工作,提出面向复杂三维数据的结构化感知、建模与交互理论方法系统,并规模化落地应用于智能制造等领域。主持国家自然科学基金青年科学基金A类(原杰青)、B类(原优青)、重点项目等。发表TOG/TPAMI/TVCG/TIP等A类论文100余篇。入选全球前2%顶尖科学家榜单。担任图形领域顶级国际期刊ACM Transactions on Graphics、IEEE Transactions on Visualization and Computer Graphics的编委,Computational Visual Media的领域执行编委。多次担任领域内重要会议的大会主席和程序主席。担任中国图象图形学会智能图形专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。曾获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖2项(排名1和3)、军队科技进步二等奖、军队教学成果二等奖、中国电子学会青年科学家奖。

俞扬

南京大学

报告题目:世界模型的基础问题


报告摘要:世界模型是实现通用决策问题的理想和必要途径,然而世界模型本身的学习面临极大挑战:反事实推理是世界模型的根本目的,因此机器学习通常的统计假设难以实现理想的世界模型。本次报告将汇报世界模型学习的具体难点和应对方法的一些研究进展。


讲者简介:俞扬,南京大学人工智能学院教授。主要从事人工智能、机器学习、强化学习方向的研究,工作获5项国际论文奖、3项国际算法竞赛冠军。入选国家青年人才计划、IEEE Intelligent Systems “AI’s 10 to Watch”,获CCF-IEEE青年科学家奖,首届亚太数据挖掘“青年成就奖”,并受邀在国际人工智能联合大会 IJCAI 2018上作“青年亮点报告”。

龙明盛

清华大学

报告题目:世界模型的可扩展实现路径


报告摘要:世界模型作为通用智能体的核心组成部分,能够赋予智能体利用所积累的丰富世界知识,实现高效探索、深度推理与长远规划的能力,在具身智能、自动驾驶等前沿领域备受关注。本次报告将聚焦于大模型时代背景下,世界模型的可扩展实现路径,系统性地讲解以下关键技术问题:如何高效表达世界状态、如何精准建模世界状态的转移,以及如何借助世界模型增强智能体的决策与推理能力。


讲者简介:龙明盛,清华大学华为副教授,软件学院长聘副教授、信息系统与工程研究所所长,工业大数据系统与应用北京市重点实验室副主任。从事机器学习、大数据分析与人工智能大模型方面的科研工作,以第一作者/通讯作者在Nature正刊/子刊和人工智能旗舰期刊/会议TPAMI、JMLR、NeurIPS、ICML、ICLR上发表论文70余篇,谷歌引用5万余次,热点论文2篇(Top 1‰),最具影响力论文6篇(Top10);气象大模型系列成果被《Nature》正刊发表和专题报道,入选《自然·机器智能》封面文章。担任TPAMI、AI编委,NeurIPS、ICML资深领域主席,Nature、Science子刊评审专家。建设和主讲清华大学“AI三部曲”课程《人工智能导论》《机器学习》《深度学习》,全部入选清华大学精品课,连续3次入选清华大学毕业生心目中的好教师,获评清华大学良师益友,“清韵烛光·我最喜爱的教师”。

王靖博

上海人工智能实验室

报告题目:从虚拟走向现实:探索通用人形角色运动与交互控制策略


报告摘要:本次报告围绕人形角色的控制策略展开,首先介绍团队在虚拟环境中构建并训练具备通用运动与交互能力的人形角色的研究工作,涵盖动作生成、感知融合及强化学习等关键技术路径。随后将深入探讨这些控制策略在真实物理世界中部署所面临的主要问题与技术挑战,包括现实感知偏差、动力学不确定性及仿真到现实的迁移难题,并分享团队在系统建模、策略优化与实机验证方面的最新研究进展。


讲者简介:王靖博,上海人工智能实验室青年科学家,主要从事人形角色控制、物理仿真、人形机器人运动控制以及具身智能等方向的研究。2023年博士毕业于香港中文大学多媒体实验室,研究聚焦于虚拟与物理世界中具身智能体,尤其是人形角色的感知—决策—控制一体化建模与通用能力提升。迄今已在CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH等国际顶级会议与期刊发表论文数十篇,多项成果获选Oral或Spotlight报告,Google Scholar引用超过9000次。曾荣获COCO等多个视觉理解挑战赛冠军,其研究成果入选ECCV十大影响力论文、ESI高被引论文,并获得2025年WAIC云帆奖“明日之星”称号。

徐英豪

蚂蚁灵波科技

报告题目:通过学习3D感知与生成构建世界模型


报告摘要:从视觉输入中感知并生成三维世界,是人类理解和与物理环境交互的根本能力。过去几十年中,计算机视觉在二维场景理解上取得了显著进展,但二维表征天然受到空间与时间信息缺失的限制,难以还原真实世界的三维复杂性。


我们如何让机器像人类一样去感知、重建并生成多样而动态的三维场景?又如何让它们在世界中思考与行动?在本次报告中,我将介绍一系列探索机器如何从视觉经验中学习三维结构的研究工作。这些系统基于可微分的场景表示,能够在无需大量监督的情况下实现跨场景泛化的三维重建与理解。更进一步,这些三维感知模型不仅让机器能够解释世界,更为其生成与交互世界奠定了基础。我将展示如何利用三维建模的先验与物理一致性,发展出高保真的三维生成模型,使AI能够结构化地控制场景与物体、模拟真实世界的几何与动力学过程。这一研究方向旨在建立能够统一感知、生成与决策的世界模型(World Model),推动AI在空间推理、行动规划与创造性理解上的跃迁,最终迈向具有人类级空间智能的通用人工智能。


讲者简介:徐英豪现任蚂蚁灵波科技资深研究科学家,即将加入香港科技大学计算机科学与工程系担任助理教授。他此前在斯坦福大学计算成像实验室从事博士后研究工作,合作导师为Gordon Wetzstein教授。


他于香港中文大学获得博士学位,师从周博磊教授与林达华教授,本科毕业于浙江大学信息工程专业,并曾作为访问学生在加州大学圣地亚哥分校(UC San Diego)跟随苏昊教授学习。他的研究聚焦于三维计算机视觉、计算机图形学与生成式人工智能的交叉领域,致力于构建能理解与生成真实世界的「世界模型」。其工作发表于CVPR、ICCV、ECCV、SIGGRAPH、SIGGRAPH Asia、ICLR、NeurIPS、ICML等国际顶级会议,多篇论文入选Oral或Spotlight报告,并获得CVPR 2022最佳论文候选。2024年获世界人工智能大会(WAIC)“云帆奖”青年科学家荣誉,并入围2022年Snap Fellowship提名。

马月昕

上海科技大学

报告题目:面向具身交互的世界模型


报告摘要:真实世界的具身交互场景中,机器人需应对环境动态变化、任务需求多样、响应实时的多重挑战,传统技术在感知泛化能力与决策精准度上难以兼顾。世界模型作为连接感知、决策与执行的核心枢纽,通过学习环境底层规律构建动态认知模型,可实现复杂场景的提前预判与自适应决策优化。本报告以自动驾驶、智能操作等典型具身场景为依托,系统阐述世界模型的核心架构、学习机制及落地路径。


讲者简介:马月昕,上海科技大学研究员、助理教授、博士生导师,博士毕业于香港大学。主要研究方向为三维视觉、具身智能、自动驾驶。共发表相关领域顶会或顶刊论文90余篇,其中一作与通讯论文50余篇,包括Science Robotics、TPAMI、CVPR、ICCV、SIGGRAPH等,谷歌学术引用6000余次。参与指导的论文获MICCAI 2024唯一最佳论文奖,ACM MM 2024最佳论文候选。曾获SemanticKITTI、NuScenes、Argoverse等多个国际自动驾驶挑战赛冠军和亚军;曾获上海市海外高层次人才、上海市优秀教学成果一等奖、China 3DV 2025年度优秀青年学者、入选全球前2%顶尖科学家榜单等。

秦红星

重庆大学

报告题目:构建世界模型的多分辨率几何表达解读


报告摘要:神经辐射场已经成为计算机图形学领域的一种重要技术,广泛应用于三维渲染、场景重建等领域。从技术角度看,神经辐射场表现出了多分辨率的特性。本报告将从多分辨率的角度对神经辐射场的表达、光照模型、优化过程和前馈网络重建进行解读,为神经辐射场构建详细的技术体系。


讲者简介:秦红星,男,博士,教授,博士生导师,目前任职于重庆大学计算机学院。2008年获上海交通大学博士学位,2008年至2009年于美国罗格斯新泽西州立大学从事博士后研究工作。主要研究方向为计算机图形学、三维视觉、可视化与可视分析。在ACM TOG,IEEE TVCG、CGF等国际著名期刊发表五十余篇;作为课题负责人先后主持国家自然科学基金项目3项,国家重点研发子课题1项目,重庆市基金2项;作为骨干成员参与国家自然科学基金重点项目、重庆市重点项目等多项;指导学生参加科技竞赛多次获得一等奖。

赵昊

清华大学

报告题目:可量产的自动驾驶世界模型


报告摘要:要实现可靠的自动驾驶,亟需具备可扩展性、可泛化性与可量产能力的世界模型(World Model),能够在多样化的真实环境中完成感知、决策与安全评估。然而,现有生成式管线往往仅关注单一模态、缺乏可控性,或无法支持闭环决策。在本次报告中,我将基于我们近期的三项工作,系统阐述下一代自动驾驶世界模型的统一框架与技术路线。首先,UniScene 提出了以占据(occupancy)为核心的生成范式,通过“语义占据 → 视频与激光雷达”的渐进式合成,实现高保真、可控且具备丰富标注的模拟与训练数据生成。其次,DiST-4D 通过引入metric depth作为统一几何表示,显著提升动态场景生成性能,在时间轨迹外推与空间新视角渲染上均达到当前最优效果,并摆脱了逐场景优化的依赖。最后,OmniNWM 将世界模型拓展至真正的可量产层面,联合建模状态、动作与奖励,构建全景导航式的闭环世界模型,实现精确的自车控制与基于占据的安全评估。综合来看,这三项系统展示了一条通向工业级落地的可行路径:世界模型作为可控、几何感知、奖励驱动的模拟器,在学习与安全执行之间架起桥梁。报告最后将探讨如何从离线生成式基准过渡到高可靠、实时运行的自动驾驶系统。


讲者简介:赵昊,清华大学智能产业研究院(AIR)助理教授,智源学者(BAAI Scholar),于清华大学电子工程系获得学士和博士学位,曾于英特尔中国研究院担任研究员,曾在北京大学从事博士后研究。他在CVPR/NeurIPS/SIGGRAPH/ICRA等学术会议以及TPAMI/IJCV等学术期刊上发表了50余篇研究论文,赢得过多项三维场景理解算法挑战赛的冠军,并主导研发了全球首个开源的模块化真实感自动驾驶仿真器MARS,在CICAI 2023获得Best Paper Runner-up奖项,被工业界广泛使用。其主导研发的渲染阶段可调整精度速度的神经渲染方法SlimmeRF于3DV 2024获得Best Paper奖项。



时间2025年12月5-7日

地址:北京•中国科学院计算技术研究所


报名须知:


1、报名费:CCF会员2800元,非会员3600元。食宿交通(费用)自理。根据交费先后顺序,会员优先的原则录取,额满为止。本期ADL为线下活动,请到北京现场参会。(如果确有特殊情况,不能到现场参会,可以线上参会,请会前发邮件到adl@ccf.org.cn邮箱说明情况。线上线下报名注册费用相同。线上会议室号将在会前1天通过邮件发送。)

2、报名截止日期:2025年12月3日。报名请预留不会拦截外部邮件的邮箱。会前1天将通过邮件发送会议注意事项和微信群二维码。如果届时未收到邮件,请务必咨询邮箱adl@ccf.org.cn。

3、咨询邮箱 : adl@ccf.org.cn


缴费方式:


在报名系统中在线缴费或者通过银行转账:

银行转账(支持网银、支付宝):

开户行:招商银行股份有限公司北京海淀科技金融支行

户名:中国计算机学会

账号:110943026510701

报名缴费后,报名系统中显示缴费完成,即为报名成功,不再另行通知。


报名方式:


请选择以下两种方式之一报名:

1、扫描(识别)以下二维码报名: 

2、复制以下链接到浏览器报名:

https://conf.ccf.org.cn/ADL166