CCF山西大学学生分会参加YEF“具身决策前沿:从强化学习到具身大模型” 专题论坛
2026年5月21日下午,YEF 2026“具身决策前沿:从强化学习到具身大模型”专题论坛在绵阳科发铂骊酒店2F潼川厅成功举办。该专题论坛由CCF杰出会员、山西大学魏巍教授担任论坛主席,山西大学副教授陈路担任共同主席。CCF山西大学学生分会部分同学参加论坛活动。论坛邀请了来自中国科学院大学、中科院工业人工智能研究所、天津大学、哈尔滨工业大学、中国电信人工智能研究院等机构的专家学者,围绕强化学习与具身大模型的技术演进路径与未来挑战展开前沿探讨,聚焦技术突破、应用场景与未来趋势,为智能机器人及自主系统研究发展注入新动能。
图1 CCF杰出会员、山西大学魏巍教授主持本次论坛
论坛首先由执行主席魏巍教授介绍背景。他指出,当前人工智能正经历从虚拟认知向物理交互的战略跨越,具身智能已成为这一进程的核心方向,尤其是具身决策作为打通“认知—行动”闭环的关键环节,正推动技术实现从“底层动作优化”到“高层认知闭环”的根本性跃迁。然而,这一前沿探索仍面临诸多技术挑战与演进难题,如何系统梳理技术脉络、凝聚学术共识成为当前的重要课题。本次论坛聚焦“具身决策前沿”议题,汇聚领域顶尖学者深入探讨技术演进路径与未来挑战。通过前沿成果分享与思想碰撞,推动具身智能决策技术的深度融合与创新发展,为人工智能迈向物理世界注入新动能。
在报告环节,中国科学院大学蒋树强教授带来了题为《浅谈具身智能中的自我模型》的特邀报告。他首先剖析了具身智能体实现环境适应与自主交互的核心需求,指出智能体不仅需要理解外部世界,更需深刻认知“自我”。随后,他参照人类自我认知机制,阐述了面向具身智能的“自我模型”定义与内涵,重点介绍了该模型对智能体身体、能力、记忆、行为及身份等维度的综合表示与建模方法,并详细解析了其计算框架和六级分层体系。最后,他分享了自我模型的真机实现方案,并对该领域的未来发展方向进行了展望。
|
|
图2 中国科学院大学蒋树强教授作《浅谈具身智能中的自我模型》特邀报告(左);魏巍教授为蒋树强教授颁发感谢牌(右)
中科院工业人工智能研究所徐凯研究员作了题为《仿真器-世界模型在环的具身数据飞轮》的特邀报告。他在报告中剖析了高质量数据作为制约具身智能发展核心挑战的现状,指出传统模式尚未形成可持续的数据闭环与迭代飞轮。随后,他详细阐述了“世界模型在环”、“仿真在环”及“通专协同”等多种具身数据闭环模式,旨在构建仿真与真实世界交互的可持续循环以驱动策略模型进化。最后,他分享了团队在通用世界模型训练适配、SimReady场景重建等关键技术上的最新进展。
|
|
图3 中科院工业人工智能研究所研究员徐凯作《仿真器-世界模型在环的具身数据飞轮》特邀报告(左);魏巍教授为徐凯研究员颁发感谢牌(右)
天津大学郝建业教授作了题为《具身智能体》的特邀报告。他在报告中剖析了当前大模型在物理世界具身智能任务中面临时空理解推理能力不足与精细化操作缺失等关键挑战,并系统介绍了大模型技术背景及具身智能面临的瓶颈。随后,他重点阐述了从数据、模型、优化和推理三方面实现Scaling Law的技术挑战与最新进展,详细分享了自动化任务生成、强化学习驱动的数据生产与能力评估、分层架构演进及端侧部署加速等核心方法。最后,他对下一代具身模型的发展趋势进行了展望。
|
|
图4 天津大学郝建业教授作《具身智能体》特邀报告(左);陈路副教授为郝建业教授颁发感谢牌(右)
哈尔滨工业大学张伟男教授作了题为《基于大模型的具身行为规划》的特邀报告。他在报告中首先介绍了具身智能中感知、认知与执行的三大核心模块,指出具身行为规划作为具身推理的重要问题近年来备受关注。随后,他系统分析了当前基于大模型的具身行为规划研究存在的问题与挑战,并重点分享了该方向上的前沿研究工作与最新进展。
|
|
图5 哈尔滨工业大学张伟男教授作《基于大模型的具身行为规划》特邀报告(左);陈路副教授为张伟男教授颁发感谢牌(右)
中国电信人工智能研究院白辰甲博士作了题为《数据和模型双向驱动的具身大模型》的特邀报告。他在报告中指出,高质量数据与模型通用化是具身智能发展的关键,并分享了TeleAI团队在仿真数据合成与真机数据校验方面的系列成果。随后,他重点介绍了团队提出的PRTS操作大模型与GN0通用导航大模型,阐述了如何通过强化学习原生驱动与跨本体适配,推动数据质量和模型能力走向高水平。
|
|
图6 中国电信人工智能研究院白辰甲博士作《数据和模型双向驱动的具身大模型》特邀报告(左);陈路副教授为白辰甲博士颁发感谢牌(右)
在论坛的PANEL讨论环节,邀请了多位与会嘉宾,围绕“具身智能的“GPT时刻””、“VLA真的‘已死’吗?——技术路线之争的本质与走向”以及“仿真、真机、人类视频——谁才是具身智能的‘主食’?”等核心议题展开深入探讨。与会专家各抒己见,分享了诸多精彩观点,为相关领域研究拓展了新思路。
|
|
|
|
|
|
|
|
图7 Panel 环节
本次论坛历时四个小时,魏巍教授对本次论坛进行了总结。通过此次论坛,参会同学对未来具身决策大模型演进路径有了更加清晰的理解。最后,论坛在一片热烈的氛围中圆满结束。
返回首页
















