2025年11月6日,CCF TF迎来了第173期活动,主题为“具身智能机器人的大模型与应用研发”。本次活动由CCF TF具身智能SIG策划呈现,活动邀请到联想集团副总裁毛世杰、英特尔中国研究院王志刚研究员和银河通用机器人公司合伙人史雪松博士三位行业一线专家来和大家分享他们对具身智能机器人的理解和实践。活动以线上直播的形式进行,吸引了众多专业人士的参与。本文将系统梳理本次活动的核心观点与技术洞察,呈现具身智能机器人的最新发展趋势。
扫码观看回看
具身智能是中国重点新兴技术,被纳入政府工作报告及“十五五”规划。本次“具身智能机器人大模型与应用研发论坛”汇聚科研机构和产业界的资深专家和开发者,拆解“大脑+小脑+本体”垂直整合的技术栈:从多模态基模型训练、数据飞轮、实时控制中间件,到场景落地的安全合规与评测标准。听众包括具身智能机器人产业链企业研发人员、大模型与算力企业方案架构师、高校与科研院所团队和希望切入硬件赛道的软件与互联网团队。论坛以“技术分享-场景共创-产业落地”为主线,助力具身智能在2027年前实现多个垂直场景的万台级规模落地。
活动由英特尔中国研究院院长、CCF TF具身智能SIG主席宋继强主持,首先宋继强介绍了CCF TF的宗旨和活动安排,随后引导与会者进入主题讨论。
联想集团副总裁、联想上海研究院院长毛世杰的报告《机器人及行业应用最新实践》围绕具身智能机器人的技术演进、联想的“本体-AI-场景闭环”布局展开,结合实际案例阐述了Robot 3.0时代的应用突破与未来方向,核心目标是通过低成本、高适应性的机器人与AI技术融合,逐步推进从“替代眼脚”到“替代手”的泛化能力。他介绍了联想机器人技术的布局的三大核心方向。方向一是本体研发:低成本、高容错、场景定义的多形态机器人,包括轮足(高效移动+复杂地形通过性)、六足(极端地形巡检、高负载)、人形(封闭场景互动,如店面服务)。方向二是AI技术的大小脑融合。小脑基于模仿学习(IL)和强化学习(RL)的运动控制,通过虚拟环境训练泛化至真实场景。大脑以三维空间智能为核心,实现实时地形识别、多传感器融合SLAM、无图自主导航,目标是自主任务规划(如“寻找物体”)。方向三是数据与闭环迭代:聚焦三类关键数据——行业缺陷数据(提升视觉检测能力)、正样本检测数据(解决样本稀缺问题)、三维模型数据(复杂场景定位导航),通过“数据-训练-泛化”闭环推进技术演进。
毛院长重点介绍了两大技术工具:Daystar World Deploy(虚拟部署与地图更新工具,通过三维建模在虚拟环境中完成机器人任务配置)和支持二次开发的开放SDK,已与IBM等企业合作集成到资产管理系统中,并面向教育实训场景开放。作为拥有15年机器人研究经验的“保守的理想主义者”,英特尔中国研究院的王志刚研究员在报告《神经符号推动工业机器人的具身实践》中指出:尽管非具身智能(如大模型)已趋成熟,但具身智能(物理AI) 的实际落地仍面临两大瓶颈:机器人系统的可靠性问题, 复杂物理任务的数据稀缺问题。为突破上述瓶颈,他主张将神经网络(数据驱动学习) 与符号逻辑(规则驱动推理) 融合,构建神经符号具身智能框架。该混合方法旨在利用神经网络实现感知与模式识别;通过符号逻辑(如PDDL等形式化语言)确保规划可靠性与可验证性。王博士以移动单臂机器人拆卸电动汽车废旧电池包螺栓为案例讲解了神经符号任务规划。用PDDL(规划域定义语言)定义动作原语、每个动作原语的前置条件与执行效果(如“抓取”需满足“物体在可达范围内”),先通过神经网络(如大模型)生成初始任务规划以提升效率,再用符号逻辑验证计划正确性以增强可靠性。任务成功率从纯神经网络方案的<80%提升至一次成功率95.7%、经重规划验证后可以达到100%。在神经符号运动规划方面,他推荐了结合模型方法(如MPC精确控制)与神经网络(自适应学习)的混合控制方案,并强调了知识注入的好处。通过编码器-解码器架构将符号知识(如运动学、静力学)以可微模型形式注入神经网络,能达到训练数据需求量较纯强化学习减少1万倍,同时提升对真实世界噪声的泛化能力。CCF智能机器人专委会常务委员、银河通用机器人合伙人史雪松博士分享了《具身智能机器人落地挑战》。他介绍银河通用机器人的核心定位为具备高泛化抓取能力“通用机器人”,即同一款硬件可适配多种场景,如货架取货、药品补货、工业搬箱、桌面泛化抓取等,无需针对单一任务定制硬件。可处理复杂场景中的物体(如软质物品、密集排列的口香糖、深冰柜内物品),且对物体位置、姿态、摩擦力等物理属性有精准感知。针对真实世界机器人数据稀缺(三维场景、物理属性数据不足),传统人工采集成本高、泛化性差的核心痛点,他们的技术路径是Sim to Real(仿真到现实)数据生成技术:在仿真器中合成海量数据(百亿级),通过随机生成场景参数(如桌子高度、物体姿态、光照)训练模型,克服“视觉鸿沟”和“物理鸿沟”,大幅降低对真实数据的依赖。通过这种技术训练出来的机器人具备了鲁棒性与长期运行能力。目前已经突破了实验室Demo局限,支持在多样化真实场景中长期稳定运行(如全国数十家“银河太空舱”,机器人自主值守的智慧零售小店),而非仅单次或低概率成功。银河通用机器人刚刚在“人形机器人运动会”医药分拣赛中夺冠,可从8个货架、数百种药品中精准抓取并放入药篮,备赛周期仅一周。
史博士还强调了具身智能机器人落地必备的快速适配与学习能力。基于“基础大模型+后训练”模式,他们可以通过海量仿真数据预训练后,仅需少量真实数据(一人/天采集量)即可快速适配新任务,且能举一反三(如学会抓取“怡宝”后,无需额外数据即可迁移至抓取“农夫山泉”“东方树叶”等同类场景)。互动环节聚焦具身智能机器人研发的技术挑战与实践进展。在行业应用中,专家讨论了采用端到端的基于学习的大模型的方法进行导航任务的发展。在技术原理方面,专家解读了神经符号AI的数学本质和PDDL规划语言的前景。在大规模合成数据训练方面,专家强调了需通过仿真或真实世界遥控生成高质量、一致性强的动作轨迹,并严格质量控制(如针对机器人构型设计轨迹)。观众对银河通用机器人的二次开发SDK表现出浓厚的兴趣。论坛总结了专家对具身智能技术瓶颈(如力觉反馈模拟、数据一致性)与产业进展的见解,强调该领域仍处于发展初期,需产学研持续协作。CCF 技术前线(TF),是专为企业一线工程师搭建的合作交流平台,通过12个SIG(特别兴趣小组)覆盖架构、人工智能、云原生、安全工程、智能制造等核心领域,聚焦技术落地痛点,助力工程师突破职业瓶颈。