本报告从人形机器人产业发展角度出发,对人形机器人应用场景、技术发展以及未来市场主体进行了研判,应用场景方面,人形机器人在社区家庭以及复杂作业场景最具应用优势,但未来三年大市政工程将成为主要应用场景;技术发展方面,人形机器人硬件与算法正在趋同,传统核心技术壁垒正在消失,建立测试、标准与质量系统,打造稳定可靠产品,将成为发展关键。
只有具备灵巧作业能力,机器人才能够在工业、医疗、商业、家庭场景中完成各式各样的任务,实现价值;灵巧手作为机器人灵巧操作的终端,受到广泛关注;本报告着重分享因时机器人在灵巧手设计和应用领域的研究进展。
本报告深入探讨了具身智能作为实现通用人工智能(AGI)的关键路径,涵盖了从具身智能的基础理论与技术原理,到其在机器人领域的实际应用与最新进展;从单一智能体的感知与决策能力,到多智能体系统的协同与交互机制;从面向现实任务的场景学习,到基于具身智能的AGI未来设想等多个维度。报告不仅分享了宇树科技在机器人硬件、算法及系统集成方面的最新突破,还探讨了具身智能领域面临的技术挑战、未来发展方向以及潜在的广泛应用场景。通过理论与实践的紧密结合,探讨了具身智能如何推动AGI的实现,并展望了其在未来社会中的深远影响。
提出了一种名为“Denoising World Model Learning (DWL)”的强化学习框架,旨在提升人形机器人在复杂地形中的运动能力。传统的基于模型的控制方法依赖于精确的环境建模,而现有的无模型强化学习方法在复杂现实环境中的应用仍然有限。DWL通过去噪世界模型学习,能够在模拟环境中训练机器人,并实现零样本的模拟到现实的迁移,成功应用于现实世界中的复杂地形,如雪地、斜坡、楼梯和不规则地面。该研究首次实现了人形机器人在复杂现实环境中的端到端强化学习控制,为人形机器人在现实世界中的广泛应用提供了新的可能性。
实现通用类人智能(AGI)一直是人工智能领域的长期目标。智能体作为具备感知、决策和行动能力的人工实体,成为实现该目标的关键组成部分。近年来,大模型凭借其强大的通用能力,为AGI的实现提供了新的可能性。越来越多的研究者开始将大语言模型作为构建智能体的核心基础,并在此方向上取得了显著进展。本报告对基于大语言模型的智能体进行了系统的综述,内容涵盖了智能体的发展历程、通用框架、应用场景以及智能体社会的构建等方面。同时,本报告还总结了该领域未来的发展方向及当前面临的关键问题。
该PPT围绕人形机器人的视触觉感知与智能灵巧操作展开,介绍其发展历程、工业界和学术界的研究现状,阐述具身智能操作学习方法、视触觉传感器研发成果及仿真技术,对比分析机器人大模型,探讨机器人训练数据采集方式的优劣,强调操作大模型的应用前景与多模态大模型的发展趋势。