随着物联网和人工智能的迅猛发展,边缘计算和人工智能的结合催生了边缘智能这一新的研究领域。边缘智能具备一定的计算能力,能够提供实时、高效和智能的响应。它在智能城市、工业物联网、智能医疗、自动驾驶以及智能家居等领域都具有重要的应用。为了提升模型的准确度,深度神经网络往往采用更深、更大的架构,导致了模型参数的显著增加、存储需求的上升和计算量的增大。受限于物联网边缘设备在计算能力、存储空间和能源资源方面的局限,深度神经网络难以被直接部署到这些设备上。因此,低内存、低计算资源、高准确度且能实时推理的轻量级深度神经网络成为了研究热点。文中首先回顾边缘智能的发展历程,并分析轻量级深度神经网络适应边缘智能的现实需求,提出了两种构建轻量级深度神经网络模型的方法:深度模型压缩技术和轻量化架构设计。接着详细讨论了参数剪枝、参数量化、低秩分解、知识蒸馏以及混合压缩5种主要的深度模型压缩技术,归纳它们各自的性能优势与局限,并评估它们在常用数据集上的压缩效果。之后深入分析轻量化架构设计中的调整卷积核大小、降低输入通道数、分解卷积操作和调整卷积宽度的策略,并比较了几种常用的轻量化网络模型。最后,展望轻量级深度神经网络在边缘智能领域的未来研究方向。
以ChatGPT为代表的AIGC应用崛起,在全球范围内掀起了一场关于大模型的竞速赛,由此导致AI算力需求急速攀升。边缘算力在成本、时延、隐私上具有天然优势,可作为云端算力的补充可,更好支撑大模型赋能千行百业。本报告将介绍边缘大模型多设备高效协同推理和分布式微调技术,以及边缘大模型赋能的网联智能无人系统应用。
人类正在进入“人机物”融合万物智能互联的时代。随着物联网和人工智能技术的飞速发展,智能物联网(AIoT)正成长为一个极具前景的新兴领域,它以人工智能、边缘计算与物联网等技术的深度融合为基础,在感知、通信、计算和应用中通过AI技术赋能,构建具有更高灵活性、自组织性、自适应性、持续演化的物联网系统。本次报告将分享西工大在智能物联网概念体系、前沿探索与系统创新方面的最新进展。
大模型落地应用的边际成本是目前最大的痛点,端侧芯片是解决边际成本最理想的产业体系,通过端侧消费者一次性买断的硬件成本来承担大模型推理成本,避免了每一个应用都需要担负昂贵的云端推理成本,零边际成本才能促成更加繁荣的大模型产业,类似今天的游戏产业和显卡的关系。端侧芯片角度需要考虑如何在消费级市场可接受的成本下让消费者享受到最极致的大模型体验,大模型对显存和算力等各方面需求也发生了巨大的变化,带来芯片设计的全新机会和挑战。
随着人工智能技术的快速发展,大模型在端侧设备上的部署需求日益迫切。然而,传统的大模型往往面临计算资源消耗巨大、推理速度缓慢等挑战,难以在资源受限的端侧环境中有效运行。MiniCPM4作为专门针对端侧设备优化设计的高效大模型,为解决这一关键问题提供了解决方案。MiniCPM4的核心创新体现在四个关键维度的系统性突破。在模型架构层面,InfLLM v2可训练稀疏注意力机制能够显著加速长上下文处理过程中的预填充和解码阶段。在训练数据方面,UltraClean高效数据过滤策略使得仅需8万亿词元即可达到令人满意的模型性能。在训练算法优化方面,模型风洞实现了高效的预训练策略搜索,分段的探索采样实现了负载均衡的强化学习和三值量化后训练BitCPM实现了参数存储的极限瘦身。在推理系统层面,CPM.cu推理引擎集成了稀疏注意力、模型量化和投机采样等技术,大幅提升了模型的推理效率。在典型的端侧芯片上测试结果表明,相比于Qwen3-8B,MiniCPM4能够实现5倍以上的推理加速。
人工智能的快速发展与广泛应用已成为经济社会发展的强大引擎。大小模型端云协同进化作为人工智能关键前沿技术,可有效克服云侧集中式学习范式在可扩展性、实时性、个性化、负载成本、隐私安全等方面的不足,已成为产学研的焦点,并被Gartner和阿里巴巴达摩院等国内外知名机构预测为革新智能计算范式的科技趋势。本报告将会追寻端云协同智能技术的发展脉络,分享团队在端侧智能推理、大规模联合学习以及端云协同分布式智能支撑系统等方面的研究进展。
随着人工智能的发展,具身智能和任务规划逐渐成为研究热点。传统任务规划方法在面对不可预测环境时缺乏灵活性,而大语言模型凭借其强大的语言理解和多模态能力,为智能体提供更全面的任务规划方案,为解决这一问题提供了可能性。综述了基于大模型的智能体任务规划方法,涵盖了单智能体与多智能体情境下的不同策略,并探讨了几种代表性框架及其在实际应用中的表现与潜力。具体而言,分别介绍了端到端规划、分阶段规划、动态规划等单智能体大模型任务规划方法,以及集中式规划、分布式规划和混合式规划等多智能体大模型任务规划方法,并分析了这些方法如何结合强化学习、多模态感知等技术来优化规划过程。此外,讨论了基于大模型的具身智能任务规划的特点、局限性以及存在的挑战,并展望了未来的发展方向。本研究旨在为设计更加灵活、适应性强的下一代具身智能系统提供有价值的参考。