返回首页

上海人工智能实验室大模型中心加入AI Infra工作组,共建开源生态新篇章

阅读量:37 2025-09-12 收藏本文

上海人工智能实验室大模型中心加入AI Infra工作组,共建开源生态新篇章

图片

近日,我国人工智能领域的新型科研机构——上海人工智能实验室大模型中心正式加入CCF ODTC AI Infra工作组,共同致力于XTuner、LMDeploy、DLSlime、dlBLAS等AI Infra相关开源项目的推广与治理工作。

组织介绍

上海人工智能实验室是我国人工智能领域的新型研发机构,于2020年7月在世界人工智能大会上揭牌成立。作为中国人工智能领域的重要力量,该实验室聚焦"战略性、原创性、前瞻性"科学研究与技术攻关,致力于突破人工智能重要基础理论与关键核心技术。实验室着力构建“突破型、引领型、平台型”一体化大型综合性研究基地,以支撑我国人工智能产业实现跨越式发展,目标建成国际一流的人工智能实验室。

上海人工智能实验室大模型中心专注语言大模型、多模态大模型、大模型评测、强化学习、推理能力增强等方向的研究。目前已推出书生大模型体系,涵盖科学多模态大模型Intern-S1和 InternLM、InternVL等通用模型,以及xtuner训练框架,lmdeploy推理框架。此外,中心还构建了司南评测体系,以纯粹技术及中立视角,为业界提供能力指标参考和优化方向指引。大模型中心秉持开源开放赋能创新的理念,通过推进书生大模型及工具链开源,已助力诞生创新项目近千个,与各界共同促进了AI生态繁荣与产业发展。

技术贡献

上海人工智能实验室大模型中心带来了多项重量级开源项目,其实际应用效果已展现显著性能提升。

"XTuner" 是上海人工智能实验室大模型中心推出的新一代训练引擎。XTuner V1基于PyTorch FSDP进行开发,针对FSDP通信量大的不足实施系列优化,可支持“1T参数量级MoE模型训练”。该引擎在200B以上量级的混合专家模型训练中,其吞吐表现超越传统3D并行训练方案,并于大规模长短序列混合训练场景下实现2倍以上速度提升。

"LMDeploy"是上海人工智能实验室大模型中心推出的大模型推理部署工具,旨在显著提升大模型推理性能,并支持多种硬件架构。该工具实现了FP8和MXFP4等高效量化技术,可在保持模型精度的前提下,大幅降低模型存储与计算资源需求。

另外,DLSlime、dlBLAS等开源项目同样在AI基础设施领域发挥着重要贡献。

加入意义

上海人工智能实验室大模型中心加入AI Infra工作组,将加速AI基础设施技术的标准化与产业化进程,推动其创新与普及,为行业发展带来多重积极影响。实验室将通过开源方式,助力解决AI训练和推理过程中的"效率瓶颈"与"成本问题",使更多企业和研究机构得以负担大模型的训练与部署。工作组亦将为上海人工智能实验室大模型中心相关开源项目提供孵化支持,并在项目治理、推广及开源活动方面予以支持。

此种开源合作模式亦为其他科研机构与企业提供了参考范式,展现了如何通过AI Infra开源项目的“产学研用投”协同机制,共同推动开源技术进步与产业发展。


上海人工智能实验室大模型中心提供的XTuner、LMDeploy等开源项目已充分证明其在大规模训练与推理优化方面的价值。这些工具的进一步推广与规范治理,将为我国乃至全球AI开发者提供更强大、更高效的基础设施支持,加速人工智能技术的创新与落地应用。

上海人工智能实验室大模型中心的加入,将显著增强AI Infra工作组的技术实力与行业影响力。工作组亦诚邀对开源事业怀有热忱的企业、高校、研究机构及产业投资机构加入,共谋发展。

未来,随着AI Infra工作组各项开源工作的持续推进,有望形成更为统一、高效的开源AI基础设施体系,为人工智能技术在各行业的规模化应用提供坚实支撑。