YEF2026 | 开源&AI共创——智创算力时代,GPU开源生态的破局与新生邀你共探
AI算力基础设施快速演进,单一技术生态主导下的多架构不兼容、适配成本高、创新受限等问题日益突出,构建开放统一的GPU开源生态迫在眉睫。
本论坛以 "智创算力:GPU开源生态的破局与新生" 为主题,聚焦开源技术创新、多架构协同适配、人才体系建设等多个核心方向,邀请行业专家分享实践经验,探讨国产开源生态构建路径,共同推动智能计算底层技术自主创新与产业高质量发展。
日程安排
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 论坛开场、嘉宾介绍、YOCSEF文化宣导 | 王天阳 | 湖南先进技术研究院 |
2 | 硬件无关的高性能数据传输:Mooncake Transfer Engine支持国产通信协议的开源实践 | 马腾 | 阿里云 |
3 | 面向AI应用的RISC-V扩展指令集与加速器 | 高明晋 | 中国科学院计算技术研究所 |
4 | 开源为桥:多架构GPU时代的人才培养体系重构与产学研协同实践 | 章津楠 | 沐曦股份 |
7 | 从“能跑起来” 到 “敢选用”:超算一线视角下国产GPU开源生态的破局路径 | 陈泽宇 | 国家超级计算长沙中心 |
8 | Panel深度研讨 | 全体讲者+ 观众 | 产学研用各单位 |
9 | 闭幕总结、致谢 | 执行主席 | CCF YOCSEF 长沙 |
论坛主席
湖南先进技术研究院开源运营经理
CCF YOCSEF长沙候任副主席,CCF开源发展技术委员会秘书,长期深耕开源生态建设与学术科普领域,统筹策划执行CCF中国开源大会、系列开源赛事等各类项目,深耕校企产学研联动,具备丰富的资源整合与活动落地实战经验,持续助力开源文化普及与科创生态发展。
国防科技大学计算机学院副研究员
CCF YOCSEF长沙候任学术秘书,从事大模型与自然语言处理方向研究,发表论文四十余篇,获国家专利授权二十余项,入选中国科协青年人才托举工程等,获吴文俊人工智能青年科技奖等多项荣誉,担任多个学术会议领域主席及学会委员。
论坛讲者
阿里云智能高级技术专家
CCF开源发展委员会执行委员,阿里云GPU算力平台核心负责人,主要从事基础软件尤其是大模型软件栈在新硬件环境下国产化的研究工作,作为阿里方负责人运营大模型开源项目Mooncake(3.6KStar),发表论文二十余篇,授权美国/中国专利10项,曾入选CCF系统软件专委会优秀博士论文激励计划。
报告题目:硬件无关的高性能数据传输:Mooncake Transfer Engine 支持国产通信协议的开源实践
摘要:CUDA生态的垄断不仅体现在计算层,更深植于以GPUDirect RDMA、NCCL为代表的传输与通信基础设施中——数据搬运的每一个环节都依赖NVIDIA专有协议栈,使异构硬件在接入时面临”卡脖子”的底层壁垒。本报告以Mooncake Transfer Engine的设计与生产落地实践为核心,系统阐述如何通过开源技术在传输层实现真正的硬件解绑,其核心思路是将高性能零拷贝数据传输能力抽象为统一接口,底层按硬件能力自适应选择最优传输路径,当前已支持多种链路,在国产GPU环境中可获得与CUDA路线可比的传输性能。
中科院计算所副研究员
硕士生导师、中科院青促会会员,主要研究方向为开源处理器微架构、处理器敏捷设计、无线信号处理等,主持工信部工业互联网创新发展工程项目(子课题)等多项课题,相关成果发表论文10余篇,申请国家发明专利30余项,成果亮相国家“十二五”科技创新成果展等。
报告题目:面向AI应用的RISC-V扩展指令集与加速器
摘要:随着RISC-V在AI领域的应用快速增长,使用RISC-V进行AI指令集扩展已成为业界共识。RISC-V+AI算力生态(RACE)委员会通过加快制定和完善RISC-V AI扩展指令集等方面的行业和国际标准,确保不同算力芯片之间的兼容性和互操作性。本次报告首先对RACE进行介绍,进而介绍RISC-V AI扩展指令集制定、仿真器以及加速器IP设计的最新进展。
沐曦股份开源生态总监
CCF开源发展委员会执行委员,复旦大学硕士,10年+创业经历,15年以上的Infra开源产品和运营经验,主导发起的开源建木获选进入国家重点研发计划成果“木兰开源社区”平台孵化并正式捐赠,参与制定国内开源领域的国家和团体标准,获“2022年度云计算标准工作先进个人”,推动国内“AI Infra开源社区”建立。
报告题目:开源为桥:多架构GPU时代的人才培养体系重构与产学研协同实践
摘要:本报告将分析当前AI开源生态中高校教学体系与产业需求的核心断层,结合产学研协同落地经验,分享以开源为核心的GPU人才培养体系重构方案,拆解课程建设、实训体系、社区导师制的落地路径,打通高校培养、社区贡献、产业就业的人才闭环。
国家超级计算长沙中心高性能计算研发工程师
聚焦人工智能与大模型系统方向,主要负责中心大模型算力集群的运营管理与对外技术服务,深度参与《国产AI芯片软件生态白皮书》撰写,并负责AI加速器软件生态评测体系建设,发表学术论文4篇,获授权专利2项。
报告题目:从“能跑起来”到“敢选用”:国产GPU开源生态的超算实践与共建路径
摘要:随着超算业务从传统HPC仿真走向HPC+AI融合,用户关注的不再只是单点算力性能,而是模型迁移、环境复现、算子覆盖、调度监控、结果验证和长期运维等完整生态交付能力。报告结合长沙超算真实业务中的一线实践,分析国产AI加速器在业务实践中暴露的共性问题。围绕这些问题,我们通过《国产AI芯片软件生态白皮书》建立统一生态坐标系,并开展AI加速器横评工作,以脚本、日志、环境版本、问题台账和支持闭环形成可复现证据链。报告还将介绍开源submission机制及在MT等更异构平台上的扩展实践,并且呼吁芯片厂商、超算中心、框架开发者和行业用户共同参与,推动国产GPU生态从“能跑起来”走向“敢选用”。
返回首页



