返回首页

活动介绍

AI大模型技术与发展趋势

CCF C³活动是由中国计算机学会CCF CTO Club发起的,旨在联结 企业CTO及高级技术人才和资深学者,每次以一个技术话题为核心,走进一家技术领先企业。 

KV图

vivo是一家以智能终端和智慧服务为核心的科技公司,在过去三年 一直蝉联中国市场智能手机份额第一,全球智能手机市场的Top5。 2023年vivo推出了自研AI “蓝心大模型BlueLM”,目前已取得了C Eval、CMMLU、SuperCLUE全球中文榜单前列。

 会点。 vivo重视多维度进行产学研合作探讨,在AI大模型方向,希望与学 术界就提升大模型的逻辑推理能力、多模态大模型的研究与应用、大模 型的轻量化、大模型在端侧设备落地等方面开展合作研讨,寻找合作机会点。

“V CAN 前沿技术论坛”是vivo跟踪行业最新技术进展的系列活 动,专注于跟踪和分享行业最新技术研究及应用,聚焦公司核心赛道及 技术底座,如AI、芯片、材料、CV/CG、人因、通信。

微信图片_20241227171508


讲者介绍

讲者

邓志红

邓志鸿  北京大学 教授 

北京大学智能学院教授,博士生导师,中国人工智能学会理事,中国人工智能 学会教育工作委员会副主任,专注深度学习、大模型、多模态以及自然语言理解方 面的研究。主持包括国家重点研发计划课题、国家863项目、国家自然科学基金重 大项目在内的项目二十余项。在AAAI、IJCAI、ICLR、ICML、 NeurIPS、CVPR、 ACL等人工智能顶级国际会议担任程序委员会委员、高级委员。论文“A New 力”榜单。

【报告主题】 基于张量分解的参数高效微调技术 

【报告简介】 Algorithm for Fast Mining Frequent Itemsets Using N-Lists”获得《SCIENCE CHINA Information Sciences》五年持续影响力论文奖和十年经典论文奖。获得 北京市高等教育教学成果一等奖(2017年,2022年)两项,二等奖(2017年)一 项。2020-2024连续入选全球前2%顶尖科学家“生涯影响力”榜单和“年度影响 参数高效微调技术作为预训练大模型应用于各类下游任务的新学习范式,因其 在训练效率、储存效率、通讯效率上都显著优于传统的全微调方法,而具有广泛的 应用前景,引起了学术界和业界越来越多的关注。本次报告将介绍我们在参数高效 微调方面的研究工作。我们提出的FacT算法采用张量分解的方案对任务相关的增量 权重进行低秩分解,从而达到减少参数量的目的。在多个数据集上的实验结果表明, FacT在学习更少参数的情况下,在下游任务上的性能还能超过包括LoRA在内的其 它算法,显现出很高的参数高效性。


微信图片_20241227172604

宁雪妃 清华大学电子工程系 助理研究员 

清华大学助理研究员。2016年和2021年于清华大学电子工程系获得工学学士 和工学博士学位。师从杨华中教授和汪玉教授,从事高效深度学习算法研究,包括 模型剪枝和量化方法、模型架构设计方法、自动化压缩算法和生成模型的高效采样 算法等。在机器学习、计算机视觉领域的顶级国际期刊和会议上发表论文30余篇, 累积谷歌学术引用1800余次。她与导师汪玉教授合著出版了《高效深度学习-模型 压缩与设计》书籍。带领小组网站为:https://nics-effalg.com/。 

【报告主题】 生成模型压缩和加速技术 

【报告简介】本次报告将介绍团队在提升生成式模型推理效率方面的工作。报告聚焦于语言 和视觉生成任务,提出了一系列在算法层面和模型层面优化推理效率的技术。在算 法层面,团队开发了更高效的采样策略以缓解不同生成算法固有的低效问题。例如, 团队为自回归模型设计了并行采样方法,并为扩散模型提出了少步采样策略。在模 型层面,团队开发了多种压缩技术,包括量化、权重剪枝、注意力稀疏化和激活共享等。

微信图片_20241227172827

李伯勋 无问芯穹科技有限公司 算法总监 

清华大学电子工程系本硕,十年深度学习算法经验,曾任职于百度深度学习研 究院、360、旷视科技等公司。在旷视期间任算法总监,主导开发了旷视安防及自 动驾驶感知系统。目前在无问芯穹负责算法相关业务,完成多个行业算法功能与产 品交付,研发了端侧全模态理解开源模型Megrez-3B-Omni,在图片、文本、音频 三个方面均取得最优效果。 

【报告主题】 无问芯穹端侧全模态大模型Megrez-3B-Omni及应用实践 

【报告简介】 验。 随着端侧大模型应用的迅猛发展,诸如Meta的LLaMA 3.2和Microsoft Phi系 列等模型因其在边缘设备上的低延迟、数据本地化处理和个性化用户体验潜力等优 势而备受关注。与此同时,大模型也正逐渐从单一文本处理能力扩展至包含图像、 语音和文本的多模态能力。在此背景下,多模态技术的发展与端侧设备丰富的交互 需求和场景相结合,催生了越来越多的应用,这些应用能够自主感知环境、规划决 策、调用工具,甚至执行复杂的任务。这标志着终端智能领域,如AIPC和AI手机等, 正在经历一场革命。本次报告将介绍无问芯穹自主研发的全模态端侧大模型 Megrez-3B-Omni。该模型具备处理图片、音频和文本三种模态的能力,并在三个 模态的基准测试中均取得了最优性能。得益于软硬件协同技术的优势,其推理速度 领先于同精度模型2-3倍。此外,报告还将分享无问芯穹在模型应用方面的实践经验。


微信图片_20241227172857

宫辰 上海交通大学 教授 

任上海交通大学电子信息与电气工程学院教授、博导;获中组部万人青拔。于 2010年获得华东理工大学学士学位,并分别于2016、2017年获上海交通大学和悉 尼科技大学双博士学位。 已在世界顶级期刊或会议上发表100余篇学术论文,主要 包括IEEE T-PAMI、 IEEE T-NNLS、 IEEE T-IP、 IEEE T-CYB、 ICML、NeurIPS、 CVPR、 AAAI、 IJCAI、 ICDM等,另有7项发明专利获得授权。目前担任国际期刊IEEE T-CSVT、NN、NePL、FR、CJE编委,AIJ、JMLR、IEEE T-PAMI、IJCV、 IEEE T-NNLS、IEEE T-IP、IEEE T-KDE等30余家国际权威期刊审稿人,以及ICML、 NeurIPS、ICLR、CVPR、ICCV、ECCV、AAAI、IJCAI、ICDM等多个国际会议的 (S)PC member。曾获吴文俊人工智能优秀青年奖、中国科协“青年人才托举工 程”、中国人工智能学会“优秀博士学位论文”奖、上海市自然科学二等奖、上海 交通大学“优秀博士学位论文”奖、“香江学者”等,并入选百度发布的全球华人 AI青年学者榜单、斯坦福大学发布的全球前2%顶尖科学家榜单。 

【报告主题】面向复杂任务的大模型推理能力增强 

【报告简介】在面对复杂任务时,推理幻觉是大模型经常遇到的重要问题。这一问题的根源 在于大模型的推理能力不强、所需知识不足、生成机理不明。为应对这些挑战,本 报告从多个维度出发,分别从逻辑能力增强、外部知识引入、大模型工作机制探究 入手进行探究,并介绍课题组在快思考和慢思考相结合、直接推理和间接推理相结 合、知识图谱和大模型相融合等方面的工作。另外,为实现大模型在资源受限场景 下的部署,本报告拟进一步介绍基于知识蒸馏的大模型压缩技术和成果。