强化学习:理论、方法与在大模型的应用|CNCC Tutorial
CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思辨。
今年Tutorial共设置9大主题板块:AI基础模型、机器学习理论与机理、强化学习与推理、视觉与多模态、AI安全与治理、面向AI的数据管理和治理、Agent与具身智能、新型计算与网络架构、AI4Science。
Tutorial名称:
强化学习:理论、方法与在大模型的应用
所属主题:
强化学习与推理
日程安排:
2025年10月22日下午
举办地点:
哈尔滨市·华旗饭店
注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准
模块 | 时长 | 内容 |
1. 强化学习基础 | 60min | 强化学习历史发展,问题定义,主要概念,基础算法 |
2. 深度强化学习 | 40min | 深度Q网络(DQN)、策略梯度、PPO等主流方法 |
3. 大语言模型强化学习 | 40min | RLHF(基于人类反馈的强化学习)与强化学习大模型微调中强化学习技术的发展 |
4. 模仿学习 | 40min | 模仿学习基础知识与奖励函数学习,大模型奖励函数的获取 |
5. 互动问答与讨论 | 30min | 回答听众问题 |
讲者介绍
俞扬
南京大学教授
袁雷
南京大学讲师
李子牛
香港中文大学(深圳)博士生
许天
南京大学博士后
CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。Tutorial作为这一设计的起点,为参会者构建坚实的共同知识基础,能够深度参与后续的前沿报告理解与未来方向思辨。同时面向青年学者、行业新锐等人群,通过系统性教学,助力赋能青年人才发展。
返回首页



