CCF中小学大模型教育提纲
共10个部分,建议每个部分2-4课时
一、人工智能导论
1.1 人工智能简介
1.1.1 人工智能的基本含义
1.1.2 人工智能能完成哪些任务
1.1.3 案例:一天中的人工智能应用
1.2 人工智能通常怎样实现
1.2.1 规则驱动方法
1.2.2 数据驱动方法:机器学习
1.2.3 机器学习的典型任务:回归与分类
1.2.4 机器学习的学习方式:监督学习、无监督学习与自监督学习
1.2.5 神经网络基础
1.2.6 案例:从规则提醒到数据预测
1.3 机器学习的基本过程
1.3.1 数据准备:采集、预处理与标注
1.3.2 特征提取
1.3.3 模型训练
1.3.4 基于批次数据的训练方法
1.3.5 案例:一个植物识别模型是怎样训练的
1.4 模型评测
1.4.1 验证与测试
1.4.2 为什么不能只看一次结果
1.4.3 交叉验证
1.4.4 精确率、召回率(基础指标: 准不准/全不全)
1.4.5 AUC:ROC 曲线下面积(综合指标, 整体区分能力)
1.4.6 案例:植物识别模型的表现怎么看
1.5 人工智能应用
1.5.1 自然语言处理
1.5.2 计算机视觉
1.5.3 语音技术
1.5.4 案例:文字、图像与语音如何协同工作
二、大模型基础概念
2.1 自然语言的基础认知
2.1.1 什么是自然语言
2.1.2 计算机如何理解自然语言
2.1.3 案例:从逐词翻译到理解语境
2.2 语言模型的基本定义
2.2.1 语言模型的工作原理
2.2.2 从小模型到大模型
2.2.3 案例:手机输入法中的语言模型
2.3 大语言模型的发展历程
2.3.1 早期探索阶段(统计语言模型时代)
2.3.2 神经网络时代的突破
2.3.3 预训练模型的兴起
2.3.4 大模型时代的到来
2.3.5 案例:从GPT-1到ChatGPT的能力演变
2.4 大语言模型的现状
2.4.1 国际主流大模型介绍
2.4.2 国内大模型发展概况
2.4.3 大模型的应用领域
2.4.4 大模型技术的未来趋势
2.4.5 如何正确使用大模型
2.4.6 案例:用大模型辅助学习:一个具体的场景
三、模型架构
3.1 主流架构
3.1.1 编码器-解码器架构
3.1.2 因果解码器架构
3.1.3 案例:三种架构的适用场景对比
3.1.4 案例:以Qwen2-7B为例解读因果解码器架构
3.2 注意力机制
3.2.1 基本概念
3.2.2 自注意力机制
3.2.3 交叉注意力机制
3.2.4 注意力权重分配
3.2.5 掩码机制
3.2.6 案例:注意力机制如何理解一道推理题
3.3 Transformer模型
3.3.1 输入编码
3.3.2 多头自注意力机制
3.3.3 前馈网络层
3.3.4 案例:Transformer处理"给我写一首关于春天的诗"的全过程
四、 预训练技术
4.1 预训练总体介绍
4.1.1 预训练的基本思想
4.1.2 预训练的目的
4.1.3 预训练、微调与对齐的区别
4.2 预训练数据准备
4.2.1 数据收集
4.2.2 数据预处理
4.2.3 词元化
4.2.4 数据配比与数据课程
4.2.5 案例:从网页文本到预训练样本
4.3 预训练过程
4.3.1 从数据样本到模型更新
4.3.2 算力资源与训练成本
4.3.3 训练监控、检查点与稳定性
4.3.4 案例:一次大模型预训练任务是如何完成的
五、后训练技术
5.1 后训练概述
5.1.1 为什么需要后训练
5.1.2 后训练的基本流程
5.1.3 案例:预训练模型与微调后模型的对比
5.2 指令微调
5.2.1 指令微调的概念
5.2.2 指令数据集的构建
5.2.3 指令微调的常见方法
5.2.4 案例:针对特定任务的指令模版设计
5.3 人类对齐
5.3.1 人类对齐的概念
5.3.2 对齐标准:有用性、诚实性、无害性
5.3.3 人类对齐的常见方法:强化学习和RLHF
5.3.4 案例:模型安全性评估与偏见过滤
5.4 复杂推理
5.4.1 复杂推理的相关概念:认知推理、长思维链模型
5.4.2 长思维链模型的数据集构建
5.4.3 长思维链模型的训练方式: RLVR
5.4.4 案例:长思维链模型与普通模型的解题过程对比
六、解码与部署
6.1 解码的目的
6.2 常见解码方法
6.2.1 解码方法概览
6.2.2 贪心搜索
6.2.3 束搜索
6.2.4 案例:一句诗的解码
6.3 部署与实践
6.3.1 实践挑战:贪心搜索
6.3.2 实践挑战:束搜索
6.3.3 案例:一款翻译软件的解码切换
七、提示工程
7.1提示工程的重要意义
7.1.1 提示是什么
7.1.2 提示为什么会影响模型输出
7.1.3 提示撰写中的常见问题
7.1.4 案例:从一句简单提示到可用回答
7.2 提示的基础设计原则
7.2.1 明确任务目标
7.2.2 补充背景信息
7.2.3 写清限制条件
7.2.4 规定输出格式
7.2.5 案例:一条完整提示是怎样写成的
7.3 提示的进阶方法
7.3.1 任务拆分与步骤化提示
7.3.2 示例引导
7.3.3 角色设定与受众设定
7.3.4 结构化提示
7.3.5 反问澄清与条件补充
7.3.6 多轮修改与结果优化
7.3.7 案例:失物招领公告的进阶提示设计
八、智能体
8.1 智能体基础与核心概念
8.1.1 智能体的定义
8.1.2 智能体的核心组成要素
8.1.3 智能体与大语言模型的区别
8.1.4 案例:校园阅读节智能助手
8.2 智能体的结构与工作流程
8.2.1 角色配置:Profile 与边界规则
8.2.2 规划模块与目标分解
8.2.3 工具模块与记忆模块
8.2.4 智能体的标准工作流程
8.2.5 案例:任务分解与边界控制
8.3 工具调用与部署
8.3.1 推理阶段的关键控制项
8.3.2 工具调用的基本机制
8.3.3 部署为服务的基本方法
8.3.4 案例:用智能体制作科普漫画
九、多模态模型
9.1 多模态模型基础与核心概念
9.1.1 多模态信息提取与理解
9.1.2 多模态模型的使用场景
9.1.3 多模态技术的发展脉络
9.1.4 案例:多模态信息如何协同工作
9.2 代表性多模态大模型
9.2.1 多模态融合的核心思想
9.2.2 多模态模型的典型结构
9.2.3 CLIP:图文匹配模型
9.2.4 视觉语言大模型
9.2.5 案例:一道图文结合题是怎样被理解的
9.3 多模态模型的典型应用
9.3.1 图文理解:从看图到回答问题
9.3.2 跨模态转换:语音、文字与图像互通
9.3.3 局限、风险与使用边界
9.3.4 案例:从"找对应"到"做解释"
十、大语言模型评测
10.1 大语言模型评测基础
10.1.1 大语言模型评测的重要意义
10.1.2 大语言模型评测范式
10.1.3 大语言模型评测流程
10.1.4 案例:知名评测基准介绍
10.2 核心性能的评测
10.2.1 客观评测(Perplexity、BLEU、ROUGE、pass@k、假设检验)
10.2.2 主观评测(人工评测、LLM-as-a-judge、一致性度量(Cohen's Kappa))
10.2.3 案例:针对翻译任务的BLEU指标计算实例
10.3 伦理安全的评测
10.3.1 模型偏见相关概念
10.3.2 安全性评测与治理
10.3.3 案例:典型模型偏见案例分析及优化前后对比
返回首页



