DeepSeek慢思考技术探讨｜SPP第122期

阅读量:23 2025-04-27 收藏本文

最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注，慢思考模型通过生成长程的思考过程来解决更具挑战性的问题，在多个应用科学问答场景都取得了较大突破。本次SPP报告将聚焦大模型慢思考的基础技术与实现方法，对于其中可能涉及到的技术路径进行探索和系统性讲解，简要探讨推理模型的科学价值，并且总结现阶段推理模型的局限。欢迎关注本期SPP：3月5日（本周三）19:30—21:00。

本期直播你将收获哪些

1、推理模型简介；

2、DeepSeek-R1实现；

3、Kimi-K1.5实现；

4、推理模型的科学价值；

5、现阶段推理模型的局限。

演讲嘉宾

赵鑫

CCF杰出会员，中国人民大学高瓴人工智能学院教授

赵鑫，2014年7月于北京大学获得博士学位，随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理，共计发表论文200余篇，谷歌学术引用2.7万余次，曾主导研发了玉兰系列大语言模型，组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书。

开课时间

2025年3月5日（本周三）19:30-21:00

CCF学生分会

DeepSeek慢思考技术探讨｜SPP第122期