返回首页

DeepSeek慢思考技术探讨|SPP第122期

阅读量:0 2025-04-27 收藏本文

最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注,慢思考模型通过生成长程的思考过程来解决更具挑战性的问题,在多个应用科学问答场景都取得了较大突破。本次SPP报告将聚焦大模型慢思考的基础技术与实现方法,对于其中可能涉及到的技术路径进行探索和系统性讲解,简要探讨推理模型的科学价值,并且总结现阶段推理模型的局限。欢迎关注本期SPP35日(本周三)19:3021:00

本期直播你将收获哪些

1、推理模型简介;

2DeepSeek-R1实现;

3Kimi-K1.5实现;

4、推理模型的科学价值;

5、现阶段推理模型的局限。

演讲嘉宾


赵鑫

CCF杰出会员,中国人民大学高瓴人工智能学院教授

赵鑫,20147月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用2.7万余次,曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models(预印版文章)以及《大语言模型》中文书。

开课时间

202535日(本周三)19:30-21:00