DeepSeek慢思考技术探讨|SPP第122期
最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注,慢思考模型通过生成长程的思考过程来解决更具挑战性的问题,在多个应用科学问答场景都取得了较大突破。本次SPP报告将聚焦大模型慢思考的基础技术与实现方法,对于其中可能涉及到的技术路径进行探索和系统性讲解,简要探讨推理模型的科学价值,并且总结现阶段推理模型的局限。欢迎关注本期SPP:3月5日(本周三)19:30—21:00。
本期直播你将收获哪些
1、推理模型简介;
2、DeepSeek-R1实现;
3、Kimi-K1.5实现;
4、推理模型的科学价值;
5、现阶段推理模型的局限。
演讲嘉宾
赵鑫
CCF杰出会员,中国人民大学高瓴人工智能学院教授
赵鑫,2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用2.7万余次,曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书。
开课时间
2025年3月5日(本周三)19:30-21:00