CNCC论坛分享 | 多所高校企业齐聚沈阳,探讨解决大模型数学挑战
10月28日,CNCC2023大语言模型在数学领域的前瞻问题与挑战:理论、方法与应用技术分论坛在沈阳举办。
10月28日下午,由CCF主办、国家新一代人工智能智慧教育开放平台承办的“大语言模型在数学领域的前瞻问题与挑战:理论、方法与应用”技术分论坛在沈阳新世界博览馆举行。
大语言模型实例ChatGPT的横空出世在全世界掀起了大模型浪潮。然而大模型在以数学推理为代表的复杂推理上表现欠佳,难以落地应用。围绕这一难题,来自上海交通大学、浙江大学、西安交通大学、北京师范大学、北京航天航空大学、暨南大学以及科技企业代表展开探讨。本次论坛由论坛主席、暨南大学教授刘子韬主持。
会议伊始,本次论坛共同主席、上海交通大学人工智能研究院副院长王延峰教授对大模型的前世今生进行了介绍。他表示,数学一直被视为人工智能的试金石。当大语言模型成功应对数学方面的挑战时,世界人工智能将进入新的纪元。
随后,西安交通大学刘均教授带来了题为“面向教学的大规模多模态预训练模型”报告分享。刘均教授表示,以ChatGPT为代表的大模型大大提升了通用智能与内容生成能力,有望成为教育数字化的人工智能基础设施。然而,现在大模型应用于教学场景还面临一系列挑战:一是生成内容存在幻觉、意识形态、价值观等问题;二是跨媒体教学内容理解能力弱,特别是对于包含示意图的教学资源;三是缺少分而治之的规划与推理能力;四是很难生成符合用户需求、认知水平等的个性化内容。对此,需要构建面向教育的大规模多模态预训练项模型,突破 “临门一脚”关键技术,推动关键环节自主可控。
浙江大学吴飞教授围绕着“大模型基座赋能:由通到专的实践和思考”主题,进行分享。报告中,吴飞教授介绍了大模型训练过程中预训练、有监督微调和人在回路反馈等代表性算法,刻画“预训练模型+提示学习+预测”机器学习范式中数据和模型为大、语言点金的特点。同时介绍以高质量教材级语料打造的面向101计划核心课程《人工智能引论》教学的垂直领域大模型智海三乐以及通过逻辑丰富语料打造的面向智能司法的垂直领域大模型智海-录问。
作为科技企业代表,好未来集团CTO田密以“大模型让大规模个性化学习真正成为可能”为题,从企业实践、落地应用以及开源开放角度带来了好未来在大模型领域的探索。田密表示,LLM的本质是一种更高效的、从数据中学习知识并加以应用的方式。在AI能力的加持下,“学生自学+AI答疑”的新型学习方式将成为广泛的可能。令人遗憾的是,虽然全球已经有很多优秀的LLM,如GPT-4,但是都无法直接用于个性化学习,尤其是数学学习。针对这一难题,学而思推出国内首个数学领域千亿级大模型——MathGPT,创造性将大模型和计算引擎两者能力进行结合,有效解决LLM在数学领域的三大挑战——解对题、讲清步骤、内容有趣生动。同时,好未来还基于MathGPT研发了针对用户产品AI Tutor。它是能够实现24小时全天候陪伴、1对1量身定制学习计划、伴随孩子终身成长的AI私人导师。目前提供数学、语文、英语三门学科中小学知识智能辅导服务。
华东师范大学周爱民教授则为现场观众展示了教育大模型设计的另一种可能——“融合教育心理学的对话大模型:EduChat”,将教育学、心理学融入大模型设计。他表示,大模型在通用任务展现出了较好的处理能力,然而在教育垂直领域仍然面临很多问题,如幻觉和知识更新滞后、缺乏启发式引导、缺乏深度情感交互、缺乏个性化等,这些问题严重影响了大模型的落地应用。针对这些问题,团队近期在教育学和心理学等理论指导下,研发了面向教育垂直领域的对话大模型EduChat,旨在助力实现因材施教、公平公正、富有温度的智能教育。据介绍,EduChat具有开放问答、作文批改、启发式教学、情感支持、自动出题等功能。
值得一提的是,为了更好地推动大模型在数学领域的探索研究,好未来旗下学而思近期还联合谷歌、暨南大学发起全球大模型数学解题竞赛。据好未来CTO田密透露,好未来正在从0到1训练一个以数学语料为核心,配合通用语料、代码数据、科学文献数据等小百亿规格的模型,计划进行开源。他表示,作为智慧教育国家新一代人工智能开放创新平台承建单位,好未来一直积极参与推动我国人工智能技术发展与进步。随着大模型时代的到来,好未来希望利用自身在数学和AI上的多年积累,做好大模型时代的数学基础工作。