大模型赋能智慧司法:机遇与挑战 | YEF2024
扫描报名二维码:
(扫码报名)
随着案件量不断增加,案多人少矛盾愈加凸显,以人工智能技术赋能智慧司法,实现人工智能与司法实践深度融合,是破解法院现实难题和发展瓶颈的有效途径,是促进审判体系和审判能力现代化的重要支撑。新一轮科技革命正在引发超越历史、创造未来的颠覆性变革,司法人工智能技术呈现向智能化、泛在化方向发展。
司法任务中通常需要数据驱动中归纳和知识指导中演绎相互结合,建立以人为中心的可解释司法模型,现有数据驱动机器学习方法难以结合知识引导和人机交互机制。同时,当前人工智能赋能司法审判面临算法“碎片化”效应导致的用户体验不佳、功能重复建设、系统智能化程度不高等问题。
本论坛将从学术和产业角度深入探讨大模型时代智慧司法建设的功能价值和面临的挑战,如何利用生成式人工智能等技术,创新司法人工智能理论与算法,赋能司法业务,拓展司法应用新场景,促进“智慧司法”建设,推动司法变革。
论坛安排
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 面向司法领域的人工智能基础模型构建及其实务应用 | 刘奕群 | 清华大学 |
2 | 垂域语言模型应用浅析——以中文法律垂域模型ChatLaw为例 | 袁粒 | 北京大学 |
3 | 大模型赋能司法的可能与挑战 | 魏斌 | 浙江大学 |
4 | 法律大模型的构建、评测和应用探索 | 孙常龙 | 阿里巴巴 |
5 | 讯飞星火法律大模型的挑战与应用实践 | 李宝善 | 科大讯飞 |
Panel环节 | 刘奕群 | 清华大学 | |
袁粒 | 北京大学 | ||
魏斌 | 浙江大学 | ||
孙常龙 | 阿里巴巴 | ||
李宝善 | 科大讯飞 |
执行主席
况琨
CCF YOCSEF杭州候任副主席
浙江大学副教授、人工智能系副主任
主要研究方向为因果推理、可信机器学习和智慧司法。在Cell Patterns, TPAMI, TKDE, Engineering, ICML, NeurIPS, KDD, ICDE, WWW, SIGIR, ACM Multimedia等相关领域顶级期刊及会议上发表论文100余篇。作为项目/课题负责人承担国家重点研发专项、国家自然科学基金等项目,曾获ACM SIGAI中国新星奖,中国科协青年人才托举工程项目,教育部科技进步一等奖,中国电子学会科技进步一等奖。
共同执行主席
董建锋
CCF YOCSEF杭州候任主席
浙江工商大学计算机学院研究员
浙江省可视媒体大数据工程实验室副主任;兼任中国图学学会可视化与认知计算专委会秘书长。入选第八届中国科协“青年人才托举工程”、浙江省青年拔尖人才。主要研究方向为多媒体理解,计算机视觉。近年来共发表学术论文40余篇,其中以第一或通讯作者发表CCF-A类论文20余篇 ;主持国家级/省部级等科研项目10余项。
论坛讲者
刘奕群
CCF杰出会员
清华大学科研院院长、互联网司法研究院院长、计算机系教授
获得国家级人才项目支持,第十七届中国青年科技奖、牵头获得2015、2022 年北京市科学技术一等奖、钱伟长中文信息处理科学技术一等奖等。主要学术兼职包括:中国人工智能学会副秘书长、中国中文信息处理学会信息检索专委会主任;国际计算机学会信息技术专委会亚太分会主席等。国际计算机学会杰出会员,国际计算机学会信息检索专委会荣誉学院(ACM SIGIR Academy)成员。
报告题目:面向司法领域的人工智能基础模型构建及其实务应用
摘要:
近年来,随着社会和司法信息化的快速发展,司法工作者面临着案件量激增和信息过载的双重挑战。传统信息处理技术已无法满足当前法律工作者的信息需求。我们迫切需要更加高效、灵活、且易用的智能信息处理技术来改善法律从业者的工作环境,为人民提供更高质量的司法服务。预训练模型技术的进展为司法智能化带来了新的可能。我们发现通用大模型在专业、严肃的司法场景的性能难以满足专业人士的工作需求。清华大学互联网司法研究院基于清华基础模型研究中心的多个底座,按照通专结合的模型研发路径,研发出清华法律大模型LegalAID,在同参数量模型中法律专业能力领先。基于LegalAID模型研发出要素式类案检索、文书一键生成、文书辅助阅核等应用场景,服务了全国多地人民法院。
袁粒
北大深圳研究生院助理教授
北京大学博士生导师、国家级青年人才入选者,获得国家优秀留学生奖(归国类)、2023年福布斯亚洲30U30名单、斯坦福Top2%科学家榜单等,主持国家科技重大专项课题和国自然青年基金等。研究方向为多模态深度学习和AI4S。代表性学术工作包括VOLO, T2T-ViT等深度神经网络框架和知识蒸馏相关工作,一作论文单篇被引用千余次,代表性应用工作包括ChatExcel,ChatLaw等垂直领域语言模型。
报告题目:垂域语言模型应用浅析——以中文法律垂域模型ChatLaw为例
摘要:
大语言模型在垂直领域的应用是其落地的关键,当前繁荣的大语言模型生态中衍生出各种垂类大模型,包括法律、医疗、教育等行业。本次报告将讨论当前较为流行的垂类大语言模型,同时探讨在垂类大模型开发中的一些问题,包括:基座底模的选择、垂类数据收集、领域知识调优、垂类应用的痛点等一系列问题。
魏斌
浙江大学光华法学院研究员
CCF计算法学分会委员,浙江省哲学社会科学试点实验室、浙江大学数字法治实验室执行主任,中国法律逻辑专业委员会副会长、中国人工智能学会人工智能逻辑专委会委员兼副秘书长,在FITEE、ICAIL、JURIX、《现代法学》《法商研究》等国内外期刊和会议发表论文四十余篇,出版多部专著和编著,主持国家重点研发计划重点专项课题、国家社科基金等国家和省部级项目十余项。研究方向包括数字法学、法律人工智能、法律逻辑学等。参与“智海-录问”法律大模型的研发和行业首个法律大模型评估指标和测评方法的起草。
报告题目:大模型赋能司法的可能与挑战
摘要:
大模型因其超级学习和“涌现”能力,在司法领域展现出卓越的性能,推动了法律科技领域的新一轮革命。大模型在法律语言理解、法律知识问答、法律预测和法律文本生成等任务上有突出表现。然而,随着其在审判等领域的应用,也暴露出了可解释性弱和因“幻觉”导致的生成内容虚假等问题。大模型仍难以处理法律人的核心工作,包括法律推理、法律论证、司法证明、法律解释和疑难案件判断等。大模型在价值判断、逻辑推理、决策机制和经验学习等方面都与法律人存在本质差异。
孙常龙
阿里巴巴技术总监、通义实验室NLP应用算法负责人
发表论文30余篇,承担多项国家科技部重点研发项目,带领团队在国内外评测比赛中多次获得第一名,曾获高等学校科学研究科技进步一等奖。研究方向包括自然语言理解、知识图谱、文档理解等。在技术赋能业务方面,深入司法、通信等垂直领域,首创了司法全流程智能化辅助审判,构建了行业领先的法律大模型,并在多家法院落地应用。
报告题目:法律大模型的构建、评测和应用探索
摘要:
随着AIGC的快速发展,人类面临新技术革命浪潮的历史性机遇。法律作为一个知识密集型行业,虽然很好的能适配目前大模型技术,但是由于其严谨的审判和说理,对大模型目前存在的幻觉和知识更新慢等问题,容忍度较低。因此需要结合行业多种知识类型构建法律大模型体系。在大模型的二次训练,由于涉及到多种异构的数据源,即需要对数据的分析、处理,以便更好的被大模型所使用,又需要在训练阶段,分层次、分节奏的精细化的训练。此外在微调中需要针对下游任务做适配。其次为进一步解决目前复杂的业务问题,引入可解释性的知识,构建法律体系的RAG、Agent的建设尤为重要。最后,为更好的全面评估法律大模型和业务场景的深度结合效果,进一步构建法律大模型的评测方法和评估标准。
李宝善
科大讯飞AI研究院司法认知方向研发总监
讯飞星火法律大模型总工程师
长期从事自然语言处理算法研发与落地,具有司法、教育、金融等多个行业的落地经验。主持和参与了多项人工智能方面的国家重点课题研究,申报发明专利30余项。
报告题目:讯飞星火法律大模型的挑战与应用实践
摘要:
法律大模型的研发面临着一系列的挑战,包括数据质量与多样性,法律领域任务的严谨性,模型决策的可解释性等。针对这些挑战,介绍讯飞在研发法律大模型过程中所采取的应对措施,取得的阶段性进展以及在具体场景中的应用实践;本报告旨在为法律从业者、法律科技研究者和决策者提供全面的了解,帮助他们更好地把握法律大模型在未来的发展方向和应用前景。