LLM赋能代码质量
CCF TF技术前线第141期以“LLM赋能代码质量”为主题,特邀荣国平特任研究员、蒋思源算法专家和窦士涵博士等嘉宾,共同深入探讨。本期会议将聚焦大语言模型生成代码的错误调研,分享aiXcoder代码大模型的实际落地经验,以及基于LLM的代码检视的机遇与挑战等内容。我们期待通过这些前沿的分享,为提升代码质量提供宝贵经验和独到见解,助力软件开发向智能化转型。欢迎报名,与行业大咖共话代码质量提升之道。 为工程师提供顶级交流平台 CCF TF第141期 欢迎扫码了解详情和报名参会 报名链接:https://conf.ccf.org.cn/TF141 在当今数字化时代,软件代码的质量至关重要。随着人工智能技术的飞速发展,大语言模型(LLM)为代码质量的提升提供了新可能,同时也带来了前所未有的机遇与挑战。CCF TF技术前线第141期特别策划了以“LLM赋能代码质量”为主题技术研讨,汇聚了众多的学术专家和行业人士进行深入探讨,我们期望通过这次思想的碰撞,为业界同仁提供丰富的经验分享和前瞻性的洞见。 代码质量是软件开发过程中的核心要素之一。高质量的代码不仅能够提高软件的稳定性和可靠性,还能增强其可维护性和可扩展性。然而,在传统的软件开发中,确保代码质量往往需要耗费大量的人力和时间成本,且效果往往难以完全保证。大型语言模型(LLM)的出现,为提升代码质量提供了新的视角和策略。 南京大学软件学院特任研究员荣国平博士,,将聚焦基于LLM的代码检视。代码检视是确保软件开发质量的关键环节,但完全依赖人工的代码检视存在诸多挑战。LLM的引入为该领域带来了新机遇,尽管其效果仍有待提升。荣国平博士将基于他们在代码检视方面的长期积累和探索,系统地总结实践经验,并展望该领域所面临的机遇和挑战。 蒋思源作为aiXcoder代码大模型算法专家,将带来aiXcoder在代码大模型以及Agent for code领域的最新进展。他将深入分享aiXcoder在企业实际应用中积累的宝贵经验和深刻见解,特别是如何通过创新的代码大模型和智能Agent技术提升软件开发效率和质量。通过具体案例分析,展示这些前沿技术在企业环境中的实际应用效果。这些案例不仅为与会者提供实际可行的启示,也为企业的技术升级与创新提供助力。 窦士涵作为复旦大学的博士生,在软件工程和人工智能交叉领域拥有丰富经验。他的研究重点在大语言模型的人类价值观与能力对齐上,专注于利用强化学习等方法提高模型的数学推理和代码生成能力。在本次会议中,他将分享关于大语言模型生成的代码中可能包含的错误的调研成果。通过构建错误多级分类表和标注方案,分析错误分布,他提出了14个富有洞察力的发现。这不仅为我们了解大模型在生成代码时的问题提供了新视角,也为如何针对性地提升模型的代码生成能力提供了切实可行的建议。 总之,本次CCF TF141会议将聚焦“LLM赋能代码质量”这一主题,全面而深入探讨大型语言模型(LLM)在代码生成、质量提升和代码检视等多维度的应用。通过各位专家的分享,期望更好地利用LLM的强大能力,提高代码质量,推动软件开发向更加智能化的方向发展。让我们共同期待这场知识的盛宴能为业界带来宝贵的经验和深刻的启发,助力软件开发带来新的突破和进步。 二、会议安排 TF141:LLM赋能代码质量 2024年8月8日(星期四) 主持人:朱少民,CCF TF质量工程 SIG主席, 时间 主题 讲者 19:00-19:10 活动介绍及致辞 主持人:朱少民 CCF TF质量工程SIG主席,同济大学特聘教授 19:10-19:40 基于LLM的代码检视:机遇和挑战 荣国平 南京大学软件学院 特任研究员 19:40-20:10 提升代码生成质量:aiXcoder 代码大模型落地经验 蒋思源 aiXcoder代码大模型算法专家 20:10-20:40 调研:大语言模型生成的代码会包含哪些错误? 窦士涵 复旦大学博士生 20:40-20:55 参会者提问互动 20:55-21:00 活动总结 朱少民 CCF TF质量工程SIG主席,同济大学特聘教授 三、所属SIG CCF TF质量工程 SIG 四、特邀讲者 荣国平 南京大学软件学院 特任研究员 主题:《基于LLM的代码检视:机遇和挑战》 主题简介:代码检视(code review)是软件开发过程中的一个经典质量实践,更是以Pull/Merge-Request为代表的分布式现代软件开发中不可或缺的环境。另一方面,完全依赖人工的代码检视存在效率、效果以及成本等多方面的挑战。此前已经有一些工作提出使用AI技术,尤其是深度学习技术将代码检视自动化,但是效果并不理想。大语言模型的出现为该领域带来新的机遇,因而吸引了很多研究者和实践者的关注,包括OpenAI公司自己。得益于大语言模型强大的理解和推理能力,基于大语言模型的代码检视的效果确实获得长足发展,但另一方面,目前在代码见识领域依然存在很多挑战。本讲座将基于我们在代码检视长期积累以及使用大语言模型来做代码检视方面的探索,梳理一些实践经验,并展望在该领域的机遇以及挑战。 个人简介:荣国平,博士,南京大学软件学院特任研究员,博士生导师。南京大学-星环科技“星云”数据技术联合研究中心主任,主要研究领域为智能软件工程、DevOps 、AIOps和数据技术等,主持或参与多项国家级、省部级项目。在TSE、TOSEM、TDSC、IST、SPE、JSS、软件学报等一流期刊以及ICSE,FSE,ASE,ISSTA,ESEM,ISSRE,ICSME 等一流国际会议上发表各类论文70余篇。作为核心成员规划了开发运维一体化成熟度模型国家标准的整体架构,出版了第一本中文DevOps教材《原理、方法与实践》。 蒋思源 aiXcoder代码大模型算法专家 主题:《提升代码生成质量:aiXcoder 代码大模型落地经验》 主题简介:本次报告将聚焦基于大模型的软件开发技术与范型,系统汇报aiXcoder在代码大模型以及Agent for code领域的最新进展。我们将详细分享aiXcoder在代码大模型的企业落地实践中积累的一些宝贵经验和深刻思考,旨在为与会者提供前沿的技术见解和实践指导。报告背景设定在当前智能化软件开发需求日益增长的大环境下,首先简要回顾大模型技术在软件开发中的应用现状与趋势。接下来,我们将重点介绍aiXcoder团队如何通过创新的代码大模型和智能Agent技术,提升软件开发效率和质量。具体案例分析将展示这些技术在实际企业环境中的应用效果,帮助听众更好地理解其潜在价值和实际操作方法。主要内容:1.智能化软件研发发展趋势;2.代码大模型构建及效果评测;3.智能化开发工具代码生成质量及用户体验提升;4.基于agent的代码生成质量提升;5.企业真实软件开发场景中的代码生成质量提升;6.未来软件开发发展。通过此次分享,我们希望与会者不仅能够了解aiXcoder在智能化开发领域的前沿进展,更能够获得实际可行的启示,助力自身企业的技术升级与创新。 个人简介:作为 aiXcoder代码大模型算法专家,负责aiXcoder大模型开发的全流程,包括数据采集与清洗、大模型构建与训练、模型推理优化及服务、模型评估等。关注如何通过大规模分布式训练获得更符合软件工程实际开发场景的基础代码大模型;关注构建能符合软件开发流程、工具、行为的人类对齐训练方法;关注如何在私有代码上做领域化增量训练,并尽可能降低灾难遗忘等问题。 窦士涵 复旦大学博士生 主题简介:当前,很多研究者们探索用各种自然语言处理中的方法来增强大语言模型的代码生成能力,然而学术界和工业界缺少一篇对模型生成的代码的错误进行全面分析的文章,即大语言模型在生成代码时会引入哪些错误(Bug),这些bug的分布是怎样的。人类在写代码时难免会产生错误。人类会根据报错信息进行进一步分析和归因,并尝试解决bug。同样地,我们也需要知道大模型在生成代码时会出现什么错误。 分析大模型产生的错误会为我们后续如何进一步增强大语言模型的代码生成能力,减少错误的发生提供针对性的指导。例如,我们可以解决或避免大模型产生的一大类bug来提高生成的代码的质量。 主题:《调研:大语言模型生成的代码会包含哪些错误?》 在这篇文章中,我们构建了一个大语言模型的错误多级分类表,分析了错误分布,提供了14个有指导性的findings。同时,我们设计了一个标注方案,构建了一个真实场景的数据集,分析了真实场景和现有数据集上大模型生成的代码的错误分布差异。最后,我们抛砖引玉,提出了一个简单的可迭代方法让大模型像人类一样,对自己生成的代码进行分析和修复。 个人简介:窦士涵,复旦大学博士生,《What’s Wrong with Your Code Generated by Large Language Models? An Extensive Study》第一作者,研究方向为大语言模型的人类价值观与能力对齐,包括利用强化学习等方法提高模型的数学推理和代码生成能力。窦士涵在软件工程和人工智能交叉领域拥有丰富的经验,在人工智能顶级会议如ACL、EMNLP等,软件工程顶级会议如ICSE,FSE,ASE等发表数十篇文章。他的工作致力于增强大语言模型的各项代码能力,助力未来将软件开发过程与人工智能相关技术有力结合。 五、SIG主席 朱少民 CCF TF质量工程SIG主席,同济大学特聘教授 个人简介:近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和4本译作,代表作主要有《软件质量保证与管理》、《软件测试方法和技术》、《全程软件测试》等,并经常在国内外学术会议或技术大会上发表演讲,曾任思科(中国)软件有限公司QA高级总监、IEEE ICST 2019工业论坛主席、IEEE ICST、QRS和DSA、NASAC程序委员、《软件学报》审稿人等。 六、参会说明 1、如报名后无法参加,请及时于活动开始前发送邮件申请取消(联系邮箱:tf@ccf.org.cn),无故缺席将影响下一期活动的参与。 2、活动采用线上模式:腾讯会议;同时也将在CCF视频号“中国计算机学会”同步直播。 (注:腾讯线上会议人数有限,若未能进入腾讯会议,可通过直播参与。) 3、会议链接和密码将在活动当天通过邮件、短信通知。可点击腾讯会议链接,输入密码参加。 4、请于活动前一天15:00前完成报名,及时获取会议链接。 5、CCF会员免费参加,非会员99元/次(CCF会员以及缴费观众可登录CCF数字图书馆,免费回顾本期活动经授权的报告内容),加入会员可免费参与全年线上活动。 七、会员权益 会员免费参加CCF TF全年20场线上活动,优惠价参加14场线下活动,为自己的技术成长做一次好投资,用高性价比获取专业知识的绝佳路径! 长按识别或扫码入会 八、参会方式 2024年8月8日 (星期四) 长按识别或扫码报名 报名链接:https://conf.ccf.org.cn/TF141 联系方式 邮箱:tf@ccf.org.cn 电话:0512-6590 0856转分机号36
所有评论仅代表网友意见