TF141回顾 Copy1

阅读量:19
TF




2024年8月8日,CCF TF迎来了第141期活动,主题为“大模型赋能代码质量”。本次活动由CCF TF质量工程 SIG策划呈现,邀请到了南京大学软件学院 特任研究员荣国平、aiXcoder代码大模型算法专家蒋思源、复旦大学博士窦士涵三位讲者。分享的内容精彩纷呈、讨论热烈、听众反馈积极。活动以线上直播的形式进行,通过腾讯会议平台和CCF视频号“中国计算机学会”同步直播,吸引了众多专业人士的参与。本文将回顾本次活动的精彩内容和深刻见解。


CCF TF

CCF TF活动相关专家报告均收录在CCF数字图书馆【TF专辑】,欢迎长按识别,回看精彩分享。本期活动报告也将于近日收录,欢迎回顾!



代码质量是软件开发的核心,它关系到软件的稳定性、可靠性、可维护性和可扩展性。传统开发中,确保代码质量需要投入巨大的人力和时间,且效果难以完全保证。AI(尤其是LLM)的崛起,为提高代码质量开辟了新路径,同时也带来了新的机遇与挑战。


活动由CCF TF质量工程SIG主席朱少民主持,他首先介绍了CCF TF的宗旨和活动安排,随后引导与会者进入主题讨论。通过这次活动,与会者对大模型在软件工程领域的应用有了更全面的认识,并对如何利用这些技术提高代码质量有了深入的理解。


《基于LLM的代码检视:机遇和挑战》


来自南京大学软件学院特任研究员荣国平以“基于大模型的代码检视:机遇和挑战”为题,分享了他对大模型在代码检视(Code Review)中应用的见解。他首先指出,代码检视是软件工程中的一项传统实践,目的是通过人工阅读代码来发现潜在问题。随后讨论了大模型如何作为更强大的评审者参与到代码检视中,它们不受疲劳影响,拥有更丰富的知识背景,能够快速检索信息。他还提到了大模型在代码检视中的潜在应用,包括与其它任务的联动可能性以及对整个研发过程的影响。他强调,尽管大模型在代码检视中展现出巨大潜力,但仍存在技术限制,如输出质量的不确定性,需要进一步探索和改进。



《提升代码生成质量:aiXcoder 代码大模型落地经验》


aiXcoder代码大模型算法专家蒋思源的分享专注于“代码生成过程中的质量提升”。他首先介绍了其团队在结合深度学习与软件工程领域工具方面的工作,而后详细阐述了他们在代码生成质量提升上的实践经验。他讲解了预训练数据处理的重要性,包括数据筛选、语法分析和静态分析等步骤,以确保训练数据的高质量。他还提到了工程工具的使用,如语法分析和类型推断,以及如何通过迭代过程优化代码生成质量。最后,他强调了在代码生成中结合大模型和软件工程工具的重要性,以及通过领域化训练来适应特定行业需求的策略。



蒋思源的分享提供了一个全面的视角,展示了如何通过一系列技术手段和工具来提升大模型在代码生成任务上的性能,同时也指出了在实际应用中需要考虑的领域特定性和工程化挑战。


《多视角下的大模型代码生成能力提高》


首先,复旦大学博士窦士涵从算法层面探讨了如何提升大模型的代码生成能力,并着重讨论了强化学习在这一过程中的应用。然后,他分析了大模型生成代码的常见错误类型,并提出了基于自我批评的方法来迭代地修复bug。他还讨论了如何通过细致的bug分类来更准确地定位和解决问题,并提出了一系列可能的改进方向,包括优化算法选择、提高问题理解能力、解决运行时错误等。他的分享为听众提供了一个全面了解大模型在代码生成任务中所面临挑战和改进策略的视角。


窦士涵展示了如何系统地分析和提升大模型在代码生成任务中的表现,同时也揭示了当前技术面临的挑战和未来的改进方向。



关于CCF TF

CCF TF技术前线(Tech Frontier)创立于2017年6月,旨在为工程师提供顶级交流平台,更好地服务企业界计算机专业人士,帮助企业界专业技术人士职业发展,通过搭建平台实现常态化合作和发展,促进企业间、学术界与企业间技术交流。目前已组建知识图谱、数据科学、智能制造、架构、安全、智能设备与交互、数字化转型与企业架构、算法与AI、智能前端、工程师文化、研发效能、质量工程等十二个SIG(Special Interest Group),提供丰富的技术前线内容分享。

加入CCF



加入CCF会员享受更多超值活动,为自己的技术成长做一次好投资。

点击链接了解更多会员权益:

CCF个人会员权益  CCF公司会员权益


识别或扫码入会


欢迎关注CCFTF及CCF业务总部公众号,精彩陆续开启!


关注CCFTF获取TF活动资讯

关注CCF业务总部优惠预定会议场地


读完这篇文章后,您心情如何?