2023年1月8日下午YOCSEF上海在上海人工智能实验室举办了主题为“ChatGPT:突破、争议与实现”的特别技术论坛。本次论坛邀请了AI各分支领域尤其是自然语言处理领域的40多位知名学者聚焦ChatGPT相关技术,来思辨其取得的突破和存在的争议,并探讨如何共建国内的ChatGPT,缩小国内外大模型的技术差距。感谢上海计算机学会自然语言处理专委会、上海智能教育研究院、上海人工智能实验室对本次活动的大力支持和协助。本次论坛的执行主席是YOCSEF上海AC委员、复旦大学邱锡鹏,荣誉委员、同济大学王昊奋。
论坛包括引导发言、观点分享与讨论、总结三个环节。
在引导发言环节,浦江实验室乔宇教授介绍了目前团队取得的一些进展,并表达了对自然语言处理领域发展的关注,尤其是对近期ChatGPT火爆学术界内外引发的一些思考和争议予以高度的重视,期待本次论坛能产生更多的思维碰撞,带动国内类ChatGPT模型的研发和相关创新性突破。CCF上海分部主席白硕教授介绍了对于ChatGPT的一些观察与思考,展示了ChatGPT在语言解析、场景聚焦、问题求解以及自我解释等方面的能力,并提出了一些值得进一步深入思考和探索的问题,如ChatGPT离通用人工智能有多远?鉴于其目前存在胡说八道的情况,离可信知识库有多远?如何来布局类ChatGPT模型以及其意义如何?复旦大学邱锡鹏教授介绍了从GPT3到ChatGPT的能力演化路线猜想。首先,梳理了从GPT3到ChatGPT的发展历程,然后剖析了其中使用的三个关键技术:情景学习(In-Context Learning)、思维链(Chain-of-Thought)和指令学习(Instruction Learning)。其中,情景学习和思维链有助于从大模型中更好地诱导知识,实现能力的突现和认知范围的扩大。指令学习试图实现自然语言指令和人类指令的对齐,大幅提升了模型的泛化能力,但是和人类的真实任务仍有很大差异。最后,总结了从GPT3到ChatGPT在知识四象限上的一个发展变化过程及每个知识象限背后依赖的技术。
在观点分享环节,与会嘉宾从“ChatGPT的突破与争议”议题开始讨论,针对共同关心的问题进行了充分的交流。比如ChatGPT的“超能力”主要来自于哪些方面?其背后蕴藏着什么样的技术突破?ChatGPT及其所代表的大规模预训练模型技术未来还可以在哪些方面继续取得突破?如何体现创新能力?如果要构建一个ChatGPT Plus有哪些可以值得关注的方向?ChatGPT对学术研究有什么样的影响?尤其是学术界路在何方等问题。
之后进一步讨论了“共建国内的ChatGPT”议题,交流问题包括再现一个ChatGPT最关键的因素是什么?高质量的中文数据集如何构建?指令学习的中文数据集如何构建等问题。
最后,CCF上海分部主席白硕教授对本次论坛进行了总结,指出了国内研发类ChatGPT模型的紧迫性和使命感,并提出了未来可以重点关注的一些研究方向,如ChatGPT自我解释能力的研究,在知识服务、陪伴型服务、垂直服务等方面的聚焦和应用,融合全称命题进行训练可能引发的质变等。