返回首页

联手自然语言处理专委会:“开放域人机对话”术语发布 | CCF术语快线

阅读量:39 2021-11-12 收藏本文

本期新增术语新词:开放域人机对话(Open-Domain Dialogue)。


开篇导语:


本期新增术语新词:开放域人机对话(Open-Domain Dialogue)。开放域人机对话是指人类通过自然语言的形式与机器进行不限定领域的对话过程,以及为使机器实现上述过程的相关研究和应用的统称。


开放域人机对话(Open-Domain Dialogue)

作者:张伟男(哈尔滨工业大学)、朱庆福(哈尔滨工业大学)


InfoBox:

中文名:开放域人机对话

外文名:Open-Domain Dialogue

学科:自然语言处理、人工智能

实质:人类通过自然语言的形式与机器进行不限定领域的对话过程,以及为使机器实现上述过程的相关研究和应用的统称。


基本简介:

开放域人机对话相对于限定领域的任务型或目标型对话而言,其特点主要包括两个方面:一方面,不限定对话话题的范围,更接近“人-人”对话的形态;另一方面,应用场景众多,面向不同应用场景,有不同形态的应用系统,如面向情感陪伴、智能导览、智慧教育、智能家居等场景的实体或虚拟形象的聊天机器人系统。


背景与动机:

开放域人机对话的研究起源于1950年图灵提出的问题:“机器能思考吗?”图灵设计了一种模仿游戏通过人机对话的方式回答该问题,该模仿游戏被后续研究称为图灵测试[1]。图灵测试是验证机器是否具有和人类同等智能的重要途径,通过该测试是人工智能领域长久以来的终极目标。


早期的开放域人机对话系统大多由基于规则的方法构建,如目前已知最早的ELIZA [2]。该类方法的回复质量严重依赖于规则,难以进行扩展且对复杂对话场景的泛化能力较差。近年来,随着深度学习技术的兴起和社交网络发展而带来的数据规模的增长,数据驱动的方法逐渐成为构建开放域人机对话系统的主流方法[3]。


研究概况:

开放域人机对话在技术上主要分为两种路线:一种是基于文本检索的对话技术,也称为检索式对话技术。检索式对话技术通常需要较多的语料资源(即“输入-回复”对数据,这些数据的来源包括人工构建的话术数据或从网络上自动挖掘及整理得到的数据),对话的过程中,系统根据用户的输入,利用检索技术从语料库中检索与输入最为匹配的回复[4]。另一种是基于生成的对话技术,通常称为生成式对话技术。得益于深度学习技术的进步和序列到序列(Sequence to Sequence, Seq2Seq)学习模型的成功,生成式对话模型一般采用编码器-解码器(Encoder-Decoder)结构,其核心思想是首先编码给定的对话输入(可以为单轮的用户输入或多轮的人机对话历史)的语义信息,然后根据对话上文的语义信息通过解码的方式生成对话的回复[5]。随着深度学习的不断发展,尤其是以BERT和GPT为代表的基础模型(Foundation Model)的出现,开放域人机对话技术在上述两类技术路线上取得了更大的突破。


在上述两类技术路线的优化方向之外,近年来,开放域人机对话的研究更加关注与应用场景相结合的方面,具体研究主要包括:开放域角色化对话、对话式推荐和知识驱动的开放域人机对话。


(1)开放域角色化对话

开放域角色化对话[6]旨在融入特定角色信息,如爱好、年龄、性别等,通过提供更具体、更吸引人的对话获得用户的好感和信任,通过询问和回答角色化的用户输入增加用户参与度。对于角色化的建模目标,主要包括角色的属性/人设建模、对话语言风格建模和角色背景知识建模三个方面。在此基础之上,目前的主要研究内容包括角色信息建模、角色信息一致性、受限条件下的角色迁移等。


(2)对话式推荐

对话式推荐是利用自然语言与用户进行实时的多轮交互,并动态估计用户偏好和行为,进而进行推荐的一种技术[7]。其主要研究侧重于用户偏好获取、对话式推荐策略、推荐结果融入等。


(3)知识驱动的开放域人机对话

知识驱动的开放域人机对话[8]旨在利用外部知识作为额外的语义资源,增强机器回复的信息度、多样性、风格性和逻辑性。研究内容涉及知识筛选、可解释性推理等。值得注意的是外部知识不仅限于结构化知识库,还包括自由文本知识以及模型中隐含的参数化知识。


研究趋势:

(1)开放域多模态人机对话:融合语音、图片、视频等多模态元素的开放域人机对话可以大幅提升对话内容和形式的丰富程度,进而提升用户的交互体验。


(2)开放域风格化对话:一致协调的语言风格有利于增强机器的拟人化程度,提升用户的使用兴趣。


(3)开放域人机对话评价:开放域人机对话评价目前仍是一个开放性问题,评价方法的研究不仅可以减少测试阶段的时间和经济成本,还可以为训练过程提供指导和反馈,因此也是重要的研究方向。


参考文献:

[1] Turing, A.M. and Haugeland, J., 1950. Computing machinery and intelligence (pp. 29-56). Cambridge, MA: MIT Press.
[2] Weizenbaum, J., 1966. ELIZA—a computer program for the study of natural language communication between man and machine. Communications of the ACM, 9(1), pp.36-45.
[3] Serban, I.V., Lowe, R., Henderson, P., Charlin, L. and Pineau, J., 2018. A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version. Dialogue & Discourse, 9(1), pp.1-49.
[4] Ji, Z., Lu, Z. and Li, H., 2014. An information retrieval approach to short text conversation. arXiv preprint arXiv:1408.6988.
[5] Shang, L., Lu, Z. and Li, H., 2015, July. Neural Responding Machine for Short-Text Conversation. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) (pp. 1577-1586).
[6] Zhang, S., Dinan, E., Urbanek, J., Szlam, A., Kiela, D. and Weston, J., 2018, July. Personalizing Dialogue Agents: I have a dog, do you have pets too? In Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (pp. 2204-2213).
[7] Jannach, D., Manzoor, A., Cai, W. and Chen, L., 2021. A Survey on Conversational Recommender Systems. ACM Computing Surveys (CSUR), 54(5), pp.1-36.
[8] Ma, L., Li, M., Zhang, W.N., Li, J. and Liu, T., 2021. Unstructured Text Enhanced Open-Domain Dialogue System: A Systematic Survey. ACM Transactions on Information Systems (TOIS), 40(1), pp.1-44.

术语工委及术语平台介绍:

计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。


术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。


新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入知识图谱的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。

微信图片_20230410125847



计算机术语审定工作委员会

主任:

刘挺(哈尔滨工业大学)

副主任:

王昊奋(同济大学)

李国良(清华大学)

主任助理:

李一斌(上海海乂知信息科技有限公司)

执行委员:

丁军(上海海乂知信息科技有限公司)

林俊宇(中国科学院信息工程研究所)

兰艳艳(清华大学)

张伟男(哈尔滨工业大学)

640 (1)