返回首页

联手自然语言处理专委会:“量子自然语言处理”术语发布 | CCF术语快线

阅读量:104 2021-10-05 收藏本文

本期发布术语热词:量子自然语言处理(Quantum Natural Language Processing)。


开篇导语:


本期发布术语热词:量子自然语言处理(Quantum Natural Language Processing)。近年来,自然语言处理与量子计算的结合正在成为一个飞速发展的研究方向,现有工作展现了量子自然语言处理算法不仅有更好的性能,也可以降低计算复杂度。


量子自然语言处理

(Quantum Natural Language Processing)

作者:伍斯璇(西湖大学)、张岳(西湖大学)


InfoBox:

中文名:量子自然语言处理

外文名:Quantum Natural Language Processing

简写:QNLP

学科:自然语言处理、量子计算

实质:利用量子计算的数学方法、量子力学的性质等处理自然语言问题。


基本简介:

量子自然语言处理没有统一的定义,一般认为利用量子计算机处理自然语言任务的量子算法,以及借助量子力学数学框架解决自然语言处理问题的经典算法都属于量子自然语言处理[1]。


研究概况:

近年来,自然语言处理与量子计算的结合正在成为一个飞速发展的研究方向,包括利用量子计算建模语义歧义[2]、语义组合[3]等,其应用场景有信息检索[4][5]、情感分析[6]、问答匹配[2]等。现有工作展现了量子自然语言处理算法不仅有更好的性能,也可以降低计算复杂度。根据算法类型,量子自然语言处理算法可以分为量子算法和经典算法。前者是指利用量子计算机处理自然语言问题,后者是指在经典计算机上运行的量子启发式算法。


在量子算法方面:Zeng等[7]首次提出了用于计算句子相似度的量子算法,该算法在特定条件下与经典算法相比有平方级别的加速。这是第一个利用量子计算机处理自然语言问题的算法。但该算法需要利用量子随机存取存储器(qRAM),无法在现有量子计算机上实现。基于此问题,Coecke等[3][8]提出了可以在现有嘈杂的中级量子计算机(NISQ)上处理自然语言问题的量子算法,这些算法具有可扩展性,随着硬件的发展可以用于更复杂的问题。随后,在NISQ上进行的初步实验[9][10]进一步证明了利用量子计算机处理自然语言问题的可行性。


在经典算法方面:Van Rijsbergen[11]开创性地提出将传统信息检索模型统一在量子力学的框架中。为了更好的建模语义关联,Sordoni 等[4][12]提出用于信息检索的量子语言模型。近年来,为了提高模型实用性,一些基于神经网络的量子启发式语言模型被提出,并被用于信息检索[5]、情感分析[6]等任务,这些工作在一些数据集上实现了state-of-the-art 的效果。但是神经网络与量子语言模型的本质联系仍有待研究。基于此,张量网络作为神经网络和量子力学的桥梁,被用于处理自然语言任务[13][14],这些网络有较好的可解释性。


量子自然语言处理下一段的研究将关注于:1)复数域。现有量子自然语言处理算法大多使用实数词向量和实数神经网络,但复数在量子力学中具有重要作用。2)量子优越性。量子优越性是指量子计算机在解决特定计算困难问题时,相比于经典计算机可以实现超多项式级别的加速。探求能展示量子优越性的自然语言处理任务是一个重要的方向;3)更广泛的应用。现有算法大多关注于较为简单任务,如信息检索,问答匹配等,将量子自然语言模型扩展到更复杂的任务,如自动文本生成等,也是一个重要等方向。


参考文献:

[1] Sixuan Wu, Jian Li, Peng Zhang and Yue Zhang. 2021. Natural Language Processing Meets Quantum Physics: A Survey and Categorization. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing.
[2] Qiuchi Li, Benyou Wang, and Massimo Melucci. 2019. CNM: An Interpretable Complex-valued Network for Matching. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.
[3] Coecke Bob, et al. 2020. Foundations for near-term quantum natural language processing. arXiv preprint arXiv:2012.03755.
[4] Alessandro Sordoni, Jian-Yun Nie, and Yoshua Bengio. 2013. Modeling term dependencies with quantum language models for ir. Proceedings of the 36th international ACM SIGIR conference on Research and development in information retrieval.
[5] Yongyu Jiang, et al. 2020. A quantum interference inspired neural matching model for ad-hoc retrieval. Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.
[6] Yazhou Zhang, et al. 2019. Quantum-Inspired Interactive Networks for Conversational Sentiment Analysis.
[7] Zeng Willia and Bob Coecke. 2016. Quantum algorithms for compositional natural language processing. arXiv preprint arXiv:1608.01406.
[8] Konstantinos Meichanetzidis, et al. 2020. Quantum natural language processing on near-term quantum computers. arXiv preprint arXiv:2005.04147.
[9] Konstantinos Meichanetzidis, et al. 2020. Grammar-Aware Question-Answering on Quantum Computers. arXiv preprint arXiv:2012.03756.
[10] Robin Lorenz, et al. 2021. Qnlp in practice: Running compositional models of meaning on a quantum computer. arXiv preprint arXiv:2102.12846.
[11] Cornelis Joost Van Rijsbergen. 2004. The geometry of information retrieval. Cambridge University Press.
[12] Mengjiao Xie, et al. 2015. Modeling quantum entanglements in quantum language models. Twenty-Fourth International Joint Conference on Artificial Intelligence.
[13] Peng Zhang, et al. 2018. A quantum many-body wave function inspired language modeling approach. Proceedings of the 27th ACM International Conference on Information and Knowledge Management.
[14] Zhang, Peng, et al. 2020. TextTN: Probabilistic Encoding of Language on Tensor Network.

术语工委及术语平台介绍:

计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。


术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。


新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入知识图谱的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。

微信图片_20230410125847



计算机术语审定工作委员会

主任:

刘挺(哈尔滨工业大学)

副主任:

王昊奋(同济大学)

李国良(清华大学)

主任助理:

李一斌(上海海乂知信息科技有限公司)

执行委员:

丁军(上海海乂知信息科技有限公司)

林俊宇(中国科学院信息工程研究所)

兰艳艳(清华大学)

张伟男(哈尔滨工业大学)

640 (1)