从自然语言理解到问答机器人

阅读量:593
leifu

ADL图学科前沿讲习班
The CCF Advanced Disciplines Lectures

第86期

主题:自动问答、聊天机器人与自然语言理解

2017年11月8-10日,大连理工大学国际会议中心

       在人工智能时代,以自然语言理解为核心技术的问答、对话、聊天机器人已经成为产业界和学术界的关注热点。其中的关键技术包括:自动问答、对话管理、自然语言生成、机器翻译、文本语义匹配、用户画像以及面向自然语言理解的深度学习等。本期CCF学科前沿讲习班《自动问答、聊天机器人与自然语言理解》将邀请六位学术界和工业界的著名专家、学者对问答、对话、聊天场景下自然语言理解的基础理论、重要算法等热点问题进行系统的讲解。目的是为青年学者和研究生提供一个三天的学习和交流平台,帮助大家快速了解本领域的基本概念、研究内容、方法和发展趋势。本次ADL是和NLPCC 2017联合举办的,是NLPCC 2017 Tutorials课程。

CCF Advanced Disciplines Lectures (ADL 86) & NLPCC 2017 Tutorials

Question Answering, Chat Bot and Natural Language Understanding

Dalian, November 8-10, 2017

In the artificial intelligence era, Question Answering, Conversation, Chat Bot have become the hot topics in both the research and industry domains. The key technologies include question answering, conversation management, natural language generation, machine translation, textual semantic matching, user profile and deep learning for natural language processing. This Advanced Disciplines Lectures “Question Answering, Chat Bot and Natural Language Understanding” will invite six famous experts and professors from Academia and Industry to give systematic lectures on the fundamental theories, algorithms, and related hot-spot issues. The objective of the lectures is to provide a three-day learning and communication platform for the young scholars and research students to rapidly understand the element concepts, research contents, approaches and growing tendencies in this area. ADL 86 runs in parallel with NLPCC 2017 as its tutorials.

学术主任:徐睿峰,刘康

徐睿峰,博士分别于2002年和2006年获得香港理工大学计算机科学硕士和博士学位。2006年至2009年,他先后在香港中文大学、香港理工大学和香港城市大学担任博士后研究员、高级研究助理和研究员。2009年加入哈尔滨工业大学深圳研究生院担任副教授,并后期晋升为教授、博士生导师。徐睿峰教授目前担任International Journal of Machine Learning and Cybernetics (Springer) 副主编,中国人工智能学会青年工作委员会秘书长,中国计算机学会中文信息技术专委会副秘书长。他的研究领域包括自然语言处理、情绪计算、文本挖掘、生物信息学和人机接口。他在IEEE Computational Intelligence Magazine, Knowledge-based System, Scientific Reports, Bioinformatics, BMC bioinformatics等国际期刊和IJCAI, ACL, EMNLP and CIKM等会议上发表超过100篇论文。此外,他主持了超过20个科研项目。

刘康,博士,现任中科院自动化所模式识别国家重点实验室副研究员。研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文四十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),获得KDD CUP 2011 Track2 全球亚军,COLING 2014最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2015、2017 Google Focused Research Award等。

主办单位:中国计算机学会

联系方式:邮箱:nlpcc@pku.edu.cn;电话:010-82529251

日程安排

日期

时间

活动

11月8日

08:00-10:00

学员注册

08:30-09:00

开幕式,集体照

09:00-12:00

讲座1: 面向人机对话系统的应用现状与挑战

严睿, 北京大学

12:00-14:00

午餐

14:00-17:00

讲座2: 基于问题回答和问题生成的信息机器人

段楠, 微软亚洲研究院

11月9日

09:00-12:00

讲座 3: 深度文本语义匹配

徐君, 中国科学院计算技术研究所

12:00-14:00

午餐

14:00-17:00

讲座 4: 深度学习在机器翻译中的最新进展

熊德意, 苏州大学

11月10日

09:00-12:00

讲座 5: 自然语言处理中的神经网络方法介绍

高剑峰, 微软研究院,Redmond

12:00-14:00

午餐

14:00-17:00

讲座 6: 用户画像与聊天机器人

谢幸, 微软亚洲研究院

17:00-17:20

闭幕式

(如有变动,以现场为准)

地点和注册方式

现场注册和报到地点:辽宁省大连市 大连理工大学国际会议中心大堂

会议地点:辽宁省大连市 大连理工大学国际会议中心二楼学术报告厅

即日起至2017年11月7日,注册请登录:

http://59.108.48.38/nlpcc2017/index.php,或扫描以下二维码

                                                        1

                                 NLPCC 2017官网二维码                                

会议注册网站二维码new

                                                   NLPCC 2017/ADL 86注册网站二维码

注册、注册费及缴费说明

1.根据注册先后顺序录取,报满为止;

2.CCF会员在注册网站中注册时,需填写CCF会员号,否则将按非会员处理;

3.在注册网站中可以在线缴纳注册费,无法在线缴纳注册费的,可通过银行转账缴纳注册费(具体见7);

4.注册费包括讲课资料、视频资料和3天会议期间午餐,其他食宿、交通自理;

5.缴费后确因个人原因未参加者,扣除报名费30%(开具服务费发票);

6.2017年11月1日(含)前注册并缴费:CCF会员和学生2500元/人,非会员3000元/人;2017年11月2日(含)及现场缴费:会员、学生、非会员均为4000元/人。与NLPCC 2017同时注册,享受优惠价格(具体见NLPCC 2017会议通知);

7.注册后可以通过银行转账方式缴纳注册费,账户信息如下:

开户行:北京银行北京大学支行

户名:中国计算机学会

账号:0109 0519 5001 2010 9702 028

请务必注明:姓名+NLPCC2017

讲座及讲者

讲座1:面向人机对话系统的应用现状与挑战

讲者:严睿,北京大学

摘要:近年来,自动人机对话系统在学术界和工业界都获得了相当大的关注度,随着微软小冰百度度秘等产品的发布,以及大量人工智能公司的建立,这些对话系统背后的技术在逐步积累,也逐步解密。随着研究者的探索愈发深入,人们看到了一个对话系统逐渐从科幻电影中走进现实生活的可能。在讲座中,我将回顾人机对话的发展历程,以及随着深度学习技术盛行之后,由数据驱动模型带来的革命性改变。讲座将从人机对话的已有应用出发,再分析现有对话系统的不足,展望下一代人机对话系统的挑战。同时会分享我们组在人机对话研究所做的努力与探索,以及相应的代表性成果。

讲者简介:严睿,北京大学研究员,前百度公司资深研发,华中师范大学与中央财经大学客座教授与校外导师。主持研发多个开放领域对话系统和服务类对话系统,发表高水平研究论文近50篇,担任多个学术会议(KDD, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(高级)程序委员会委员及审稿人。

讲座2:基于问题回答和问题生成的信息机器人

讲者:段楠,微软亚洲研究院

摘要:信息机器人旨在为自然语言使用者提出的问题提供精准的回答,这对于构建下一代搜索和会话引擎至关重要。本次报告将会介绍搭建信息机器人所使用的一系列的问题回答和问题生成技术。这些技术在答案生成过程中可使用不同类型的数据(例如,文档、网页表格、抽取或组织的知识库以及问答对),并且许多实用的人工智能产品中都使用了这些技术,例如微软的必应以及微软聊天机器人小冰。另外,将会展示问题回答与问题生成如何在一个统一的训练框架下互相促进,比如生成式对抗网络和对偶学习。

讲者简介:段楠博士是微软亚洲研究院自然语言计算部门的主任研究员,从事问题回答与生成、语义解析、对话系统、释义等基本的自然语言处理任务的研究。段楠博士的许多研究已经转化为微软中重要的人工智能产品,例如必应、小冰、语音助手。自2015年起,段楠博士开始担任NLPCC开放域问答任务的组织者。

讲座3:深度文本语义匹配

讲者:徐君,中国科学院计算技术研究所

摘要:三年前,ADL 52 & NLPCC 2014举办了题为“用于搜索的语义匹配”教学讲座(http://tcci.ccf.org.cn/ conference/2014/pages/page03_ADLNotice.html),该讲座对匹配学习技术及其在互联网搜索方面应用进行了系统而全面的调研。在过去的三年中,深度学习在信息检索及相关领域取得了巨大的成功,与此同时,基于深度学习的语义匹配技术也取得了长足的进步。本讲座将总结介绍近几年新出现的基于深度学习的语义匹配技术,聚焦于研究者们在单词和句子两个级别上所进行的研究,具体而言,在单词级别,将介绍为弥补不单词之间的语义鸿沟所进行的分布式语义表达方法;在句子级别,将介绍为捕获句子之间的邻近度匹配模式而提出的端到端匹配学习模型。最后讲座将讨论语义匹配的潜在的应用以及未来的研究方向。

讲者简介:徐君教授分别于2001年和2006年获得南开大学信息学院学士和博士学位。博士毕业后,其先后任职于任微软亚洲研究院和华为诺亚方舟实验室,任副研究员、研究员和资深研究员,于2014年加入中国科学院计算技术研究所,任研究员。徐君的研究兴趣集中于将机器学习技术应用于信息检索,在重要的国际学术会议和期刊(如:TOIS,JMLR,SIGIR,WWW,WSDM,ACL等)上发表论文40余篇,获得美国专利授权8项,其发表的论文被提名参评SIGIR 17 Test of Time Award,提出的算法被知名信息检索开源软件Lemur所采用,被多本信息检索教科书收录。徐君同时活跃于学术界和工业界,在2017年,他担任了SIGIR 17和ACML 17的领域主席(Area chair/Senior PC)、ICBDA17的共同程序委员会主席(PC co-chair),担任了KDD 17,NIPS 17,CIKM 17以及WSDM 17的程序委员会委员(PC member),为TOIS,JMLR和TKDE等期刊审稿;徐君也参与了多个搜索搜索产品(如:微软必应搜索、微软Office SharePoint Search及华为GTS搜索等)的技术开发,创立了Github开源项目Easy Machine Learning。

讲座4:深度学习在机器翻译中的最新进展

讲者:熊德意,苏州大学

摘要:在过去的70年里,机器翻译大概每隔一二十年就会经历一次范式转变。最近一次转变到神经机器翻译是由深度学习技术驱动的。本次报告将会介绍基于深度学习的机器翻译最新进展,包括不同的神经网络架构、机器翻译发展新的可能性和新疆域。本次报告还将总结和探讨神经机器翻译未来发展的机遇和挑战。

讲者简介:熊德意,苏州大学计算机科学与技术学院教授、计算机系系主任。国家优秀青年科学基金(国家优青)获得者,江苏省“333工程”和“六大人才高峰”培养对象,苏州市“高等院校、科研院所紧缺高层次人才”引进对象。2007年至2012年在新加坡资讯通信研究院任研究科学家。主要研究方向为机器翻译、多语言信息获取、自然语言理解和深度学习等。在Computational Linguistics、 IEEE TASLP、 AI、JAIR、 AAAI、 IJCAI、 ACL等国际著名期刊和会议上发表论文60余篇,Springer出版英文专著一部,编著会议论文集多部。2009年获得北京市科学技术奖二等奖,2016年获得中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖。曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员。目前是中文信息学会理事,江苏省人工智能学会智能系统及应用专委会副主任。担任IALP 2012程序委员会共同主席、CWMT 2017程序委员会共同主席、欧盟多国联合项目QTLeap咨询专家。

讲座5:自然语言处理中的神经网络方法介绍

讲者:高剑峰,微软研究院,Redmond

摘要:在报告开始部分,我先简要介绍深度学习历史及其在自然语言处理中的应用。然后我会详细介绍深度学习技术在三个自然语言处理领域的最新进展。第一个是用于建模文本和图像语义相似度的深度学习模型。该模型是是很多应用的基础,包括互联网搜索排序、推荐、图像字幕和机器翻译等。第二个是用于机器阅读理解和问答系统的神经模型。第三个是深度强化学习在对话系统的应用,包括面向任务的机器人和聊天机器人。

讲者简介:高剑峰是微软合伙人,微软Redmond总部人工智能部门的研究经理(Partner Research Manager)。他致力于深度学习在文本和图像处理方面的研发,领导机器阅读理解、问答、对话方面的研究和人工智能系统开发,以及微软新一代商务人工智能系统的研发。2006到2014年期间,他担任微软研究院Redmond总部的自然语言处理部门的首席研究员(Principal Researcher),致力于互联网搜索、查询理解和改写、广告预测和统计机器翻译等系统的研发。2005到2006年期间,他是微软总部自然互动服务部门的科研带头人,致力于开发Windows自然用户界面。2000到2005年期间,他是微软亚洲研究院的自然语言计算部门的科研带头人,和同事合作开发了微软Office中的第一个中文语音识别系统,作为市场主导产品的中日文输入法编辑器(IME)和微软 Windows自然语言平台。

讲座6:用户画像与聊天机器人

讲者:谢幸,微软亚洲研究院

摘要:随着定位技术、传感器和社交网络的高速发展,产生了大量的用户行为数据。这些数据可以全面的反映用户在物理世界中的足迹和活动,使得用户理解达到了前所未有的深度。在这次讲座中,我会先介绍用户属性和性格对搭建智能机器人的重要性,接着展示用户足迹数据用于推断用户属性的效果。然后,将介绍如何基于异构用户数据预测不同类型的用户性格特征。最后,会介绍这些技术在微软小冰上的应用,如小冰用户画像、对话过程中的推荐、个性化对话生成等。

讲者简介:谢幸博士于2001年7月加入微软亚洲研究院,现任社会计算组高级主任研究员,并任中国科技大学兼职博士生导师。他分别于1996年和2001年在中国科技大学获得计算机软件专业学士和博士学位。目前,他的团队在数据挖掘、社会计算和普适计算等领域展开创新性的研究。他在国际会议和学术期刊上发表了200余篇学术论文,共被引用13000余次,并多次在KDD、ICDM等顶级会议上获最佳论文奖。他曾在多个会议受邀发表主题报告,包括MobiQuitous 2016, SocInfo 2015, Socialinformatics 2015, GbR 2015, W2GIS 2011, HotDB 2012, SRSM 2012等。他是ACM、IEEE高级会员和计算机学会杰出会员,多次担任顶级国际会议程序委员会委员和领域主席等职位。他是ACM Transactions on Intelligent Systems and Technology、Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies (IMWUT)、Springer GeoInformatica、Elsevier Pervasive and Mobile Computing等杂志编委。他参与创立了ACM SIGSPATIAL中国分会,并曾担任ACM UbiComp 2011大会程序委员会共同主席。


读完这篇文章后,您心情如何?