返回首页

预告|6月13日语音对话与听觉前沿研讨会

阅读量:0 2020-06-11 收藏本文
语音、对话与听觉是人类沟通和获取信息最自然便捷的手段,语音、对话与听觉信息处理的研究内容既包括人类听觉以及言语产生机理等基础科学问题,也涵盖听觉感知分析、语音识别与合成、口语对话与理解、音乐工程等重要技术领域。
为了推进国内在该领域的发展,由中国计算机学会语音对话与听觉专业组主办,北京智源人工智能研究院支持举办的「语音对话与听觉前沿研讨会」将于6月13日上午8:30召开,本研讨会邀请了几位国内著名学者介绍语音对话与听觉相关领域的最新理论进展和应用探索。

大会主旨报告


题目:Recent Advances in Speaker Extraction

摘要:Humans have a remarkable ability to pay their auditory attention only to a sound source of interest, that we call selective auditory attention, in a multi-talker environment or a Cocktail Party. However, signal processing approach to speech separation and/or speaker extraction from multi-talker speech remains a challenge for machines. In this talk, we study the deep learning solutions to monaural speaker extraction that enable selective auditory attention. We will discuss the computational auditory models, technical challenges in the field, and some related readings in ICASSP 2020.

简介:Haizhou Li is a Professor at the Department of Electrical and Computer Engineering, National University of Singapore (NUS). Prior to joining NUS, he was the Principal Scientist and Department Head of Human Language Technology in the Institute for Infocomm Research, Singapore (2003-2016). Prof. Li has served as the Editor-in-Chief of IEEE/ACM Transactions on Audio, Speech and Language Processing (2015-2018), and a Member of the Editorial Board of Computer Speech and Language (2012-2018). He was the President of the International Speech Communication Association (ISCA, 2015-2017), the President of Asia Pacific Signal and Information Processing Association (2015-2016), and the President of Asian Federation of Natural Language Processing (2017-2018). He was the General Chair of ACL 2012, INTERSPEECH 2014, and IEEE ASRU 2019. Prof. Li is a Fellow of the IEEE, and a Fellow of ISCA. He was a recipient of the President’s Technology Award 2013 in Singapore. He was named one of the two Nokia Visiting Professors in 2009 by the Nokia Foundation, and U Bremen Excellence Chair Professor in 2019 by Bremen University, Germany.

前沿学术报告

讲者:钱彦旻

题目:ICASSP2020语音识别前沿综述

简介:钱彦旻,上海交通大学计算机科学与工程系副教授,博士生导师。清华大学博士,英国剑桥大学工程系博士后。IEEE高级会员,国际开源项目Kaldi语音识别工具包的13位创始成员之一。在领域一流国际期刊会议上发表论文120余篇,Google Scholar引用近6000次,3次获得国际权威期刊和会议最优论文奖,申请50余项中美专利,研究领域包括语音识别,说话人和语种识别,语音抗噪与分离,语音情感感知,自然语言理解,多媒体信号处理等。


前沿学术报告

讲者:凌震华、吴志勇

题目:ICASSP2020语音合成与转换前沿综述

简介:凌震华,于2008年获中国科学技术大学信号与信息处理专业博士学位。2011年3月至今,任中国科学技术大学信息科学技术学院副教授,博士生导师。主要研究领域包括语音合成与声音转换、语音信号处理、自然语言处理等。曾获IEEE信号处理学会最佳青年作者论文奖和国家科技进步奖二等奖。

吴志勇,清华大学深圳国际研究生院副研究员,博士生导师。清华大学-香港中文大学媒体科学、技术与系统联合研究中心副主任。研究兴趣为面向人工智能的智能言语交互技术。承担国家自然科学基金、香港特区政府研究资助局基金、国家社会科学基金等多项课题。获2009及2016年度教育部科学技术进步奖。指导的学生多人次获得优秀学位论文、国家奖学金、优秀毕业生,在2017全球极客大赛“AI仿声验声攻防赛”中斩获桂冠。


前沿学术报告

讲者:纳跃跃

题目:ICASSP2020基于盲源分离理论框架的语音增强前沿综述

简介:纳跃跃,阿里巴巴达摩院机器智能技术语音实验室算法专家,分别于2005、2008、2014年获得北京交通大学计算机科学与技术学士、硕士、博士学位。2014至2016年在中国科学院声学研究所,语言声学与内容理解重点实验室完成博士后工作。于2017年加入阿里巴巴达摩院机器智能技术语音实验室,主要研究方向有语音信号处理,机器学习在信号处理中的应用等。


前沿学术报告

讲者:张晓雷

标题:ICASSP2020关于数据驱动的声学信号处理前沿综述

简介:张晓雷,西北工业大学教授、博导。清华大学博士,美国俄亥俄州立大学博士后。在Neural Networks、IEEE TPAMI、IEEE TASLP等发表论文多篇。获得北京市科学技术一等奖、亚太信号与信息处理学会杰出讲者、Ubi-Media国际会议最佳论文等。入选国家和陕西省青年人才计划。担任Neural Networks、EURASIP Journal等多个国际期刊编委。


前沿学术报告

讲者:李明

题目:ICASSP2020基于深度学习的说话人识别及说话人日志前沿综述

简介:李明,昆山杜克大学电子与计算机工程副教授,美国杜克大学电子与计算机工程系客座研究员,武汉大学计算机学院兼职教授, 博导。第十五批江苏省六大高峰B类高层级人才, IEEE 语音语言专委会委员。研究方向包括音频语音信息处理,多模态行为信号分析等方向。


前沿学术报告

讲者:李圣辰

题目:DCASE声音场景与事件检测分类挑战赛前沿综述

简介:李圣辰,博士毕业于英国伦敦大学玛丽女王学院数字音乐研究中心。自2017年起连续参加IEEE组织的声学场景分类和声学事件检测数据挑战赛,并于2019年与三星电子北京研究院合作,获得声学场景分类项目开放数据集组的第一名。李圣辰博士及其研究团队的相关研究成果多次在包括ICASSP,DCASE Workshop在内相关国际学术会议上发表。

参会方式


参会方式一

扫码观看直播

参会方式二

点击下方链接,观看直播
https://event.baai.ac.cn/activities/45