预告|6月13日语音对话与听觉前沿研讨会
大会主旨报告
题目:Recent Advances in Speaker Extraction
摘要:Humans have a remarkable ability to pay their auditory attention only to a sound source of interest, that we call selective auditory attention, in a multi-talker environment or a Cocktail Party. However, signal processing approach to speech separation and/or speaker extraction from multi-talker speech remains a challenge for machines. In this talk, we study the deep learning solutions to monaural speaker extraction that enable selective auditory attention. We will discuss the computational auditory models, technical challenges in the field, and some related readings in ICASSP 2020.
简介:Haizhou Li is a Professor at the Department of Electrical and Computer Engineering, National University of Singapore (NUS). Prior to joining NUS, he was the Principal Scientist and Department Head of Human Language Technology in the Institute for Infocomm Research, Singapore (2003-2016). Prof. Li has served as the Editor-in-Chief of IEEE/ACM Transactions on Audio, Speech and Language Processing (2015-2018), and a Member of the Editorial Board of Computer Speech and Language (2012-2018). He was the President of the International Speech Communication Association (ISCA, 2015-2017), the President of Asia Pacific Signal and Information Processing Association (2015-2016), and the President of Asian Federation of Natural Language Processing (2017-2018). He was the General Chair of ACL 2012, INTERSPEECH 2014, and IEEE ASRU 2019. Prof. Li is a Fellow of the IEEE, and a Fellow of ISCA. He was a recipient of the President’s Technology Award 2013 in Singapore. He was named one of the two Nokia Visiting Professors in 2009 by the Nokia Foundation, and U Bremen Excellence Chair Professor in 2019 by Bremen University, Germany.
前沿学术报告
讲者:钱彦旻
题目:ICASSP2020语音识别前沿综述
简介:钱彦旻,上海交通大学计算机科学与工程系副教授,博士生导师。清华大学博士,英国剑桥大学工程系博士后。IEEE高级会员,国际开源项目Kaldi语音识别工具包的13位创始成员之一。在领域一流国际期刊会议上发表论文120余篇,Google Scholar引用近6000次,3次获得国际权威期刊和会议最优论文奖,申请50余项中美专利,研究领域包括语音识别,说话人和语种识别,语音抗噪与分离,语音情感感知,自然语言理解,多媒体信号处理等。
前沿学术报告
讲者:凌震华、吴志勇
题目:ICASSP2020语音合成与转换前沿综述
简介:凌震华,于2008年获中国科学技术大学信号与信息处理专业博士学位。2011年3月至今,任中国科学技术大学信息科学技术学院副教授,博士生导师。主要研究领域包括语音合成与声音转换、语音信号处理、自然语言处理等。曾获IEEE信号处理学会最佳青年作者论文奖和国家科技进步奖二等奖。
前沿学术报告
讲者:纳跃跃
题目:ICASSP2020基于盲源分离理论框架的语音增强前沿综述
简介:纳跃跃,阿里巴巴达摩院机器智能技术语音实验室算法专家,分别于2005、2008、2014年获得北京交通大学计算机科学与技术学士、硕士、博士学位。2014至2016年在中国科学院声学研究所,语言声学与内容理解重点实验室完成博士后工作。于2017年加入阿里巴巴达摩院机器智能技术语音实验室,主要研究方向有语音信号处理,机器学习在信号处理中的应用等。
前沿学术报告
讲者:张晓雷
标题:ICASSP2020关于数据驱动的声学信号处理前沿综述
简介:张晓雷,西北工业大学教授、博导。清华大学博士,美国俄亥俄州立大学博士后。在Neural Networks、IEEE TPAMI、IEEE TASLP等发表论文多篇。获得北京市科学技术一等奖、亚太信号与信息处理学会杰出讲者、Ubi-Media国际会议最佳论文等。入选国家和陕西省青年人才计划。担任Neural Networks、EURASIP Journal等多个国际期刊编委。
前沿学术报告
讲者:李明
题目:ICASSP2020基于深度学习的说话人识别及说话人日志前沿综述
简介:李明,昆山杜克大学电子与计算机工程副教授,美国杜克大学电子与计算机工程系客座研究员,武汉大学计算机学院兼职教授, 博导。第十五批江苏省六大高峰B类高层级人才, IEEE 语音语言专委会委员。研究方向包括音频语音信息处理,多模态行为信号分析等方向。
前沿学术报告
讲者:李圣辰
题目:DCASE声音场景与事件检测分类挑战赛前沿综述
简介:李圣辰,博士毕业于英国伦敦大学玛丽女王学院数字音乐研究中心。自2017年起连续参加IEEE组织的声学场景分类和声学事件检测数据挑战赛,并于2019年与三星电子北京研究院合作,获得声学场景分类项目开放数据集组的第一名。李圣辰博士及其研究团队的相关研究成果多次在包括ICASSP,DCASE Workshop在内相关国际学术会议上发表。
参会方式
参会方式一
参会方式二