【ADL113课程回看】深度学习前沿技术与产业应用

阅读量:751 2021-01-13 收藏本文

课程简介●

本期讲习班邀请到了本领域7位来自于著名高校与科研机构的重量级专家学者做主题报告。他们将对深度学习数学基础、卷积网络设计、图网络、生成对抗网络、深度学习平台以及视觉、自然语言处理等关键技术、应用实践及当前热点问题进行深入浅出的讲解，并对如何开展本领域前沿技术研究等进行指导，使参加者在了解学科热点、提高理论水平的同时，掌握最新技术趋势。

课程大纲

◆

第1讲

深度迁移学习技术，AI落地的希望

讲者：申省梅澎思科技首席科学家、澎思新加坡研究院院长

时长：1小时25分钟

简介：

传统的机器学习和现在的深度学习都依赖大量的标注数据，并在监督下训练出表现优异以及具备一定泛化能力的模型。但随着感知环境及应用场景的变化，训练好的模型性能会大幅度下降、重新训练周期长成本高、AI人才短缺已经成为AI落地和普惠的障碍。如何解决跨域学习问题，数据标注以及数据隐私问题，训练更具泛化性、鲁棒性的模型成为学术界和工业界面临的共同课题。在此背景下，跨域学习和迁移学习成为近年来研究的前沿热点。通用智能是下一代AI发展的必然趋势，代表智能革命的未来。跨域学习、迁移学习、无监督学习、自监督学习等将在未来几年实现在多个领域的落地生根，正在成为AI大规模落地的希望。围绕这个主题，我会分享AI落地的障碍，AI跨域迁移学习的前沿技术以及他们的应用。

ssm1

点击观看

第2讲

紧致化视觉表征-有效性、可解释性、鲁棒性

讲者：纪荣嵘厦门大学特聘教授，科技处副处长，国家杰出青年科学基金获得者，国家优秀青年科学基金获得者，国家万人计划青年拔尖人才

时长：2小时31分钟

简介：报告主要探索视觉大数据搜索识别系统中的紧凑性问题，将覆盖纪荣嵘教授研究组近两年来在面向视觉终端应用的视觉特征紧凑表示、视觉特征可解释性、以及视觉特征鲁棒分析中所做的一些工作与成果。在视觉特征紧凑表示方面，将介绍通过引入大规模无监督排序信息，学习排序敏感的哈希码，以保持原始高维特征空间中的检索信息。在视觉特征可解释方面，将介绍面向视觉检索任务的特征差异性分析、耦合性分析、网络结构性分析等。在面向视觉鲁棒性分析方面，将介绍面向视觉检索任务的对抗样本敏感度分析等。报告并将介绍上述研究在华为、腾讯等视觉产品中的实际应用。

jrr1

点击观看

第3讲

深度度量学习与视觉内容理解

讲者：鲁继文清华大学自动化系副教授、博士生导师，国际模式识别学会会士（IAPR Fellow）

时长：2小时24分钟

简介：深度度量学习通过将深度学习的特征表示能力与度量学习的相似性刻画能力相结合，以端对端的方式实现从数据空间到语义空间的感知，在多个视觉感知任务中均取得了重要进展。报告将介绍计算机视觉领域近年来所提出的深度度量学习系列方法，包括小样本深度度量学习、无监督深度度量学习、多视图深度度量学习、结构化深度度量学习、和非均衡深度度量学习，以及它们在人脸与物体识别、行人跟踪与再识别、行为预测与识别、图像与视频检索、细粒度图像分类、单目三维场景理解等视觉内容理解任务中的应用。

点击观看

第4讲

人工智能结构学习方法及其视觉应用

讲者：李玺浙江大学计算机学院教授，博导，浙江大学上海高等研究院副院长

时长：2小时30分钟

简介：本报告主要围绕数据驱动的人工智能学习方法，进行大规模图像/视频数据的结构学习，从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析，并引入了大规模视觉结构学习所涉及的主要研究问题和技术方法。然后系统地回顾了视觉结构表达和学习领域的不同发展阶段，介绍了近年来我们利用视觉结构学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其医学影像处理实际应用。

暂未授权

第5讲

深度学习的数学理解

讲者：张世华中国科学院数学与系统科学研究院研究员、中国科学院随机复杂结构与数据科学重点实验室副主任、中国科学院大学岗位教授

时长：2小时30分钟

简介：深度学习特别是深度神经网络作为一种黑箱模型，是通过大量计算实验得到的，其数学原理逐渐引起研究者的广泛关注。本报告将从不同的角度介绍深度学习的数学理解与认识，特别介绍我们的初步尝试。第一，从多层卷积稀疏编码模型的编码初始化和字典矩阵设计的角度，分别建立残差神经网络和多尺度密集连接网络与多层卷积稀疏编码模型的等价联系。第二，近期一种观点认为，深度神经网络的学习过程是按照“信息瓶颈”原则进行，如何有效地优化该原则仍然是一个开放问题，为此提出一个可以准确计算和优化的信息瓶颈实现方式。第三，基于分而治之的思想，提出隐空间细分的Wasserstein自编码生成学习方法，实现对复杂数据分布的非对抗建模。第四，在维度不变的情况下，刻画残差神经网络所学习到的映射接近于最优传输映射，即数据点的表示在模型内部近似沿着一条直线传输，进而解释为什么残差网络相比于普通神经网络具有更好的优化和泛化能力。

暂未授权

第6讲

图神经网络及视觉应用进展

讲者：崔振南京理工大学教授、博导

时长：2小时35分钟

简介：图是描述/建模非规则数据的一种重要且通用的工具。随着深度学习的出现与进步，面向图的深度学习理论与技术正成为当前研究热点。本报告首先介绍目前图神经网络的最新进展，包括代表性的谱图滤波以及空间图卷积等若干方法；然后从两个方面汇报我们最近开展的一些探索性工作：1)图卷积滤波方面，包括基于贝叶斯理论、张量理论的(多)图表示学习方法等；2)视觉图建模方面：包括从底层到高层视觉的图模型设计与学习方法。

cz1

点击观看

第7讲

图像复原中的基准数据集构建及网络模型设计

讲者：任文琦中国科学院信息工程研究所，信息安全国家重点实验室副研究员

时长：1小时24分钟

简介：

图像复原在实际生活中有重要应用价值，因此得到广泛关注和研究。基于深度学习的技术近年来也在图像复原中占据了主要的研究地位。然而，由于背景变化、光线改变等不可控因素，收集大量真实的理想训练数据对在图像复原领域是很难实现的。已有的大量研究工作通过物理合成、图像渲染、真实拍摄等不同方法得到了多种多样的训练数据库。本次报告主要针对多种退化模型（模糊、低分辨、水下成像、雨雾天气等）介绍不同的基准数据集构建方法，并进一步讨论了几种基于非匹配对图像的半监督和无监督图像复原网络模型构建方法。

点击观看

观看课程视频回放方法

已报名学员

在课程大纲中【点击观看】按钮，使用报名课程时的CCF账号登录即可观看。

未报名学员

在当前页或视频详情页点击【立即报名】按钮，报名成功后回到此页面即可观看。

讲者风采

申省梅

澎思科技首席科学家、澎思新加坡研究院院长，西安电子科技大学电子工程系电子信息工程硕士学位，计算机视觉与深度学习领域顶级科学家，前松下新加坡研究院副院长。领导超40人的算法研究团队，累计获得30余项各类计算机视觉领域国际顶级竞赛冠军，累计专利300余项。上世纪 80 年代起就从事人工智能在无人驾驶汽车和医学心电图辅助诊断等领域的相关研究。1992年加入新加坡松下研究院，从事音视频信号处理和压缩算法设计和应用，随后专注于图像识别领域的研究工作。2013 年就率先带领团队转向深度学习方向，在深度学习、计算机视觉领域取得了瞩目的成绩。多次荣获日本松下杰出技术、领军人物特别奖，担任国际标准化组织（ISO）和国际电工委员会（IEC）标准制定主编，负责和牵头多项音视频国际标准制定工作。计算机科学和人工智能领域少有的华人女性科学家，申省梅拥有计算机视觉领域全栈算法研究及工程化经验，技术面横跨多个应用领域，在基于深度学习的人脸识别、目标跟踪、行人检测、行人再识别（Re-ID）、目标检测、图像分割、图像分类、交通异常检测、自动驾驶、自动情感识别、智能机器人等领域均取得了世界顶级成果2019年3月加入澎思科技任首席科学家、澎思新加坡研究院院长，致力于监控与安全、智慧城市、自动驾驶、VSLAM 、智能机器人以及AI 工厂自动化解决方案等领域的相关技术的开发部署和落地。

纪荣嵘

厦门大学特聘教授，科技处副处长，国家杰出青年科学基金获得者，国家优秀青年科学基金获得者，国家万人计划青年拔尖人才。主要研究方向为计算机视觉、多媒体技术和机器学习。近年来发表PAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文谷歌学术引用九千余次。曾获2007年微软学者奖、2011年ACM Multimedia最佳论文奖、2015年省自然科学二等奖、2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国家重点研发计划课题，国家自然科学基金。任中国计算机学会A类国际会议IEEECVPR 2021、ACM Multimedia 2020/ 2019/2018领域主席等。任中国图象图形学学会青工委副主任、中国自动化学会粒计算与多尺度分析专委会副主任、中国计算机学会计算机视觉专委会常务委员、中国计算机学会学术工委委员、教育部电子信息类教指委人工智能专业建设咨询委员会委员。

鲁继文

清华大学自动化系副教授、博士生导师，国际模式识别学会会士（IAPR Fellow）。长期从事计算机视觉、模式识别和智能机器人的科研工作，在PAMI/IJCV/CVPR/ICCV/ECCV上共发表论文80余篇，谷歌学术引用12000余次，主持承担国家自然科学基金联合重点基金、国家优秀青年科学基金，国家重点研发计划课题等科研项目10余项。担任国际期刊Pattern Recognition Letters主编，IEEE TIP、IEEE TCSVT、IEEE TBIOM编委，国际会议IEEE FG 2023、IEEE VCIP 2022、IEEE AVSS 2021和IEEE ICME 2020程序委员会主席，CVPR 2020/2021和IJCAI 2021等20多个国际会议领域主席，IEEE IVMSP/MMSP/IFS/MSA/VSPC技术委员会委员、中国计算机学会计算机视觉专委会常务委员，中国人工智能学会模式识别专委会常务委员。

李玺

教授，博导，浙江大学计算机学院，浙江大学上海高等研究院副院长，浙江大学-每日互动数据智能研发中心主任，科技部科技创新2030新一代人工智能重大项目负责人，国家基金委NSFC重点项目负责人，教育部重点规划研究项目负责人，国家千人计划青年项目入选者，中国图象图形学会理事，浙江省杰出青年科学基金获得者，浙江省特聘专家，中国图象图形学报副主编。主要从事计算机视觉、模式识别和机器学习等领域的研究和开发。在国际权威期刊和顶级学术会议发表文章160余篇。拥有多篇ESI高被引论文，担任国际计算机视觉领域顶级会议CVPR 2020和ECCV 2020的领域主席（Area Chair）,国际多媒体领域顶级国际会议ACM MM 2020的领域主席（Area Chair），国际神经信息处理会议ICONIP 2020的领域主席（Area Chair），国际计算机视觉领域顶级会议ICCV 2019的领域主席（Area Chair）, 人工智能领域顶级会议IJCAI 2019和2021的领域主席（SPC），国际模式识别大会ICPR 2018和2020的领域主席（Area Chair）。担任神经网络和学习系统领域顶级期刊《IEEE Transactions on Neural Networks and Learning Systems》的Associate Editor（2019.1—），担任图像视频处理领域顶级期刊《IEEE Transactions on Circuits and Systems for Video Technology》的Associate Editor（2019.1—），担任神经计算领域知名国际刊物《Neurocomputing》和《Neural Processing Letters》的Associate Editor。获得两项最佳国际会议论文奖（包括ACCV 2010和DICTA 2012），一项最佳学生论文奖（ACML 2017），一项2019年度中国图象图形学报最佳封面文章奖，以及一项ICIP 2015 Top 10%论文奖。另外分别获得两项中国北京市自然科学技术奖（包括一等奖和二等奖），以及一项中国专利优秀奖。

张世华

中国科学院数学与系统科学研究院研究员、中国科学院随机复杂结构与数据科学重点实验室副主任、中国科学院大学岗位教授。主要从事生物信息计算、机器智能与优化，主要成果发表在Cell、Advanced Science、National Science Review、Nature Communications、Nucleic Acids Research、Bioinformatics、IEEE TPAMI、IEEE TKDE、IEEE TFS、Annals of Applied Statistics等杂志。目前担任BMC Genomics等杂志编委。曾荣获中国青年科技奖、国家自然科学基金优秀青年基金、中组部万人计划青年拔尖人才、中国科学院卢嘉锡青年人才奖、全国百篇优秀博士论文奖等。

崔振

南京理工大学教授、博导。研究方向为计算机视觉和模式识别，目前研究聚焦于图神经网络及其视觉计算研究。在IEEE汇刊（T-PAMI/T-NNLS/T-IP等）和CCF A类会议（CVPR/NIPS等）发表论文40余篇。入选国家人才项目、获中国科学院优秀博士论文、国内外重大/重要赛事冠亚军各2项等；承担江苏省杰出青年基金、国家自然科学基金等多项项目。

任文琦

中国科学院信息工程研究所，信息安全国家重点实验室副研究员。曾在腾讯人工智能实验室、微软亚洲研究院访问研究。主要研究方向包括图像/视频恢复与增强等相关问题。在本领域内国际主要期刊和会议IEEE TPAMI/TIP、IJCV，CVPR/ICCV/ECCV/NeurIPS等发表学术论文40余篇。曾获中国计算机学会优秀博士论文奖、微软亚洲研究院“铸星计划”、北京市科协“青年人才托举工程”、北京市“科技新星”，及中办科学技术进步一等奖（排名第四）等。

<<< 上一篇【ADL114课程回看】知识图谱

【ADL111课程回看】数据安全与隐私下一篇 >>>

<<< 下一篇【ADL111课程回看】数据安全与隐私

相关阅读：【ADL110课程回看】区块链技术与应用研究

相关阅读：【ADL111课程回看】数据安全与隐私

相关阅读：【ADL112课程回看】量子计算

相关阅读：【ADL114课程回看】知识图谱