CCF发布2019-2020中国计算机科学技术发展报告

阅读量:5600 2020-11-10 收藏本文

640

点击CCF数字图书馆，会员可浏览《发展报告》详细内容。

此次《发展报告》的组织和策划得到了CCF各专业委员会与广大会员的大力支持和积极响应，经过学术工作委员会的征集审稿，今年入选到《发展报告》的文章共16篇，为历年最多。其中人工智能安全性、智能软件可靠性、网络信息安全、芯片安全等方面的报告，从算法的脆弱性与鲁棒性、信息的安全性、器件的安全性等多角度对安全问题进行了阐述；元学习技术、资源匮乏语言神经机器翻译、语音信号处理等方面的报告，对于深度学习过分依赖标注数据的问题进行了阐述；在前沿技术方面，包含了量子算法和复杂性的研究进展、区块链信息系统的发展现状与前瞻、高性能计算发展现状及趋势等报告；在交叉融合方面，包含了数据库与人工智能的交叉技术、跨媒体智能理论与技术研究进展、人机物融合操作系统的研究进展与趋势等报告。以下是《发展报告》中各篇文章的摘要内容：

【1】

量子算法与复杂性研究进展概述

——CCF理论计算机科学专业委员会

作者：李绿周、高飞、姚鹏晖、田国敬、何键浩、潘世杰、叶泽坤

探寻量子优势是量子计算领域的核心问题之一，而量子优势的发挥有赖于量子算法。同时，要搞清楚量子计算与经典计算的边界，需要从复杂性的角度进行深入研究。由此可见，量子算法与复杂性是量子计算理论的核心内容。本文从量子查询算法及复杂性、量子交互计算复杂性、量子机器学习、量子优化、量子电路优化与经典模拟等几个主要方向进行阐述。总结近几年国内外在这些方向的研究进展，并对国内外研究现状进行分析和比较，最后对相关研究方向发展趋势进行展望。

【2】

对抗机器学习研究进展及趋势

——CCF人工智能与模式识别专业委员会

作者：朱军、苏航、董胤蓬、庞天宇

以深度学习为代表的机器学习技术已经在很多应用领域取得显著进展，但随着应用范围的不断扩大，对机器学习的对抗鲁棒性提出了更高要求。对抗机器学习是机器学习中新兴的一个热点方向，旨在研究在存在对抗噪声的情况下，如何通过对抗攻击发现模型的脆弱性。分析其工作机理，并进一步发展对抗鲁棒的机器学习理论和方法。本文总结分析了对抗机器学习的前沿进展，并指出若干未来值得关注的研究方向。

【3】

数据库与人工智能交叉技术的进展与发展趋势

——CCF数据库专业委员会

作者：李国良、范举、冯建华

随着计算机技术与网络通信技术的快速发展，数据库技术已经成为当今信息社会中对大量数据进行组织与管理的重要技术手段，是网络信息化管理系统的基础。日前，随着人工智能飞速发展，数据库与人工智能的交叉技术逐渐成为数据库研究领域的重要方向之一。在本文中，我们首先分析基于人工智能的数据库技术的发展现状。在大数据时代下，面对不断膨胀的数据信息、复杂多样的应用场景、异构的硬件架构和参差不齐的用户使用水平，传统数据库技术很难适应这些新的场景和变化，机器学习技术因其从历史经验中学习的能力、逐渐在数据库领域展现潜力和应用前景。我们分别讨论智能数据库配置、智能数据库优化、智能数据库设计、智能数据库监控和数据库安全。其次，我们分析基于数据库的人工智能技术的发展现状。人工智能技术因其强大的学习和泛化能力已经被广泛应用到各种真实场景中。然而，现有人工智能技术还面临着三大挑战。第一，现有 AI技术使用门槛高，依赖于AI从业者选择合适模型、设计参数、编写程序，因此很难被广泛应用到非计算机领域；第二，现有AI算法训练效率低,造成了大量计算资源浪费,甚至延误决策时机；第三，现有AI技术强依赖高质量数据，如果数据质量较低，可能造成计算结果的错误。我们分别从面向AI的声明式语言模型、面向AI的逻辑优化引擎、面向AI的物理优化引擎和面向AI的数据治理四个方面综述数据库技术如何解决以上挑战。最后，我们给出数据库与人工智能交叉技术的发展趋势和挑战。

【4】

大数据知识工程的研究进展与趋势

——CCF大数据专家委员会

作者：吴信东、靳小龙、陈欢欢、吴共庆、刘均、官赛萍、陆汝钤

知识工程这一概念由美国学者费根鲍姆于20世纪70年代提出，其后迅速发展成为一个专门的科学研究方向并在专家系统的研究与应用热潮中发挥了关键作用。随着大数据时代的到来，知识工程也迎来了碎片化知识的“量，质，序”的新挑战和发展机遇，特别是Google在2012年发布了知识图谱这一项目并将基于大数据的知识图谱用于增强搜索引擎的性能之后，大数据环境下的知识工程迅速得到了学术界、工业界甚至是政府部门的高度关注。2015 年，吴信东等华人学者提出了大数据知识工程(BigKE)的概念。本文阐述国内外大数据知识工程领域近些年的发展状况和趋势，对国内外大数据知识工程领域各自的优势与特点进行了总结对比，同时展望了未来的总体发展趋势。

【5】

新一代数据中心网络技术研究进展

——CCF互联网专业委员会

作者：苏金树、赵宝康、董德尊、吕高锋、文梅、魏亮、彭伟、李福亮、张圣林、孙永谦

随着数据中心列入新基建的重点发展方向，它即将迎来蓬勃发展的新阶段。数据中心网络作为连接数据中心系统内部各类资源、承载海量流量的核心和关键，一直是产业和学术界关注的焦点。近年来，飞速增长的网络流量、迅速变迁的网络负载、快速增加的网络规模，对传统数据中心网络提出了严峻挑战，催生了以可编程数据平面、开放控制平面、无损传输、智能运维等为代表的新一代数据中心网络技术。本文将对新一代数据中心网络的相关核心关键技术进行梳理总结，并对未来发展进行展望。

【6】

跨媒体智能的表征技术研究进展与趋势

——CCF多媒体专业委员会

作者：刘偲、李波、况琨、黄庆明、朱文武、张新峰、于俊清、吴飞、王鑫、冯娜、宋子恺

报告从多媒体的特征工程任务出发，分析了当前在跨媒体多任务环境下模态表征的理论模型。主要包括：多媒体特征提取与表达、多媒体特征的高效压缩、跨媒体多模态表征以及多模态建模。多媒体特征提取与表达是解决跨媒体学习任务的先决条件，通过提取多媒体数据中的语义表征和内在关联，实现多媒体特征表达的高效性和可解释性，并提升跨媒体任务的高效性和可解释性。然而，原始特征中大量的数据会增加网络传输的负担，多媒体特征的高效压缩通过预测和量化等操作，在保持给定分析性能的条件下，通过去除特征冗余来减小特征表示所需的数据量。随着跨媒体数据的大量产生，对异构的多模态数据的处理和分析面临着巨大挑战。跨媒体多模态表征通过寻求在公共空间中表示不同模态数据的方法，使各个模态的数据能够在公共空间中相互比较。多模态表征从深度表征、迁移表征和紧凑表征出发，介绍了跨媒体多模态分析中数据驱动关联表征的问题。为了进一步提高模型效果，多模态建模方法利用多模态联合学习、注意力机制以及互补信息融合方式，从不同模态的数据信息对人类感知建立完整模型。多模态建模总结了联合学习、特征对齐和特征融合三种建模方式，揭示了多模态表示学习在多模态复杂信息环境中的机遇和挑战。

【7】

芯片安全研究进展与趋势

——CCF容错计算专业委员会&体系结构专业委员会

作者：叶靖、侯锐、沈海华、王喆、张吉良、苑风凯、李文杰、王文浩、张军、华宇、夏虞斌、李华伟、武成岗、李晓维、孟丹

芯片是构建信息系统的基石，芯片安全隐患是威胁信息系统安全的重要来源。本文从电路级和体系结构级两个层面分析总结了芯片安全的国内外研究现状，重点介绍了扫描链安全、物理不可克隆函数、硬件木马、硬件漏洞、处理器微体系结构安全、可信执行环境、内存安全、系统安全隔离等技术的发展现状与趋势。

【8】

人机物融合操作系统的研究进展与趋势

——CCF系统软件专业委员会

作者：郭耀、陈海波、胡春明、卜磊

操作系统是计算机系统中最为关键的一层系统软件。近年来，由于互联网、云计算、大数据、物联网等新型应用模式的迅速普及，各种面向新型应用模式的操作系统得到了广泛的关注。到了人机物融合的泛在计算时代，为了更好地管理人机物融合环境下的分布异构海量资源，同时为人机物融合的新型应用和服务提供支持，操作系统及相关技术正在产生许多重要的变革。本文首先简要回顾操作系统的发展历史，然后主要针对人机物融合时代操作系统在国内外的最新研究进展进行了总结和对比，并分析了在人机物融合时代操作系统面临的主要挑战和发展趋势。

【9】

源匮乏语言神经机器翻译的研究进展与趋势

——CCF自然语言处理专业委员会

作者：余正涛、文永华、线岩团、于志强、毛存礼、高盛祥

随着深度学习的快速发展和平行语料规模的不断扩大，神经机器翻译在资源丰富语言间的翻译质量不断改善，翻译效果已经接近或达到人工翻译的水平。神经机器翻译作为数据驱动型的机器学习方法，需要大规模、高质量的平行语料作为训练数据，因此在资源匮乏语言上的翻译效果还不够理想。双语平行资源匮乏是机器翻译面临的普遍问题，资源匮乏语言神经机器翻译已成为机器翻译领域的研究热点，具有重要的研究价值和应用前景。本文在分析资源匮乏语言机器翻译研究面临问题的基础上，重点从语料库扩展、半监督神经机器翻译、无监督神经机器翻译、多语言神经机器翻译和外部知识融合等五个方面介绍资源匮乏语言神经机器翻译的最新研究进展，最后对相关领域未来的发展趋势进行展望。

【10】

E级高性能计算机系统研制的挑战与机遇

——CCF高性能计算专业委员会

作者：卢凯、王睿伯、董勇、张伟、杨博、陆平静、张文喆、邬会军

高性能计算是科技创新体系的重要组成，是知识创新和技术创新的重要能力支撑，是新时期下与理论、实验并重的三大科技创新手段之一。近十年来，我国在高性能计算领域取得了跨越式的发展，高性能系统研制水平跻身国际一流行列。然而，我国高性能计算的发展还存在很多不足，特别是在自主芯片、领域工程软件平台、海量资源管理、以及新型器件方面还有待突破。本文立足当前国内外高性能计算发展现状和规划，对国内外下一步发展高性能计算的挑战和机遇进行了对比和分析，最终形成了一些发展高性能计算的对策和建议，希望能够对未来我国发展高性能计算相关领域提供一些指导和参考。

【11】

智能软件可靠性的研究进展与趋势

——CCF软件工程专业委员会

作者：陈雨亭、谢晓园、周宇、马雷

人工智能正在彻底改变人类的工作、学习、生活、发现和沟通的方式。智能软件是人工智能的重要载体，在不断为人工智能定义新的功能、效能与边界。但是，我们仍然频繁经历智能软件的缺陷和失败。一个重要的原因是人工智能和机器学习引起的软件开发模式的转变——使用机器学习和人工智能技术，大量规则会从训练数据中推理出来。编程范型、开发模式的转变使得对具有人工智能的软件的行为进行推理变得困难，对智能软件进行分析、理解、测试或验证也存在困难。

鉴于智能软件在我们的社会中发挥着越来越重要的作用，软件工程和人工智能领域都有必要研究和开发新技术以应对其可靠性的挑战——智能软件中智能算法的行为可能不正确，或者存在即使算法实现正确，而传统可靠性保障技术无效的情况。为求更好地保障智能软件可靠性，本文分析智能软件可靠性模型，并将其细分为数据可靠性、模型可靠性和平台可靠性等。进一步地，本文从保障技术和软件过程两方面出发，进一步厘清智能软件可靠性的保障机制和技术手段——国内外研究者提出大量针对智能软件的软件测试、调试、错误修复和形式化验证技术，解决人工智能引入的不确定性，提升智能软件产品的可靠性；工业界也定义机器学习工作流并将其集成至智能软件开发过程中，以从软件过程上保障智能软件可靠性。最后，本文将总结开发可靠的智能软件所面临的挑战、机遇以及发展方向。

【12】

人工智能系统的形式化验证技术研究进展与趋势

——CCF形式化专业委员会

作者：卜磊、陈立前、董云卫、黄小炜、李建霖、李钦、刘万伟、阮文杰、宋富、孙有程、王竟亦、吴敏、许智武、薛白、杨鹏飞、易新平、张立军、张民

随着深度学习技术在无人驾驶、智能制造、医疗诊断等安全攸关领域的应用，人们对人工智能系统的可信性提出了更高的要求，相关研究也被人工智能、形式化方法领域密切关注，并迅速成为研究热点之一。本文以人工智能系统的安全可信性为主题，从人工智能系统可信的内涵，验证、测试、模型抽象等方面介绍国内外面向人工智能系统形式化验证相关的最新方法与技术，并对该方向的发展趋势进行分析与总结。

【13】

元学习的研究进展与发展趋势

——CCF计算机视觉专业委员会

作者：孟德宇、束俊、左旺孟

元学习是近年来逐渐蓬勃兴起的新型机器学习研究方向，旨在解决机器学习方法论自动化构建与设置这一瓶颈问题。由于其在诸多应用任务上呈现出的强大应用潜力，这一研究方向吸引了越来越多领域学者的关注。本文旨在针对元学习进行研究进展综述及未来发展趋势分析。特别地，本文通过与传统机器学习的基本概念与内涵对比，对相应元学习的概念与内涵进行深入阐释，突出其相比传统机器学习的内在关联、演进思想及变革特征，并分析其在大数据、大模型、大算力的方面对机器学习基本执行模式可能带来的根本性推进与改善。本文的研究进展综述包含两个部分：一是将当前元学习常用的方法论尝试归纳总结为四种模式，分别介绍每种模式可能的思想动机根源及基本的执行特点；二是以计算机视觉为背景，介绍了元学习在小样本学习、网络结构搜索、学会优化等应用任务上的典型研究进展。最后，对元学习的国内外研究进展进行了简要的比较分析，并对该方向未来发展的趋势尝试进行了讨论和展望。

【14】

序列到序列语音合成的研究进展与趋势

——CCF语音对话与听觉专业委员会

作者：凌震华、吴志勇、江源、蒙美玲

序列到序列语音合成技术近年来得到了广泛的关注，本文主要介绍该技术的国内外研究进展和发展方向。基于注意力机制的序列到序列神经网络模型实现了机器翻译中不等长的源、目标语言文本序列之间的直接映射。受此启发，序列到序列语音合成模型通过注意力机制实现文本与语音的隐式对齐和映射，提升了语音合成的自然度。与机器翻译不同的是，语音合成中语音声学参数序列对文本序列的对应是严格单调的，然而不加限制的隐式时长模型建模会造成文本和语音对齐的误差，导致合成的性能受损。为提高序列到序列语音合成模型的稳定性，多种注意力机制被提出以更好地学习语音与文本之间的对齐，保证语音合成中声学参数序列生成时相对于文本序列的单调性、局部性。个性化、表现力语音合成对扩展智能语音交互场景具有重要意义，序列到序列神经网络模型较好的可扩展性为语音合成模型的个性化、高表现力、可控语音生成提供了可能。通过采用无监督学习、迁移学习的方法可实现对语音副语言信息的建模，进而实现序列到序列个性化、表现力语音生成。从理论及实际应用的角度来说，序列到序列语音合成仍有较大的提升空间：融合前端文本分析、后端语音波形信号恢复的完全端到端的语音合成模型将是未来重要的研究方向；在序列到序列合成模型中通过多种影响因子（副语言信息）的解耦合表征建模，提高语音生成过程中相关因子表达的可控性，对于实现更加灵活的个性化语音合成有重要意义；通过减少序列到序列语音合成模型的训练对于数据量及数据质量的依赖、降低模型的计算量来进一步提升模型的可用性，对于实现序列到序列语音合成技术在实际场景中的应用落地有重要意义。

【15】

区块链信息系统研究进展与趋势

——CCF信息系统专业委员会

作者：邢春晓、于戈、李庆忠、金澈清、李瑞轩、王鑫、张桂刚

区块链应用系统的普及是区块链技术成熟的重要标志。本文从体系架构、建模方法、存储管理、联邦计算、跨链互操作、隐私保护、链上链下融合、云边端融合八个方面对区块链系统的国内外现状及比较做了系统的分析。从区块链+数字金融、区块链+电子政务、区块链+电子商务、区块链+智慧医疗、区块链+智能制造以及区块链 +绿色农业几个方面进行了应用分析。最后，提出了区块链信息系统的发展趋势和展望。

【16】

网络信息安全智能技术与应用的研究进展与趋势

——CCF计算机安全专业委员会

作者：杨珉、张磊、荆继武、刘欣然、胡传平

本文从网络信息安全智能技术与应用的研究进展与趋势这一角度出发，回顾和阐述近几年国际和国内相关的网络安全智能技术的研究工作，详细分析信息安全新技术和新应用的发展，并结合我国实际情况针对网络安全的未来研究提出几点启示和展望，以帮助国内科研工作者迎头赶上国外相关研究。具体来说，本文分别从系统安全漏洞智能挖掘技术、安全防护与补丁检测技术、网络攻击及检测技术、人工智能及其安全等5个角度对相关工作进行整理和比较。经过详细对比分析，本文发现，国内研究目前已在部分关键技术领域取得突破，在国际顶级会议上发表了一批高质量论文。但是，与国外研究相比，国内研究起步较晚，其研究成果也一般较为分散，在某一领域内的数个方向上均有少数研究。值得一提的是，国内有关人工智能及其安全的研究虽然数量不多，但是已经基本可以涵盖该领域的关键方向，且已经有部分高质量论文发表。这表明，我国人工智能及其安全已经表现出克服起步晚这一困难的趋势，相信在不久的未来，会涌现更多高质量研究成果。

点击CCF数字图书馆，会员可浏览《发展报告》详细内容。

<<< 上一篇【预告】TF34：工业互联网安全前沿与技术热点

CNCC回看开启！下一篇 >>>

<<< 下一篇 CNCC回看开启！