返回首页

联手数据库专委会:“数据治理”术语发布 | CCF术语快线

阅读量:68 2021-10-29 收藏本文

本期发布术语热词:数据治理(data governance)。


开篇导语:


本期发布术语热词:数据治理(data governance)。大数据时代,数据的重要性不言而喻,而海量数据带来了数据从生产到消费全周期的技术、管理等方面的挑战。因此,数据治理是管理以及应用大数据的重要手段。


数据治理(data governance)

作者:李国良(清华大学)


InfoBox:

中文名:数据治理

外文名:Data Governance

学科:数据科学 信息管理 管理学 社会科学

实质:数据治理是在一定的组织范围内,依托制度法规、标准规范、应用实践和支撑技术对数据进行全生命周期的数据确权、质量管理、安全控制、隐私保护、开放共享、交易流通和分析处理。数据治理的目标是为了提高数据的可用性、安全性、流通性,激活数据资源的价值,发挥数据资源的经济和社会效益。


背景:

随着信息技术的飞速发展,数据每时每刻都被生产、传输、存储、分析和处理,数据作为一种数字资源,已经在许多行业产生了巨大的经济和社会效益[1]。2019 年 10月31日,党的十九届四中全会在《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》中明确数据作为生产要素需参与社会分配[2]。


因此,数据作为基础性战略资源的地位也日益凸显[3],为了解决数据在从生产到消费全生命周期的数据确权、质量管理、安全隐私、流通共享、组织管控、分析处理等环节带来的新挑战,数据治理的概念应运而生。


概念:

对于数据治理的内涵理解,目前尚未达成共识,不同组织从组织特点、数据特征、治理目的等不同视角理解数据治理的内涵[3,4,5,6,7]。在宏观层面,数据治理依托制度法规、标准规范、应用实践和支撑技术的建设,在国家、行业和组织三个层次进行数据全生命周期的数据确权、质量管理、安全控制、隐私保护、开放共享、交易流通和分析处理[4]。在狭义层面,数据治理是指组织为确保数据可获性、所有权、完整性、安全性和可用性所采取的措施及其整体管理。美国国家标准技术研究院对数据治理的定义是:确保数据资产在整个企业中得到正式管理的一组流程[7]。


总的来说,数据治理的目标是为了提高数据的可用性、安全性和流通性,激活数据资源的价值,发挥数据资源的经济和社会效益[5]。


核心问题:

数据治理不仅是一个技术问题,也是一个管理问题。实现数据治理的目标,需要社会多方的共同参与统筹共建覆盖全社会的数据治理体系,包括了制度法规、标准规范和技术体系的建设。


从宏观层面来说,政府需要做好构建数据治理体系的顶层设计和战略部署。政府研究出台相关的法律法规,为数据确权、安全、隐私、流通、交易和使用提供制度保障;政府应当有序开放政务数据,促进数据的开放共享。各行业应根据行业特性制定相应的数据治理规范,盘活数据经济的同时保障好个体的权益。各组织应明确数据治理的目标、权责和方案,通过数据治理,发挥数据的资产属性,并应用于能够将数据作为企业的宝贵资产应用于业务、管理和战略决策中。


从技术层面来说,数据治理涉及到数据的获取存储、质量管理、风险控制、隐私保护、开放共享、交易流通和分析处理。针对复杂多变的应用场景和不同主体的需求,亟需为数据治理提供一个技术保障。例如,在质量管理阶段,需要引入低延迟、低成本和高效的数据清洗和监控算法进行数据清洗和质量管理[8];在数据开放共享的阶段,诸如安全多方计算、同态加密、联邦学习等技术研发可以在保护数据隐私和降低风险的前提下实现数据的开放融合利用[3,9]。然而,目前针对数据治理各个阶段的技术解决方案依然存在普适性低和场景受限等缺点,不同方案之间存在不兼容的问题[10],该问题受到广泛关注。


参考文献:

[1] IDG. Worldwide Big Data and Analytics Spending Guide. https://www.idc.com/tracker/showproductinfo.jsp?containerId=IDC_P33195
[2] 中共中央关于坚持和完善中国特色社会主义制度,推进国家治理体系和治理能力现代化若干重大问题的决定[N]. 人民日报,2019-11-06(001).
[3] 梅宏. 大数据发展现状与未来趋势[J].交通运输研究,2019,5(05):1-11.
[4] 梅宏. 大数据治理成为产业生态系统新热点[J]. 领导决策信息, 2019(5): 26.
[5] What is data governance and why does it matter?. https://searchdatamanagement.techtarget.com/definition/data-governance
[6] IBM. What is data governance? https://www.ibm.com/analytics/data-governance
[7] NIST. https://csrc.nist.gov/glossary/term/data_governance
[8] Xuanhe Zhou, Chengliang Chai, Guoliang Li, Ji Sun. Database Meets AI: A Survey. IEEE Transactions on Knowledge and Data Engineering (TKDE) 28(9): 2296-2319 (2020).
[9] Wu, Dan, et al. "How data governance technologies can democratize data sharing for community well-being." Data & Policy 3 (2021).
[10] Ladley, John. Data governance: How to design, deploy, and sustain an effective data governance program. Academic Press, 2019.

术语工委及术语平台介绍:

计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。


术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。


新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入知识图谱的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。

微信图片_20230410125847



计算机术语审定工作委员会

主任:

刘挺(哈尔滨工业大学)

副主任:

王昊奋(同济大学)

李国良(清华大学)

主任助理:

李一斌(上海海乂知信息科技有限公司)

执行委员:

丁军(上海海乂知信息科技有限公司)

林俊宇(中国科学院信息工程研究所)

兰艳艳(清华大学)

张伟男(哈尔滨工业大学)

640 (1)