特殊形势下,CCF YOCSEF深圳分论坛积极响应国家号召和CCF总部要求,首次尝试用线上会议的形式举办,吸引线上听众超1000人。
“联邦学习”线上首秀火爆
“联邦学习”的火爆从2019年持续到了2020年。联邦学习是现在人工智能研究中数据孤岛问题的新解决方案。2020年3月21日,由CCF主办,CCF YOCSEF深圳分论坛承办的“联邦学习:人工智能的最后一公里?”线上论坛成功召开。
本次论坛由中国人工智能开源软件发展联盟副理事长、平安科技副总工程师、联邦学习技术部总经理、资深人工智能总监、CCF高级会员、CCF深圳分部秘书长王健宗博士,哈尔滨工业大学(深圳)、YOCSEF深圳AC委员蒋琳教授,以及微众银行人工智能高级研究员张天豫担任论坛执行主席主席,平安科技高级算法工程师、YOCSEF深圳委员何安珣担任线上主席。
论坛嘉宾有香港理工大学教授、计算机系副主任郭嵩老师,中国银联电子商务与电子支付实验室研究员周雍恺老师,平安银行 AI 算法团队负责人潘鹏举老师,中兴网信联合创始人、中国智慧城市论坛实战专家张志刚老师,香港大学教授、金融技术和区块链实验室主任姚兆明老师,以及新加坡南洋理工大学计算机科学与工程系于涵教授,进行了“联邦学习”相关的交流探讨。
2020 CCF YOCSEF深圳线上论坛的分享嘉宾
嘉宾分享,干货满满
论坛第一位嘉宾是来自香港理工大学的计算机系副主任——郭嵩教授,他带来的演讲是《突破智能瓶颈:基于边缘计算的联邦学习挑战与展望》。郭嵩教授与大家分享了联邦学习前沿的研究成果,他从云到边的智能化趋势出发,引入联邦学习共享和移动云数据概念,面对数据隐私问题和数据实时性要求,提出联邦学习可以在移动设备和多组织参与下整体训练模型。同时,郭教授针对系统异构难协同、数据维度和数量的分布失衡难训练,以及安全难保护这三处挑战,介绍了研究成果。最后,郭教授对未来趋势进行了展望,探讨了关于如何面向多性能无线通信环境实现联邦学习协同传输优化,如何模型压缩与放置,以及如何设计激励机制等问题。
郭嵩教授的线上演讲主题
《突破智能瓶颈:基于边缘计算的联邦学习挑战与展望》中的内容展示
第二位嘉宾是中国银联电子商务与电子支付实验室研究员——周雍恺,他带来的演讲题目为《银联关于联邦学习的探索与实践》的主题演讲。他介绍了金融行业数据合作的现状和大数据智能场景下的联邦学习,从联邦学习的实用角度上,指出联邦学习是多方安全计算在AI学习中的场景应用,讲解了联邦学习在多方安全计算的具体应用:在联邦学习的工程实现方面,联邦学习平台的构建可基于分布式AI平台以及安全的算法模块,依托不同的安全场景与风险偏好,综合考量了安全与性能问题,从多方安全计算过渡到内外部数据的治理。最后,他对银联在联邦学习的应用—小微企业信用评估,以及银行在联邦学习标准的推进进行了展望与探索。
周雍恺的线上演讲主题
《银联关于联邦学习的探索与实践》中的内容展示
第三位嘉宾是平安银行 AI 算法团队负责人——潘鹏举,他的演讲题目为《联邦学习在金融领域的实践》。潘总为参会者介绍了联邦学习在金融领域的一些应用场景,从工业界角度来看联邦学习是如何解决数据孤岛问题的,是如何面对“拥有大数据,使用小数据”挑战的,同时他也详细分享了联邦学习在集团内的系统架构及应用案例-蜂巢平台。最后,他提到一些落地过程中存在的问题和碰到的阻碍,希望学术界和工业界能够共同来探索如何更好地解决问题,帮助行业更好地发展。
潘鹏举老师的线上演讲主题
《联邦学习在金融领域的实践》中的内容展示
第四位嘉宾是来自中国智慧城市论坛实战专家——张志刚。他在《“联邦学习必然是智慧城市下一个风口”-“新基建”中智慧城市及联邦学习机会》报告中分享了如何解决大量智慧城市数据共享问题,如何解决智慧城市系统重复建设资金难题问题,以及如何提供给更多独角兽企业更多安全的数据问题等内容。同时,他还介绍了基于物联网架构的智慧城市模型,并引出联邦学习这一解决思路及相关应用案例。
张志刚老师的线上演讲主题
《联邦学习必然是智慧城市下一个风口》中的内容展示
第五位嘉宾是来自香港大学的姚兆明教授,他演讲的主题是《Federated machine learning: Privacy of training data guaranteed?》。他提到,联邦机器学习可以安全的分布式机器学习提供了一些启示,以便不同的参与方可以贡献他们的训练模型,从而为应用程序共同构建一个更全面的学习模型。在本次演讲中,姚教授深入浅出,为大家讨论了FML的隐私问题,并指出了处理此隐私问题的可能方向。
姚兆明教授的线上演讲主题
《Federated machine learning: Privacy of training data guaranteed?》中的内容展示
最后一位嘉宾来自新加坡南洋理工大学计算机科学与工程系的于涵教授。他演讲的题目是《建立联邦学习激励机制研究体系的一些尝试》。联邦学习长期健康的发展需要持续吸引拥有高质量数据的参与方加入,共建模型,共享利益。而这同时也会给怀有不良目的的参与方刺探隐私数据及攻击联邦模型提供机会。他提到,关于如何建立一套体系来有效激励可信赖的行为模式,并管控风险对联邦学习生态建设至关重要。同时,他跟大家分享一些在不泄露隐私数据的情况下测定数据质量、不同参与方面对激励策略反应的一些研究进展,并跟大家探讨监管机构在这样一个体系中应该发挥的作用。
于涵教授的线上演讲主题
《建立联邦学习激励机制研究体系的一些尝试》中的内容展示
本次论坛围绕联邦学习打破“数据孤岛”,解决用户数据隐私保护,促成新商业模式和标准化规范机制等一系列关键问题进行了交流和探讨,同时各位执行主席也分别为六位分享嘉宾线上颁发了感谢牌,论坛嘉宾分享取得圆满成功!
2020 CCF YOCSEF深圳线上论坛的嘉宾感谢牌
思辨满堂,精彩纷呈
为进一步加深对联邦学习技术和应用场景的理解,本次线上论坛设置了思辨环节,由三位论坛主席集结六位分享嘉宾,并邀请各线上与会者,共同参与到这一环节。思辨环节提出三个讨论主题,分别为:联邦学习是新瓶装旧酒吗;联邦学习的产业化落地难点;搭建联邦学习的完整生态,论坛希望通过思辨环节的碰撞促进大家对联邦学习的深入理解与思考。
在第一个讨论主题中,关于现有隐私保护技术能否直接解决联邦学习中用户数据隐私的新需求问题,以及现有指标的新增隐私需求能否在联邦学习中得到有效平衡问题,各位嘉宾及相关专家,各抒己见。其中,于涵教授指出:各大型公司在同态加密下会存在较大的计算,而通过不加密方式,如编码方式压缩来计算将大大降低运算量,从而实现隐私保护,这是一种新的技术路径;姚兆明教授观点为:MPC中乘法运算的难点,需要寻找efficiency和accuracy的平衡,目前已经有相关的研究出来,大家可以往这方向去寻找解决方案。另外,信工所的陈小军教授也提到,编码方式和准确性存在矛盾,传统上认为共享梯度会泄露隐私,而编码会减少计算开销,而离线方式同样也是减少计算开销的方式。
线上论坛的讨论主题一
在第二个讨论主题中,各位专家关于联邦学习落地的更大难点是在工程还是场景上发表看法。其中,张志刚表示,当前在智慧城市方面,存在许多可以落地的场景,但在工程方面的落地是最为困难的,如发达地区模型和偏远地区模型差异巨大;郭嵩教授也表示,目前企业需求非常大,而标准化的成功制定与推行,将会在未来更好地帮助联邦学习在企业场景中落地。
线上论坛的讨论主题二
在第三个讨论主题中,大家对联邦学习平台是否开源,以及是否需要激励机制的问题展开激烈讨论。其中,姚兆明教授的观点指出,在安全的基础上,建议开源,以更好地消除工程化的潜在风险。范韬博士也表示:开源可以使产品持续迭代,实现软件创新,同时也希望以此使更多的人能了解联邦学习,获取企业合作机会,完善联邦学习的生态。另外,张天豫讲到,使用联邦学习需要建立在共同目标的基础上,结合价值与影响力等相关利益,以及评估数据集对模型的提升贡献,如精度提升、数据量等,以此明确贡献度,达成利益分配及相关激励。
线上论坛的讨论主题三
结语
在大数据时代,数据就意味着价值,数据已成为了互联网企业和科技企业生存和发展的基础性问题。想要通过机器学习做出足够精准的决策,充分利用信息资源,仅仅使用一方的数据资源效果往往并不理想,不同资源方的数据整合可以充分利用信息资源,挖掘数据价值。本次论坛讨论的联邦学习正是为人工智能的发展指明了新方向,从而构建和谐、健康和可持续发展的数据新生态。