特邀讲者


图片

黄帅

亚马逊资深技术专家


主题:《云原生数字免疫创新的初探》


主题简介:随着云带来敏捷性和易用性,加速了新产品研制和上线发布,而越来越多的困扰却是投入生产的信心在逐步下降:大规模分布式系统和微服务架构的快速发展,大大提升了系统的复杂性,生产中每一次失控都带来惨重的损失。企业在确保系统韧性、加速交付、安全性和可靠用户体验方面,面临前所未有的挑战。这恰恰涵盖了多个技术领域:服务稳定性治理、韧性工程、可观测性管理和安全防护等,而提高产品、服务和系统的韧性(Resilience),成为了降低业务风险的第一要务。云原生数字免疫创新的初探,从实战的角度,结合可观测性、混沌工程、服务自愈、SRE和应用安全等多项技术,通过增强应用系统的韧性自愈能力,能够提早发现潜在的风险,在故障和事件中快速恢复,并在关键系统遭受严重故障时,降低业务风险。


个人简介:在软件研发领域拥有十五年架构设计、分布式系统稳定性建设、安全运维以及团队管理经验,自2018年以来推动亚马逊全球混沌工程服务落地,混沌狨书《混沌工程:复杂系统韧性实现之道》合译者,目前是亚马逊资深技术专家兼安全经理。




图片

殷成文

PingCAP混沌工程负责人


主题:《混沌工程与自动化诊断》


主题简介:故障总是无法避免的,混沌工程帮助用户直面故障。在故障发生时能快速、高效地确定故障点和原因当然重要,更进一步如果能提前预警,阻止故障的发生,那就更加理想。本次分享从混沌工程出发,分享在 PingCAP 探索混沌工程和自动化诊断的历程中,如何将混沌工程和自动化诊断相结合,相辅相成,更好帮助改善系统的稳定性问题。


个人简介:现任 PingCAP 混沌工程团队负责人,CNCF 开源项目Chaos Mesh 发起人和维护者。主要负责TiDB Cloud 稳定性治理,自动化诊断,推动混沌工程落地和推广工作。曾多次在 KubeCon 和国内云原生相关会议发表 Chaos Mesh 以及混沌工程相关演讲。同时担任信通院分布式系统稳定性实验室高级专家、可信云稳定性标准专家等。




图片

王相

Shopee 技术专家


主题:《应用级混沌工程实践》


主题简介:故障注入是混沌工程的核心,目前主要的方式为模拟外部环境故障。然而这种方式的成本较高,且故障的粒度较粗。本次分享主要围绕应用级的故障注入,即将混沌工程直接添加到应用程序中,以一种快速、简单且有趣的方式来增加对系统稳定性的信心。分享内容包括 Golang failpoint 以及 Chaos Mesh 的介绍,并且以 TiDB-DM 为例,探讨如何对应用内部进行故障注入。


个人简介:硕士毕业于中国科学技术大学,目前在 Shopee 公司担任技术专家,从事数据库数据传输服务(DTS)的开发。曾就职于 PingCAP 公司,主要负责开源数据库 TiDB 生态工具(TiDB-Binlog && TiDB-DM)以及混沌工程平台 Chaos Mesh 的研发。曾翻译《混沌工程:通过可控故障实验提升软件系统可靠性》,机械工业出版社2023年出版。




SIG主席



图片

朱少民

CCF TF软件质量工程SIG主席,同济大学特聘教授


个人简介:近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和4本译作,代表作主要有《软件质量保证与管理》、《软件测试方法和技术》、《全程软件测试》等,并经常在国内外学术会议或技术大会上发表演讲,曾任思科(中国)软件有限公司QA高级总监、IEEE ICST 2019工业论坛主席、IEEE ICST、QRS和DSA、NASAC程序委员、《软件学报》审稿人等。