公有云中存在大量基于x86服务器构建的带状态网络中间设备和虚拟化网元。随着上云需求的不断增长,云厂商通过堆叠x86服务器横向扩展算力的方式提升网络设备的流量处理能力。然而,由于CPU单核性能发展的迟滞,公有云中频繁出现因为多条大流被网卡哈希到单个CPU核所导致的设备流量过载现象。当单个CPU核被少数租户的大流打爆时,该CPU核上的其它租户流量也将产生丢包,从而影响这些租户的网络体验。考虑到网络流量增长速率远超摩尔定律多年,CPU单核过载问题将持续影响公有云租户的性能隔离。本报告将从可扩展的大流识别、对端侧租户透明的大流反压、使用可编程交换机卸载CPU处理任务三个维度介绍云网络设备流量过载保护方向面临的挑战和最新研究进展。