分论坛 > 上海 > 新闻动态
闪存可靠性问题任重道远,一线专家共聚线上研讨应对策略
2021-12-20 阅读量:667 小字

2021121814:00-17:00CCF YOCSEF上海邀请了来自高校和企业的嘉宾,以“新一代闪存存储可靠性问题路在何方?”为主题展开了一次线上技术论坛,目的是集中专家力量,讨论闪存的可靠性问题。首先,CCF YOCSEF上海主席蒋力的致辞为本次论坛拉开了序幕。


在第一个技术报告环节中,中国科学院微电子研究所王颀研究员的报告题为《三维NAND闪存选择性重编程及高效重读纠错算法研究》,国家海外青年特聘专家,山东省杰出青年基金获得者,山东大学信息科学与工程学院教授陈杰智的报告题为《三维闪存可靠性特性研究及优化策略》,得一微电子(YEESTOR)闪存部门经理叶敏的报告题为《3D NAND Flash的失效表现》,深圳大普微电子科技有限公司研发经理杨颖的报告题为《企业级SSD可靠性的特点和验证方法思考》,最后,NplusT CEO Tamas Kerekes报告题目为《NAND Characterization for ONFI 5 and Beyond》。


五位嘉宾从闪存可靠性特征、失效表现和验证方法等多个维度展开研究,介绍了目前三维闪存已经步入超高密度,超大容量的时代,随着尺寸缩小、堆叠层数增加所带来的严重的可靠性下降问题,从介质材料发展存在的挑战,选择性重编程、纠错算法等闪存控制器算法优化,消费级和企业级闪存盘在实际应用时存在的可靠性特点和失效表现进行探讨,为听众带来了一场关于闪存可靠性问题的探讨以及未来闪存部署过程中应该面临的挑战和解决方案的探索。


为感谢各位嘉宾的精彩分享,CCF YOCSEF上海为他们分别颁发了电子感谢牌。



第二个环节是思辨环节,为提升论坛互动和讨论氛围,此环节采用了报告嘉宾+特邀嘉宾+在线举手参与的听众的形式。三位特邀嘉宾是来自华中科技大学的博士后张猛,哈尔滨工业大学的博士生冯骅以及华东师范大学的博士生吕熠娜。


在思辨环节中,论坛抛出了三个思辨话题:

问题一:闪存的可靠性问题真的很重要吗?

问题二:当前闪存的可靠性的主要挑战是什么?

问题三:在实际部署中,闪存可靠性的问题如何规避?


围绕这三个问题,与会者展开了热烈讨论。

嘉宾一的观点:闪存的可靠性问题存在且很重要。这是因为在各个层级上,器件,算法,电路,系统有了很多可靠性解决方案。王老师指出跨层级设计非常重要。而闪存的可靠性挑战主要来自材料,堆叠层数的增加,每一层厚度减小,直接影响存储元的存储电荷量。那么在器件层面是否有可靠性退化。在谈到对闪存实际部署时,需要考虑数据特征。另外,针对不同的应用场景,例如企业级产品需要保证温度的均匀性。在消费级产品,需要保证关键数据的备份。目前分级存储方案可以考虑。


嘉宾二的观点:只要使用闪存,那么可靠性问题就非常重要。从目前的市场需求来看,用户层面和闪存制造商所考虑的可靠性侧重点不同,生产厂商注重从器件电路设计来解决。而用户角度来看只要数据不丢失就可靠。因此建议应该实现从底层到顶层都可靠性。而在谈到闪存可靠性挑战时,陈老师指出主要来自对底层技术不了解。可靠性是器件工艺本身存在的,可靠性在系统层面的挑战在于如何基于底层技术发展,如何把握底层可靠性特点,然后针对性优化。归根结底就是要实现协同优化。在针对闪存的实际部署时,需要考虑数据的特征和应用场景。


嘉宾三的观点:在可靠性这一块是分层次的,工业级对可靠性要求很高,而对可靠性要求越高,成本越高。消费级则没那么高,且不考虑击穿等问题。工业级和企业级对可靠性要求很高,可能需要加RAID机制,还对存放什么数据有关。当谈到闪存可靠性挑战时,需要操作系统告诉底层哪些数据的可靠性需求较高,那么将这类数据存放在更可靠性的盘上。如果能把数据准确分开,将数据的可靠性需求考虑进来会对闪存可靠性解决很有帮助。


嘉宾四的观点:闪存对存储来说是底层基础,企业是基于可靠性进行分析的,有了底层的可靠性,上层应用和生产厂商可以基于可靠性做相应的方法。上层应用厂商使用量和性价比就会更高。在实际部署时,对于企业存储会选择分层,元数据采用SCM产品,下层部署TLC产品,来满足不同的应用需求。


嘉宾五的观点:闪存可靠性问题很重要。数据存储最基本的要求就是可靠,如果数据存储的可靠性不能保证,闪存存储容量即使做得再大,密度再高,性能再好也没有意义。对于消费级,尤其是军事、航天领域,因为可靠性导致重要资料的丢失会带来损失。解决闪存可靠性是未来闪存发展中必须解决的重大基础问题。可靠性挑战来源闪存发展中,带来的电子泄露、读写干扰、温度等多种因素的影响。最终可以归结为噪声影响,阈值电压分布影响以及原始误码率情况。


嘉宾六的观点:闪存可靠性涉及数据安全。企业级用户更注重可靠性,例如采用磁盘阵列和异地存储等措施。数据中心和企业级用户的存储设备工作关键更加安全,可靠性容易维护。消费级产品可靠性维护难度高,各个用户的使用环境和习惯不同,另外还要关注性价比。当聊到闪存可靠性挑战时,冯博指出高密度和高性能一直是闪存的发展方向,随着闪存密度的提升,闪存读取窗口迅速降低,对电荷波动更加明显。即使增加堆叠层数,也不能降低位密度生产成本,因此闪存可靠性问题制约其向更高密度发展。


嘉宾七的观点:从介质特征角度出发,讨论目前闪存存在严重的制程差异。这主要体现在闪存块间差异、层间差异以及页面之间可靠性差异,因此在现有的闪存控制器算法下,闪存是否可靠性取决于数据存放在闪存的哪个位置,有的时候相对可靠,有的时候又相对不可靠。因此,闪存制程差异在解决可靠性问题时需要考虑进来。吕博指出可靠性挑战在于介质发展中氧化层逐渐变薄,导致电子泄露以及严重的读写干扰等问题。即便是将闪存应用在读密集型场景下,也会因为都干扰导致数据频繁重写,带来寿命的显著下降。因此,需要设计更加智能的FTL算法来综合考虑上层应用行为特征,数据特征等,以及应对底层可靠性变化,从而在闪存控制器内部做出相应算法优化。


在思辨环节,线上的听众纷纷提问,对本次论坛的问题进行了热烈的技术碰撞和交流。与会嘉宾认为闪存的可靠性问题任重道远,未来需要结合场景、负载、控制、材料等多个角度展开深入的研究。本次技术论坛在与会嘉宾与听众的热烈讨论中圆满结束。

 

本次会议同时在线参会人数近90人,在华东师范大学理科大楼B613设立的线下分会场有11人。论坛执行主席是CCF YOCSEF上海副主席石亮,CCF YOCSEF上海副主席林榕以及CCF YOCSEF上海 AC委员徐佳。参会的上海AC委员有李晋国,吕东全,徐佳,张楚炜,刘通,卢暾,裴颂文,林榕,张波,蒋力,陈晴,黄泽良,李洋。


延伸阅读
存储遇到真爱(AI)——智能存储技术论坛| CNCC2021
CNCC2021【智能存储】技术论坛将于【2021年10月30日下午13:30-17:30】在深圳国际会展中心【CC202A】召开。论坛邀请了8位学术界和工业界专家,探讨人工智能技术在非易失存储、键值存储、高性能计算等前沿领域应用和云存储企业在智能化方面的实践,从学术和产业角度进行深入探讨。
2021-10-19
物联网智能技术与系统(AIoT) | CNCC2021
CNCC2021【物联网智能技术与系统(AIoT)】技术论坛将于2021年10月29日13:30-17:30在深圳国际会展中心媒体室2C召开。共邀人工智能与物联网领域的知名专家学者与产业精英,对物联网与人工智能技术融合所面临的科学问题、技术挑战和科研机遇进行分享和思想碰撞。
2021-10-16
全是干货!云边协同的智能存算融合技术与系统论坛 | CNCC2021
CNCC2021【云边协同的智能存算融合技术与系统论坛】技术论坛将于2021年10月28日13:00-16:00在深圳国际会展中心CC202A召开。
2021-09-09
全是干货!云边协同的智能存算融合技术与系统论坛 | CNCC2021
CNCC2021【云边协同的智能存算融合技术与系统论坛】技术论坛将于2021年10月28日13:00-16:00在深圳国际会展中心CC202A召开。
2021-09-09
CCF宁波成功举办2019智能互联安全论坛
11月30日,由CCF主办,CCF宁波承办的2019智能互联安全论坛在宁波东港喜来登酒店隆重召开,共有168位会员和嘉宾出席。
2019-12-09
CCF YOCSEF 武汉: 中国大力发展AI芯片是拔苗助长还是稳中求进?
20:10-20:20 特邀嘉宾发言 20:20-20:50 中国大力发展AI芯片是拔苗助长还是稳中求进? 20:50-21:00 总结&合影 特邀嘉宾: 谭章熹 博士 谭章熹博士,毕业于清华大学电子工程系和计算机系,并获UC Berkeley博士学位,师从David Patterson教授。
2018-10-12
热门动态
2018-07-31
CCF YOCSEF 上海分论坛于2018年7月23日晚在上海交通大学徐汇校区...
2018-07-14
人工智能(AI)在理论、技术和应用等方面得到学术界、产业界、教...
2018-07-11
CCF YOCSEF上海分论坛于2018年7月6日晚上在上海市黄浦区洛克外滩...
CCF聚焦