大模型芯片设计关键技术及其应用 | CCF数图焦点 第36期
点击图片可以浏览本期详细内容
编者寄语
在大算力、大数据和精巧的网络结构共同作用下,大模型在自然语言处理、计算机视觉和声音处理等众多领域取得了令人瞩目的成就,是继知识图谱之后人工智能技术发展的新高峰。
大模型的计算过程主要分为训练和推理两个步骤,它们对于算力的侧重点不太一样。模型训练侧重于整体吞吐,需要大规模、高扩展性、低能耗的分布式计算集群,而推理侧重于延迟,在算力方面需要强大的计算芯片,高速的内存访问技术。这种算力需求在深度学习和大模型流行之后呈指数级增长,对于硬件的算力提出了巨大挑战。因此,关于大模型芯片架构设计及其应用成为了近年来的研究热点。
本次专题特将CCF数字图书馆相关报告视频和文章资源进行聚合,方便会员集中观看学习,也为读者探索大模型芯片设计与应用抛砖引玉。
目录
本期主编:
刘伟强 南京航空航天大学、CCF数图编委
贾天宇 北京大学
杜 力 南京大学
李 鹤 东南大学
陈 辉 南京航空航天大学
往期回顾
<<< 上一篇
形式化方法赋能计算机其他领域|数图焦点第39
<<< 下一篇 逾千场活动如何选?CCF活动日历助你高效规划