中山大学虞志益、王明羽团队:第57届国际微架构会议中发表针对GPGPU存储架构取得重要进展的研究报告
2024年11月2日至6日,第57届国际微架构会议(The 57th Annual IEEE/ACM International Symposium on Microarchitecture, MICRO)在美国德州奥斯汀召开,微电子科学与技术学院院长虞志益教授领导的智能计算团队提出的面向GPGPU存储一致性缓存架构研究的相关工作被该会议录用并作口头报告。
这一成果的发表,标志着我院在GPGPU体系结构和存算一体架构研究领域取得重要进展,亦是中山大学首次以第一完成单位在MICRO上发表论文。
本论文得到了国家自然科学基金重大研究计划和广东省自然科学基金等项目支持。论文指导教师兼通讯作者是我院王明羽副教授,第一作者是我院21级博士生张奕聪。值得庆贺的是,本论文的发表恰逢我校百年校庆来临之际,也是智能计算团队为我校百年校庆的献礼。
内容摘要
本论文主要针对GPGPU存储系统中的数据同步和原子操作效率等问题,提出了一种原子缓存(Atomic Cache),以促进GPGPU的内缓存计算硬件-软件协同设计。在软件层面,提出基于非排序交换的放松存储一致性模型,以减轻存内原子操作的执行,从而降低内存屏障的性能开销。在硬件层面,提出原位存储原子缓存电路,使得原子缓存能够高效地在缓存阵列内执行原子逻辑和算术操作。这些创新的优势体现在放宽对顺序一致性(SC)的严格要求可以避免内存屏障带来的性能损失,促进在原位存储SRAM阵列内高效执行原子性存内算术和逻辑计算可以缓解由原子操作序列化执行引起的冯·诺依曼瓶颈。实验评估结果表明,原子缓存在节省超过60%的内存访问能耗的同时,仅增加9.42%的芯片面积开销。此外,它不仅为基准GPGPU提供了平均2.59倍的加速比和1.48倍的IPC性能提升,还与采用本地原子缓冲区的最先进设计相比,实现了平均1.31倍的加速比和39.92%的IPC性能提升。
图1:原子缓存整体架构
图2:原位存储原子缓存宏架构
会议简介
由电气电子工程师协会(IEEE)和美国计算机学会(ACM)共同举办的微架构国际研讨会(MICRO)是最具影响力的体系结构领域顶级会议之一,被公认为与ISCA、HPCA、ASPLOS并列计算机体系结构四大顶会,其中,MICRO是这四大会议中历史最悠久的会议,并且MICRO 还与ISCA作为两大会议入选中国人工智能学会(CAAI)认定的智能芯片与计算机系统领域的A类会议,同时也是中国计算机学会推荐的计算机体系结构/并行与分布计算/存储系统领域的A类会议。自1968年创办以来,截至2024年,前56届MICRO会议总共收录论文2236篇,其中中国大陆高校、科研机构和企业总共发表论文仅有78篇,占比不到5%,而高校发表则更少,MICRO仍是我国学者需要重点关注突破的顶级会议之一。