国产超算编程模型研究取得进展。高性能计算应用的性能可移植性,是应对异构架构演进的关键。近期,中国科学院计算机网络信息中心等在国产超算编程模型研究方面取得进展,自主研发出面向神威异构架构的性能可移植后端——swKokkos。
针对神威处理器独特的硬件约束,研究团队通过引入并行执行抽象,实现了源代码到二进制级别的性能可移植,降低了超算应用的开发与迁移成本。科研人员在swKokkos中引入了向量化哈希索引与FDSL快速调度库,降低内核启动开销;同时,提出分块并行映射算法,进一步提升负载均衡与缓存利用率。swKokkos在AXPY、数值求解器等任务中性能达原生Athread的99%以上,还能支撑海洋模型LICOM超10万核规模的稳定模拟并实现加速。
相关研究成果被系统软件领域国际学术会议EuroSys 2026录用。研究工作得到了国家重点研发计划、中国科学院战略性先导科技专项等的支持。
swKokkos示意图
研究团队单位:计算机网络信息中心

