简单来说,这套系统 1 分钟的计算能力,相当于全球 72 亿人同时用计算器不间断计算 32 年;如果用 2016 年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于 200 多万台普通电脑。
说起超级计算机,我们熟知的可能是天河二号,在全球的超算中心军备竞赛中,天河二号多次成为世界第一。
6 月 20 日,德国法兰克福国际超算大会(ISC)公布了新一期全球超级计算机 TOP500 榜单,由国家并行计算机工程技术研究中心研制的 “神威 · 太湖之光” 以近三倍于第二名的运算速度夺得第一。对了,第二名就是天河二号。
这一次更新的超级计算机 TOP500 榜单中,来自中国的超级计算机有 167 台,超过了美国的 165 台,成为名符其实的超算大国。太湖之光由 40960 个节点(处理器)构成,每个节点包含了 260 个核心,总共 10649600 核心。
由于之前中国超级计算机的名片是天河二号,这一次“神威 · 太湖之光”突然登顶,出乎很多人的意料之外,而随着这个超级计算机一起露面的,就是这个众核处理器申威 26010。“神威 · 太湖之光”除了运算速度成为世界第一外,它的突破性意义还在于,这个超算中心的 CPU 实现了全国产,申威 26010 处理器来自上海江南计算所,单个处理器有 260 个核心。
不过还尚不清楚这块国产处理器的制程工艺是多少纳米,但有消息称,下一代的申威处理器将会采用 28nm 工艺,同样是国产的飞腾处理器也有 28nm 的流片出现,这意味着国产芯片开始准备进入 28nm 工艺时代。
这和英特尔以及三星在去年投产的 14nm 工艺之间还隔着差不多两三个代际的差距,追赶之路还很漫长。不过依靠着碾压级别的计算节点数(太湖之光是 40960 个,天河二号是 1600 个,第三名美国 ORNL Titan 超级计算机是 18688 个),太湖之光的运算速度也随之大幅超过对手。那么它到底有多快呢?国家超级计算无锡中心主任杨广文这么形容:
“简单来说,这套系统 1 分钟的计算能力,相当于全球 72 亿人同时用计算器不间断计算 32 年;如果用 2016 年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于 200 多万台普通电脑。”
量化一下的数据是,神威 · 太湖之光的 Linpack 浮点性能为 93PFLOPS(9.3 亿亿次),理论性能是 125.4PLFOPS。
当然,太湖之光运算速度全球第一不是重点,实现 CPU 全国产也不是重点,真正的重点是,在运算性能大幅飙升的情况下,太湖之光的功耗反而从天河二号的 17.8MW 降低到了 15.37MW,计算下来其单位性能功耗达到了 6GFLOPS/W,而以能效比著称的 Titan 单位性能不过是 2.1GLOPS/W。