搭建一个超算中央需要哪些芯片？_芯片_加快卡

文章目录 [+]

在这一份榜单中，我国的神威太湖之光位列第六，天河二号位列第九，与前几年比较排名有所低落，算力也不及美国“前沿”的十分之一。

长期以来，超算被视为综合国力的象征之一，是支撑国家持续发展的关键技能之一。
那么，中国的超算能力如何？海内芯片供应链是否能够支撑中国搭建超算中央呢？

搭建一个超算中央需要哪些芯片？_芯片_加快卡搭建一个超算中央需要哪些芯片？_芯片_加快卡通讯

超算市场的形成

大略来说，超级打算机是指由数千乃至更多处理器组成、能打算普通打算机和做事器不能完成的大型繁芜课题的打算机，它是将大量的处理器集中在一起以处理弘大的数据量，同时运算速率比常规打算机快许多倍。

搭建一个超算中央需要哪些芯片？_芯片_加快卡搭建一个超算中央需要哪些芯片？_芯片_加快卡通讯

（图片来自网络侵删）

根据中国科学院院士钱德沛2019年所做的一个报告，1993-2012年，超级打算机的性能大约每10年提高1000倍，从2013年起，上升速率变缓，降落为每10年100倍旁边。
但无论如何，超级打算机性能增长的速率远高于民用PC的性能增长，这解释超级打算机性能提高固然要靠单芯片性能的增长，也非常依赖系统规模的扩大。

超算性能增长曲线

最早，超算领域一贯是由美国主导的，美国是该领域的传统强国，已构建了三大E级超算体系。
自20世纪80年代中期开始，日本逐渐追遇上，其自主研发的超级打算机的性能屡创佳绩。

近几年，中国在超算领域也逐渐崛起，霸占了突出上风。
在2022年的榜单上，中国共有两个超级打算机进入前十，分别是HPL得分为93PFlop/s、位列第六的“神威·太湖之光”和HPL得分为61.4PFlop/s、位列第九的“天河二号”。

截至目前，我国共挂牌8座国家级超算中央，分别位于天津、长沙、济南、广州、深圳、无锡、郑州、昆山。

那么如此主要的算力场景，究竟须要那些芯片呢？

超算中央须要哪些芯片？

先来看海内，2010年，中国的“天河一号”位居环球超级打算机500强排行榜榜首。
其思路采取“CPU+GPU”的设计思路，结合了大约7000个英伟达GPU和14000个英特尔CPU，将GPU(图形芯片)用于超级打算机，起到了“CPU加速器”的浸染。

只管“天河”的紧张部件仍来自英特尔与英伟达两个美国制造商，但互联芯片则完备是中国自主研发，“天河”安装有由中国自主研发的“飞腾1000”芯片，部分取代了入口芯片。

2016年“神威·太湖之光”出身，是天下首台峰值运算性能超过每秒十亿亿次浮点运算能力的超级打算机。
这台打算机共有40960颗国产芯片，运算系统全面采取了国产“申威26010”众核处理器。
这也是我国第一台全部采取国产处理器构建的超级打算机。

从北京超级云打算中央来看，根据处理器的种别，北京超级云打算中央的超算分区可以划分为四大系列：基于AMD芯片的A分区与M分区，以及A分区的加强版「A6分区」；基于英特尔芯片的T分区与L分区；基于国产芯片的先导一号；基于英伟达芯片的AI智算云，比如N17、N19区。

个中，A分区采取的是AMD在2019年推出的第二代EPYC（霄龙）做事级处理器，代号罗马（Rome），基于7nm工艺，搭载64核心128线程，每一个核心的内存为4GB，在提升核心的同时也提升了时钟速率，加速频率可达3.4GHz。

国外方面，今年在超算榜单排名第一的美国的“前沿（Frontier）”超级打算机，相较于神威·太湖之光，美国的Frontier只有9408个节点，每个节点配备一个AMD Epyc 7A53 CPU和四个AMD Instinct MI250X加速卡。
显然，Frontier的节点间通信的压力要小得多，也更随意马虎设计。

该系统共包括8730112个内核，全体系统统共有9400多个CPU和37000多个GPU。
Frontier核心打算部分紧张依赖AMD Instinct MI250X加速卡，采取的是CDNA2架构。

此外，每块加速卡上还集成了128GB HBM2e高带宽内存。
现在的超算紧张还是冯·诺依曼构造占主导，内存速率将直接影响打算速率，这种内存比普通的要快得多，目前却只有少数企业能够生产。

超算中央如何分配芯片

超级打算机的性能野蛮成长了20年，至今为止，美国研制Frontier的花费也不过区区6亿美元，这解释超算系统规模的扩大并不是大略的堆硬件。

日本“富岳”（Fugaku）超算，流传宣传它的浮点运算速率峰值可达每秒41.5亿亿次；中国的“神威太湖之光”，它的浮点运算速率峰值是每秒12.5亿亿次。
都达到了10亿亿次以上。
超算用了很多个芯片，让它们同时实行任务，而单个芯片的性能跟个人电脑的芯片是差不多的。
用科学术语来说，这叫做“并行打算”，这是高性能打算的基本思路。

超算的算力是和核数有关的。
但算力速率并不能与核数构成正比例关系。
实际上，要让多个芯片同时运行，就必须首先给它们划分好任务，这个任务划分是要花费韶光的。
然后，当各个芯片开始打算之后，还时时地要和其他芯片交流数据，这个通信也是要花费韶光的。

超算的竞争紧张是超算系统中调度、分发、通信干系的软硬件的竞争。
早期的超算中央，每一个节点要么纯CPU，要么是CPU+加速卡的异构打算方案。
但从2010年前后开始，纯CPU的方案劣势太大，越来越少地被采取。
CPU+加速卡的异构打算方案也存在很大缺陷，即打算的数据会反复在CPU和加速卡之间传输，造成大量的性能摧残浪费蹂躏。

因此，为了更高的性价比和打算速率，早期海内每每会购买英特尔和英伟达两家美国厂商的成熟产品。

再之后异构打算进入超算中央的眼帘。
事实上，最近几年曾经在TOP500刷榜，或者排名靠前的超算都采取了异构打算——中国神威太湖之光、美国超算泰坦、中国天河1号和天河2号。

泰坦有18688个运算节点，每个运算节点由1个16核心AMD Opteron 6274处理器和1个英伟达 Tesla K20加速器组成，共计299008个运算核心，属于CPU+GPU。

天河1号利用了14336片英特尔 Xeon X5670处理器和7168片英伟达 Tesla M2050高性能打算卡，属于CPU+GPU。
　

天河2号有16000个打算节点，每个节点由2片英特尔的E5 2692和3片Xeon PHI组成，共利用了32000片英特尔的E5 2692和48000片Xeon PHI，属于CPU+众核芯片。
正在升级的天河2号则将美国的Xeon PHI换成了自主研发的矩阵2000，属于CPU+DSP。

神威·太湖之光利用的sw26010将两个部分的电路，集成到了一个芯片上（片上异构），这样既避免了纯CPU不善于专业打算的劣势，又避免了加速卡不能和CPU共享内存的问题。
使得sw26010在设计团队规模很小，制程掉队整整两代的情形，实现了和英特尔类似产品相似的功耗和性能。

太湖之光的成功，启迪了后来日本的“富岳”超算。
“富岳”同样抛弃了美国成熟的打算方案，购买ARMv8.2-A指令集开拓管理核心，并自研专业打算模块，推出了富士通版的片上异构芯片A64FX。

总结

我国在发展超算中央的途中，仍有许多问题。
国产芯片研究起步较晚，CPU、GPU等超算核心芯片指令集架构领域仍旧存在明显短板，缺少高端芯片制造能力。
EDA和编程平台长期面临卡脖子风险，核心设备依赖入口，自主权制定条约价权仍由国外巨子掌控。

目前来看，超级打算机的核心硬件CPU与GPU市场呈现马太效应，CPU紧张由Intel与AMD领跑，GPU市场由英伟达等国际巨子节制关键技能话语权。
并且在美国的刻意制裁下，上榜超算大会TOP500的企业，每每更随意马虎被加入实体清单。

2019年6月，美国将江南打算技能研究所等列入实体清单；2021年4月8日，包括天津飞腾信息技能公司、上海集成电路技能与家当促进中央、Sunway Microelectronics、国家超级打算济南中央、国家超级打算深圳中央、国家超级打算无锡中央以及国家超级打算郑州中央被美国列入黑名单。

在重重压力下，我国超算仍旧保持着精良的成绩。
在今年的ISC 2022超级打算大会上，中国是超级打算机上榜数量最多的国家，以173台的数量位列第一，占环球34.6%；排名第二的美国从上一期的150台低落到127台，占比25.6%；排名第三的日本则有33台进入榜单，占比6.6%。