中国公布全国产200亿亿次超算!4.7万颗自研x86 CPU 竟然没用GPU

久久百科 网络资讯 1

4月29日消息,近日,我国国家超级计算深圳中心正式公布了名为“灵晟”的国产E级(百亿亿次)超级计算机系统,已全面点亮并完成全机测试,同时展示了新超算在遥感、材料、生信、气象、药物、石油勘探、AI、生命科学、电磁仿真等九大领域的联合创新成果。

据国家超级计算深圳中心主任、“灵晟”系统总设计师卢宇彤介绍,“灵晟”基于国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等,实现了架构、性能、能耗、编程、扩展性、可靠性六大方面的技术突破,软硬件全栈自主可控。

其中,自研的片上多精度混合计算加速框架、超智融合软件平台,可以统一支撑科学计算、工程计算、智能计算“三算合一”,在分子动力学、流体仿真、生命科学、AI大模型训推等大规模领域应用均实现国际领先性能。

另据媒体报道,“灵晟”超算分两个阶段,一是规划验证阶段,使用了100台华为鲲鹏服务器,基于Arm指令集的泰山架构CPU,总计12800个核心。

二是量产部署阶段,扩展到1580台刀片式服务器,并改用x86 CPU处理器,总计101120个核心,理论峰值性能超过10PFlops(每秒1亿亿次浮点计算)。

最终完整系统将包括92个计算机柜,总计47000颗x86处理器。

处理器的具体型号未披露,而目前国产x86处理器只有兆芯、海光,从性能上看后者可能性更大。

其他还将包括36台网络机柜、650PB总容量的428个存储节点、67台液冷存储机柜、10TB/s带宽。

尤为值得一提的是,这套超算并没有使用GPU加速卡,就达到了2EFlops(每秒200亿亿次浮点计算)的惊人性能。

目前公开的世界第一超算是美国El Capitan,就采用了AMD EPYC处理器和AMD Instinct MI300A加速卡,后者多达44544个,而其理论峰值性能为2.79 EFlops,持续最大性能为1.809 EFlops,“灵晟”将超越之!

纯粹使用CPU就达到如此高度,还是自主可控的纯国产软硬件架构,实在是不可思议。

不过,“灵晟”超算还处于建设阶段,完全上线应用可能还需要几年时间。

另附“灵晟”九大应用成果:

- 遥感领域:

深圳超算副主任付昊桓团队依托“灵晟”超算系统,开展遥感模型的大规模训练与系统优化,全机端到端训练峰值性能该领域领先,实现全球8年时序遥感影像高倍压缩与高效重建。

相关技术支撑遥感解译与降水预报,显著提升预报精度,助力国土监测、灾害预警。

- 材料领域:

深圳超算副研究员徐奇门团队依托“灵晟”研发XLSDFT软件,实现一亿原子大规模第一性原理计算,并行扩展性达81%,可快速完成千万原子电池界面等复杂体系计算,为新能源、半导体等材料研发提供跨尺度仿真能力。

- 生信领域:

中山大学计算机学院杨跃东教授团队基于“灵晟”实现十万亿级化合物虚拟筛选,结合AI与强化学习效率提升千倍,单日筛选量突破十万亿,支撑创新药研发与精准医疗。

- 气象领域:

清华大学计算机系副主任薛巍教授团队研发的AP3ESMv2,在“灵晟”系统上实现全球1km分辨率地球系统模拟,计算成本降低62%。

DIDA首次实现2小时内完成30天全球公里尺度预报,提升极端天气预警能力,推动我国气象预报迈向全球高精度模拟新水平。

- 药物研发:

中国药科大学孙宇院长团队基于DeepField模型与超算融合,攻克肿瘤新抗原筛选、pMHC-TCR预测难题,完成超大蛋白结构模拟与大规模训推计算,支撑个性化肿瘤疫苗研发。

未来将打造自动化智能药学平台,推动精准免疫疗法快速落地。

- 石油勘探:

中国石油东方地球物理勘探公司的GeoEast物探软件完成“灵晟”的全栈适配优化,偏移成像性能达A100的1.88倍,内存带宽利用率57%,已在多个项目落地应用。

下一步将发布V4.4版本,全面支持国产化架构,打造自主可控的国产物探工业软件标杆。

- AI领域:

清程极智联合创始人唐适之团队针对“灵晟”纯CPU架构特性,完成算子开发、计算图调度、无依赖算子并行、MTP多token预测等全栈优化,大幅降低访存开销,为超算中心高效运营AI服务、提升算力利用率提供可复制的技术方案。

- 生命科学:

北京航空航天大学杨海龙教授团队优化AlphaFold2推理流程,通过混合精度计算、算子向量化加速、内存切片复用、多进程并行调度以及框架迁移等关键技术,大幅提升蛋白质结构预测计算效率与资源利用率。

- 电磁仿真:

西安电子科技大学自主研发的三维全波电磁仿真工具LASPCEM,融合计算、优化、测量三大求解器,在“灵晟”超算上实现千万核级大规模并行,为高端装备研制、射频电路设计、城市电磁环境分析提供自主可控的仿真支撑。