快捷搜索:

独家解读NVIDIA CUDA支持Arm——百万兆级超算竞争再

在法兰克福举办的举世超级谋略大年夜会上,重磅消息传来,NVIDIA发布CUDA支持Arm CPU,为高机能谋略开辟全新道路,以构建具有极高能效水平的百万兆级AI超级谋略机。北京光阴6月17日下昼四点,NVIDIA与媒体召开电话会议。下文将详解双方相助始末,以及独家求证后获知的信息。

NVIDIA联袂Arm意欲何在?

跟着传统谋略规模扩展方式的竣事,功率将成为所有超级谋略机的限定身分。对授予Arm的联袂,NVIDIA开创人兼首席履行官黄仁勋表示:“NVIDIA CUDA加速的谋略和Arm的高能效CPU架构的相结合,将助力HPC社区实现大年夜幅提升,以达到百万兆级。”

双方相助的缘故原由主要有两方面:首先,客户必要更多选择,一旦完成客栈优化,Nvidia将加速所有主要CPU架构,包括x86、Power和ARM;其次,经由过程将NVIDIA软件栈引入Arm生态系统,将进一步助推在HPC办事器市场的立异。

岁尾前,NVIDIA将向Arm生态系统供给全客栈的AI和HPC软件,该客栈为600多个HPC利用法度榜样和所有AI框架供给加速,此中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开拓对象,如支持OpenACC的PGI编译器和机能阐发器。

NVIDIA办理规划架构与工程团队副总裁Marc Hamilton走漏,NVIDIA和Arm已为这个计划筹备了两年阁下,觉得现在是最佳的宣布机会。建立在双方跨越10年的相助根基之上,此前,NVIDIA几款用于便携式游戏、自动驾驶汽车、机械人和嵌入式AI谋略的系统级芯片产品都采纳了Arm。举世浩繁涉及超级谋略的项目或单位都在寻求Arm的加入,包括欧洲处置惩罚器计划(European Processor Initiative)、日本先辈情报项目中间 (RIKEN)、美国能源部的先锋项目(DOE Vanguard project)等。

相助仅止于HPC软件方面?照样会进一步影响到某些利用市场?NVIDIA表示,相助同时也是对付其他平台的弥补,例如Jetson Xavier,并将进一步拓展在数据中间和HPC平台的相助。

超算竞争再加剧

在超级谋略机中应用基于Arm的体系布局是值得留意的,和其他架构比拟,Arm的一大年夜特色在于出色的能效,能够为超级谋略供给开放式架构,用户可以实现更为高度的集成。对付必要快速处置惩罚和阐发大年夜型数据集的钻研密集型义务,能够满意内存容量和可扩展性需求。

Arm已经在世界各地的许多HPC中间得到了越来越多的关注,NVIDIA支持Arm CPU后,将为研发超算的钻研职员们供给了除英特尔和IBM外的第三种选择,并使得研发者可以经由过程这种要领得到更多的自立节制能力。对付已经选择了Arm CPU的用户来说,他们同时可以得到NVIDIA GPU加速计算选项。CUDA强大年夜的软件能力,将能够和Arm的软件生态无缝毗连,强强联合。

不停以来,Arm并没有放弃将其处置惩罚器扩展至高机能谋略领域的坚持。近年来大年夜的举动有:2016年8月发布将与日本富士通公司相助,开拓一个以64位ARMv8-A驱动的Post K超级谋略机,并于昔时12月发布收购Allinea Software公司,后者主要为超级谋略机供给机能阐发对象。在2018年11月的TOP500列表上,首次呈现了Arm的身影,而且是安装在大年夜名鼎鼎的美国桑迪亚国家实验室。与此同时,Cray于2018年11月在英国景象局交付了一台基于Arm的超级谋略机"Isambard",而日本的下一代超级谋略机"Post-K"也同样基于Arm架构。

超算未来将更为重视能耗

超算届有两个紧张排名:TOP500和Green500。TOP500主要按照机能基准,供给通用高端利用的系统排名。而比拟TOP500,Green500除了追求运算速率,加倍注重超算的能耗问题。

根据今年刚刚宣布的Green500排行榜,在举世最节能的25款超级谋略机中,有22款都得益于NVIDIA的支持。关键身分在于:采纳NVIDIA GPU的超级谋略性能够将繁重的处置惩罚功课卸载至更为节能的并行处置惩罚CUDA GPU之上;NVIDIA与Mellanox相助优化整体超级谋略集群的处置惩罚;以及NVIDIA发现的SXM 3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技巧。

联袂打造超豪华“同伙圈”

包括超算中间和系统供给商以及系统级芯片制造商等在内的浩繁HPC行业及Arm生态系统中的举世领先企业,都表达了其对付NVIDIA联袂Arm的支持。

对付超算百万兆级期间的愿景,Cray觉得主要在于将AI和阐发与建模、仿本相结合的系统,这些系统能够支持、也常常必要为科学、工程和数字化转型所需的数据密集型事情负载构建的多种处置惩罚器架构和系统。Cray系统治理和编程情况(编译器、库和对象)已经能够在XC和未来的Shasta超级谋略机上支持Arm处置惩罚器,将CUDA和CUDA-X HPC和AI软件客栈用于Arm平台,并将其与Cray系统治理和编程情况慎密集成,能够助力其超级谋略机实现终极愿景。

“欧洲处置惩罚器计划(European Processor Initiative,EPI)总经理Philippe Notton则表示,打造欧盟自己的高端、低功耗、通用和加速器办理规划,EPI和其工业相助伙伴SiPearl异常看好NVIDIA所带来的全新可能性。将EPI基于Arm的微处置惩罚器与NVIDIA加速器相结合,能够匹配未来欧洲百万兆级模块化超级谋略机中的构建模块。”

斟酌到未来几年内百万兆级系统和大年夜规模AI谋略的兴起,Jülich超算中间认真人Thomas Lippert表示, NVIDIA对Arm处置惩罚器的支持是异常令人愉快的成长,对付实现未来超级谋略机和可组合数据中间的真正模块化至关紧张。

在HPC收集方面处于领先职位地方的Mellanox Technologies,其InfiniBand和以太网技巧连接了举世多款大年夜型的超级谋略机,此中就包括第一代基于Arm的各系统。该公司开创人兼首席履行官Eyal Waldman盼望经由过程持续相助,支配200Gb/s HDR和谋略收集技巧,以优化HPC和AI事情负载,并实现新一代基于Arm的超级谋略机的超级连接。

百万兆级意义何在?

举世超级谋略机角逐正朝着“百万兆级谋略”这个里程碑似的目标提高着。

百万兆级意味着什么?一个百万兆级的谋略机一瞬间进行的谋略量,相称于地球上所有人天天每秒都不绝地谋略四年。

这种不凡的气力将使钻研职员能够进行大年夜规模繁杂的模拟,从而在许多领域取得进展,从气候科学到基因组学、可再生能源和人工智能。田纳西大年夜学的超级谋略机专家Jack Dongarra曾说过:“百万兆级的谋略机是一项有力的科学对象,就像粒子对撞机或巨型千里镜一样。”这些机械在工业上也很有用,它们可以被用于加速产品设计和识别新材料。军方和情报机构也愿望这样的超级谋略性能够将被用于掩护国家安然。超级谋略机是匆匆进科学发明的紧张对象,建立百万兆级超级谋略将能够极大年夜地扩展人类常识的界限。

您可能还会对下面的文章感兴趣: