高性能计算简称 HPC,是指利用聚集起来的计算能力来处理标准工作站无法完成的数据密集型计算任务,包括仿真、建模和渲染等。我们在处理各种计算问题时常常遇到这样的情况:由于需要大量的运算,一台通用的计算机无法在合理的时间内完成工作,或者由于所需的数据量过大而可用的资源有限,导致根本无法执行计算。
在传统环境下只能搭建一个大的机房及几百台服务器去完成该工作,而HPC 方法通过使用专门或高端的硬件,或是将多个单元的计算能力进行整合,能够有效地克服这些限制。
适用于所有 AI 基础架构(包括分析、训练、推理基础架构)的通用系统。该系统设定了新的计算密度标杆,将 5 petaFLOPS 的 AI 性能装进 6U 尺寸,用一个平台代替所有 AI 工作负载的传统基础架构孤岛。
通过集成八块 A100 GPU with up to 640GB of GPU memory,此系统可出色完成加速任务,并可针对 NVIDIA CUDA-X™ 软件和整套端到端 NVIDIA 数据中心解决方案进行全面优化。
内置 Mellanox ConnectX-6 VPI HDR InfiniBand 和以太网适配器,其双向带宽峰值为 500Gb/s。此优势是使 DGX A100 成为 NVIDIA DGX SuperPOD™ 等大型 AI 集群基础构件的诸多因素之一,也是成为可扩展 AI 基础架构企业蓝图的原因之一。
DLRM 训练:在大型模型上将 AI 训练吞吐量提升高达 3 倍
RNN-T 推理:单流:AI 推理吞吐量提升高达1.25 倍
大数据分析基准测试:吞吐量比 CPU 提升高达 83 倍,比 DGX A100 320GB 提升高达两倍
大型科学工程计算,数值模拟等。其应用领域为石油、气象、CAE、核能、制药、环境监测分析、系统仿真等。
数字图书馆,数据仓库,数据挖掘,计算可视化等;其应用领域:图书馆、银行、证券、税务、决策支持系统等。
协同工作,网格计算,遥控和远程诊断等;其应用领域:网站、信息中心、搜索引擎、电信、流媒体等。