
- 内存容量是 H100 的 2.4 倍
- 内存带宽是 H100 的 1.6 倍
- FP8 TFLOPS 精度是 H100 的 1.3 倍
- FP16 TFLOPS 精度是 H100 的 1.3 倍
- 在 1v1 比较中,训练 Llama 2 70B 模型速度比 H100 快 20%
- 在 1v1 比较中,训练 FlashAttention 2 模型速度比 H100 快 20%
- 在 8v8 Server 比较中,训练 Llama 2 70B 模型速度比 H100 快 40%
- 在 8v8 Server 比较中,训练 Bloom 176B 模型速度比 H100 快 60%























