Ascend910B:修订间差异

来自About High Performance
跳到导航 跳到搜索
无编辑摘要
(Sxzhang移动页面昇腾910BAscend910B,不留重定向)
 
(未显示同一用户的2个中间版本)
第1行: 第1行:


# 昇腾910B芯片主要用于训练服务器。
以下是华为昇腾910B芯片的关键特性和参数:
# 昇腾910B芯片的主要特性是FP32的性能提升,其FP32算力可以达到75T。
 
# 支持PCle 5.0。
{| class="wikitable"
# 芯片峰值为400W
|-
# 昇腾910B芯片将八个NPU模组互联互通,每个NPU模组提供了56GB的HCCS的双向带宽。模组间的互联带宽传输速度是392GB/s,与英伟达A800的400GB/s的物联带宽基本持平。
! 特性/参数 !! 描述
# 昇腾910B芯片提供200G网口,上一代是100G。
|-
# 昇腾910B芯片使用的是HBM为64GB。
| 发布年份 || 2023年
# 在液冷环境下,昇腾910的FP16算力达到400T,在风冷的环境下,FP16算力只有313T。标卡FP16的算力280T。
|-
# 昇腾910B芯片的生态适配了Llama、GPT、清华大学自研的大模型等,能支持的原生模型还有盘古大模型和文心一言等。
| 用途 || AI训练服务器芯片,主要用于Atlas 800-9000训练服务器
|-
| FP32算力 || 75TFLOPS
|-
| FP16算力(液冷环境) || 400TFLOPS
|-
| FP16算力(风冷环境) || 313TFLOPS
|-
| FP16算力(标卡) || 280TFLOPS
|-
| HBM容量 || 64GB
|-
| 支持的PCle版本 || 支持PCle 5.0,传输带宽优于只能支持PCle 4.0的英伟达A800
|-
| NPU模组互联互通 || 将八个NPU模组互联互通,每个NPU模组提供了56GB的HCCS的双向带宽
|-
| 模组间的互联带宽传输速度 || 392GB/s,与英伟达A800的400GB/s的物联带宽基本持平
|-
| 网口 || 植入200G的网口,上一代是100G
|-
| 生态适配 || 适配了Llama、GPT、清华大学自研的大模型等,能支持的原生模型还有盘古大模型和文心一言等
|}


[https://xueqiu.com/5919076646/262393914]
[https://xueqiu.com/5919076646/262393914]

2023年11月7日 (二) 17:46的最新版本

以下是华为昇腾910B芯片的关键特性和参数:

特性/参数 描述
发布年份 2023年
用途 AI训练服务器芯片,主要用于Atlas 800-9000训练服务器
FP32算力 75TFLOPS
FP16算力(液冷环境) 400TFLOPS
FP16算力(风冷环境) 313TFLOPS
FP16算力(标卡) 280TFLOPS
HBM容量 64GB
支持的PCle版本 支持PCle 5.0,传输带宽优于只能支持PCle 4.0的英伟达A800
NPU模组互联互通 将八个NPU模组互联互通,每个NPU模组提供了56GB的HCCS的双向带宽
模组间的互联带宽传输速度 392GB/s,与英伟达A800的400GB/s的物联带宽基本持平
网口 植入200G的网口,上一代是100G
生态适配 适配了Llama、GPT、清华大学自研的大模型等,能支持的原生模型还有盘古大模型和文心一言等

[1]