Ascend910B：修订间差异

2023年11月7日 (二) 17:46的最新版本

以下是华为昇腾910B芯片的关键特性和参数：

特性/参数	描述
发布年份	2023年
用途	AI训练服务器芯片，主要用于Atlas 800-9000训练服务器
FP32算力	75TFLOPS
FP16算力（液冷环境）	400TFLOPS
FP16算力（风冷环境）	313TFLOPS
FP16算力（标卡）	280TFLOPS
HBM容量	64GB
支持的PCle版本	支持PCle 5.0，传输带宽优于只能支持PCle 4.0的英伟达A800
NPU模组互联互通	将八个NPU模组互联互通，每个NPU模组提供了56GB的HCCS的双向带宽
模组间的互联带宽传输速度	392GB/s，与英伟达A800的400GB/s的物联带宽基本持平
网口	植入200G的网口，上一代是100G
生态适配	适配了Llama、GPT、清华大学自研的大模型等，能支持的原生模型还有盘古大模型和文心一言等

[1]

@@ 第1行： / 第1行： @@
-# 昇腾910B芯片主要用于训练服务器。
+以下是华为昇腾910B芯片的关键特性和参数：
-# 昇腾910B芯片的主要特性是FP32的性能提升，其FP32算力可以达到75T。
-# 支持PCle 5.0。
+{| class="wikitable"
-# 芯片峰值为400W
+|-
-# 昇腾910B芯片将八个NPU模组互联互通，每个NPU模组提供了56GB的HCCS的双向带宽。模组间的互联带宽传输速度是392GB/s，与英伟达A800的400GB/s的物联带宽基本持平。
+! 特性/参数 !! 描述
-# 昇腾910B芯片提供200G网口，上一代是100G。
+|-
-# 昇腾910B芯片使用的是HBM为64GB。
+| 发布年份 || 2023年
-# 在液冷环境下，昇腾910的FP16算力达到400T，在风冷的环境下，FP16算力只有313T。标卡FP16的算力280T。
+|-
-# 昇腾910B芯片的生态适配了Llama、GPT、清华大学自研的大模型等，能支持的原生模型还有盘古大模型和文心一言等。
+| 用途 || AI训练服务器芯片，主要用于Atlas 800-9000训练服务器
+|-
+| FP32算力 || 75TFLOPS
+|-
+| FP16算力（液冷环境） || 400TFLOPS
+|-
+| FP16算力（风冷环境） || 313TFLOPS
+|-
+| FP16算力（标卡） || 280TFLOPS
+|-
+| HBM容量 || 64GB
+|-
+| 支持的PCle版本 || 支持PCle 5.0，传输带宽优于只能支持PCle 4.0的英伟达A800
+|-
+| NPU模组互联互通 || 将八个NPU模组互联互通，每个NPU模组提供了56GB的HCCS的双向带宽
+|-
+| 模组间的互联带宽传输速度 || 392GB/s，与英伟达A800的400GB/s的物联带宽基本持平
+|-
+| 网口 || 植入200G的网口，上一代是100G
+|-
+| 生态适配 || 适配了Llama、GPT、清华大学自研的大模型等，能支持的原生模型还有盘古大模型和文心一言等
+|}
 [https://xueqiu.com/5919076646/262393914]

Ascend910B：修订间差异

2023年11月7日 (二) 17:46的最新版本

导航菜单