华为发布Ascend 950超节点:未来数年的行业最强算力

华为发布Ascend 950超节点:未来数年的行业最强算力

白猫 / 2025-09-19 11:4013917

作为AI领域最为重要的硬件产品,AI训练卡已经成为了衡量国家AI算力的一个重要指标,目前在AI领域,毫无疑问NVIDIA是最为强大的存在,不过对于国内来说,像华为这样的企业也不断地在AI领域不断发光发热,推出了海量的AI计算超节点,通过强大的通信实力将众多计算卡连接在一起,从而获得超乎寻常的强大算力。近日华为就发布了Ascend 950系列芯片,可以将AI算力达到新的高度,此外华为也公布了未来数年的算力路线图,通过不断地推陈出新将AI算力达到新的顶峰。

Huawei-Kungpeng-950-960-Series-CPUs.jpg

首先是即将发布的Ascend 950也就是昇腾950芯片,Ascend 950相比较目前的Ascend 910C在性能上将会有着巨大的提升,尤其是对于AI训练具有影响力的带宽,Ascend 950的带宽将会是Ascend 910C的2.5倍,达到了2TB/s,除此之外华为还自研了HBM,针对不同场景进行特别的优化,来让芯片更加高效地用于特定场合中,例如针对DeepSeek的训练打造了Ascend 950DT,面向推理和预填充打造了Ascend 950PR,其中前者的发售时间为2026年底,后者则是2026年一季度。

58cebd71a0fa45c48ac242ca29b2661f.jpg

到了2027年,华为将会推出Ascend 960,其算力和内存容量带宽等重要指标将会是Ascend 950的2倍,配合华为自研的HiF4数据格式让FP4推理达到前所未有的程度,此外到了2028年,华为还将推出Ascend 970,这颗芯片在Ascend 960的基础上算力还将翻倍,从而达到行业顶尖水准,华为也表示将会投入巨额的资金来确保算力实现几乎一年一倍的提升。

QQ截图20250919103626.png

华为还在昨天发布了Atlas 950超节点,该节点采用了8192张基于Ascend 950DT打造的昇腾计算卡,FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,其中峰值带宽已经是如今互联网峰值带宽的10倍,预计在2026年和大家见面,此外2027年发布的Atlas 960超节点将会在Atlas 950超节点的基础上性能继续翻倍,大模型的训练以及推理性能更是提升3倍或者4倍。华为还发布了Atlas 950 SuperCluster 50万卡集群,并且在2027年升级到Atlas 960 百万卡超级集群,算力更是达到4 ZFLOPS,远超现在的计算卡集群。

可以说华为的这些超算产品在性能上已经达到了国际领先的水平,即使和NVIDIA相比也没有太大的差距,未来如果可以将生态打造地更加完善,对于国内AI从业者来说显然是一个天大的好事。


发表评论注册|