华为昇腾950PR:国产算力的“硬核突围”
在刚刚结束的华为中国合作伙伴大会2026上,华为重磅发布并展出了搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡Atlas 350。与前一代昇腾芯片相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。昇腾950PR的商用落地标志着国产AI推理算力进入了一个新纪元,Atlas 350加速卡并非简单的迭代,而是针对大模型推理痛点的一次精准破围。
1、技术突破点:
(1)支持FP4低精度:国内唯一支持FP4低精度计算的商用推理产品。这意味着在保持模型精度的前提下,显存占用大幅降低,70B参数的大模型仅需35GB显存即可单卡加载,彻底解决了大模型“装不下”的难题。
(2)112GB HBM显存:该芯片的HBM(高带宽内存)容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。
(3)灵衢2.0互联:内存访问颗粒度优化至128字节,小算子访存效率提升4倍,为超节点(SuperPod)大规模集群训练打下基础。
免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约。