英伟达 vs. 华为海思：GPU性能一览

本文转自SDNLAB，编译自arthurchiao的博客，主要介绍了英伟达和华为/海思主流 GPU 的型号性能，供个人参考使用，文中使用数据均源自官网。

英伟达GPU L2/T4/A10/A10G/V100对比：

英伟达A100/A800/H100/H800/华为Ascend 910B对比：

一句话总结，H100 vs. A100：3 倍性能，2 倍价格

值得注意的是，HCCS vs. NVLINK的GPU 间带宽。

对于 8 卡 A800 和 910B 模块而言，910B HCCS 的总带宽为392GB/s，与 A800 NVLink (400GB/s) 相当。然而，两者之间也存在一些区别。

NVIDIA NVLink采用全网状拓扑，如下所示，（双向）GPU-to-GPU 最大带宽可达到400GB/s （需要注意的是，下方展示的是8*A100模块时的600GB/s速率，8*A800也是类似的全网状拓扑）；

华为HCCS采用对等拓扑（没有 NVSwitch 芯片之类的东西），所以（双向） GPU-to-GPU 最大带宽是56GB/s;

H20/L20/Ascend 910B对比：

AIoT SoC芯片行业研究报告

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新，现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)”和“存储系统基础知识全解（终极版）”pdf及ppt版本，后续可享全店内容更新“免费”赠阅，价格仅收249元(原总价439元)。

温馨提示：

扫描二维码关注公众号，点击阅读原文链接获取“架构师技术全店资料打包汇总(全)”电子书资料详情。

继续阅读