安培 7nm安培GPU详解:400W功耗、40GB HBM2、826mm2怪兽出炉
等了好久,NVIDIA今晚正式发布了7nm安培GPU,号称是第8代GPU历史上最大的性能飞跃。不过官方并没有公布安培GPU的技术细节,但Anandtech网站给出了详细介绍。
在这次GTC 2020大会演讲中,英伟达CEO黄仁勋主要谈到了HPC计算、AI人工智能等。目前推出的A100核心也是针对这个领域。比起三年前发布的Volta架构的V100内核,很多东西和RTX 3080 Ti游戏卡不一样,不用纠结。
首先,V100的核心是12nm Volta架构,211亿个晶体管,核心面积815mm2,而A100的核心是TSMC 7N工艺,应该也是7nm工艺的定制版,826mm2,542亿个晶体管,也是核弹级别。
V100内核有80组SM单元、5,120个CUDA内核和SXM2/3架构,而A100内核有108组SM单元、SXM4架构和6,912个CUDA内核。
与Volta架构的640个张量核相比,A100核的张量核数量减少到了432个,但是性能却有了很大的提升,支持全新的TF32操作,浮点性能156次浮点,INT8的浮点性能624次浮点,FP16的浮点性能312次浮点。
常规FP32和FP64性能提升不明显,从V100内核的15.7和7.8次FLOPS到19.5和9.7次TFLOPS。
频率方面,A100的内核其实是在倒退,从V100的1530MHz到1.41GHz左右,毕竟内核规模太大,功耗飙升到了400W,比V100的300/350W功耗高很多。
视频内存方面,A100还配备了HBM2视频内存,频率从1.75Gbps提高到2.4Gbps,位宽5120bit,比V100的4096bit提高了1024bit,容量从16/32GB提高到40GB。
不过HBM2的配置有点奇怪。理论上,应该再增加一个HBM2来增加1024位。不过从核心图来看,HBM2内存有六组,可能是两组512bit。你确定以后会有完整版的A100核心吗?
但由于HBM2内存位宽和频率的增加,A100的核心英寸带宽达到1.6TB/s,远高于V100的900GB/s,甚至高于AMD的Radeon VII显卡1TB/s的带宽。
最后NVLink技术也升级到3.0版,带宽从300GB/s提高到600GB/s,适合服务器领域的多卡互联,不过以后应该会有PCIe版。