今晚NVIDIA发布了7nm安培GPU,首发的是Tesla A100加速卡,工艺及架构全面升级,很好很强大。不过有一点大家可能猜到了,6912个CUDA核心的Tesla A100并不是完整版的,NVIDIA依然在首发产品了留了一刀。
之前的架构解析中,Tesla A100加速卡目前所用的核心有6912个CUDA核心,算下来是108组SMX单元,VC网站的结构对比更加清晰,如下所示:
尽管现在的6912个CUDA核心相比GV100的5120个CUDA核心已经提升了35%,但它依然不是GA100大核心的完整体,这差不多也是NVIDIA每次发布新卡的保留节目了,首发产品要割一刀。
从官方给出的结构来看,GA100核心完整版是128组SMX单元,也就是8192个CUDA核心,比现在差不多要多出15-20%的规模,后续的潜力很大。
至于为什么首发的Tesla A100核心这么保守,可能是NVIDIA希望后续再出更高端的产品,也有可能跟现在的产品功耗已经达到400W有关,为此频率都降低到了1400MHz了,比GV100核心的1.5-1.6GHz还要低。
完整版的GA100大核心不知道什么时候解锁,后续优化了功耗之后,GA100大核心的性能恐怕要再上一层楼了,big Navi大核心不知道能不能追上了。