图不太清晰,但是也够用了。
CDNA3的AI加速器数量是我推断的,所以标记了红色。
比较了最新专业卡Hopper和40系列两张卡,以及7900XTX 和MI300A。
首先,GH100 和MI300A的确是一个算力档次的卡。(注意:MI300A带Zen4计算核心
)。
显然Hopper的第四代TensorCore比40系列提高了3倍。
CDNA3的AI加速器数量我没查到,我假设RDNA3的AI加速器硬件架构和CDNA3一样,所以可以推算出CDNA3的AI加速器数量。推算结果也很有意思,CDNA3的AI硬件数量密度恰好是RDNA3的4倍。(看SP/TC)
最后,我把MI300A缩放到 7900XTX的规模,然后令人惊奇的事情发生了,MI300 96CU版本拥有和4090同样的AI性能
。