amd吧 关注:759,073贴子:17,411,334
  • 13回复贴,共1

高频和低频的思考-有感于和吧友对显存位宽的争论

只看楼主收藏回复

首先感谢吧友@过眼De云烟2013,昨天和他讨论了一下big navi的位宽问题。
今天没事的时候想了一下,其实这个问题在当年的夏威夷(R9-290系列)也出现过。
当年夏威夷没有像自家小弟大溪地(HD7900/r9-280系列)/友商GK110系列(GTX780系列/Kepler架构的Titan)那样采用384bit位宽&高频显存的原因,一说是为了节省显存控制器面积,简化设计。据说夏威夷的显存控制器面积比大溪地还要小。看来显存控制器也和GPU主频一样,为了频率而需要在晶圆面积上做出让步。
当然了,夏威夷的带宽也不低(290系列已经320GB/S了,后来的马甲390系列已经达到384GB/S),而功耗貌似也没有太高。这就是大位宽&低频显存的好处,只要稍微提一下显存频率,就会带来较大的位宽收益,而且在显存容量上也有优势(290系列寿命比780系列长,除了驱动战未来以外,显存容量也是个优势)。
但是,事无绝对。16颗显存明显对显卡的pcb要求更高,而且布线成本大幅度上升(尤其是今天的高频GDDR6显存),而且大位宽也往往意味着显卡的灵活性下降很多(这点就是夏威夷的复刻版xbob one x里面那颗,采用384bit位宽&高频显存而没有继续采纳512bit位宽&低频显存)。
说了这么多铺垫,其实笔者主要是继续探讨一下big navi(5120sp)的带宽需求。现在已知navi对带宽需求不是很高(5600xt和同频5700的性能差距在10%上下,而前者带宽只有后者的3/4),当然规模翻番(最起码流处理器,rops至少得96个)的大navi对带宽要求也不会很低。
现在讨论一下384bit位宽和512bit位宽的优缺点:
384bit位宽:用目前大规模量产的GDDR6最高可以做到768GB/s,很难说这个带宽够不够(除非rdna2.0对带宽进行压缩)。如果想继续扩大带宽只能对显存频率超频,目前普通GDDR6貌似可以超频到18Gbps(这个消息在黄记rtx30系列之前,是rambus&三星实现的,到现在问题不大)~再高就需要采用GDDR6X显存,但后者目前只有黄记的显卡会采用,而且不能确定才能是否够用,黄记是否独占(之前的GDDR5X的产能就不行&黄记独占),而且目前容量也不一定够(除非双面显存,但这样布线成本很高)。但采用384bit位宽的布线相对简单(这点很重要,尤其是显存频率很高的GDDR6世代)。
512bit位宽:如果达到384bit位宽的带宽,只需要12Gbps就足够了,这个频率完全可以采用低压版(目前GDDR6标准电压是1.35V,而低压版可以做到1.25V乃至1.20V),根据P=cV²f,低压版可以显著降低功耗。如果想做到1TB/s带宽,也只需要采用标准的GDDR6显存(16Gbps)即可,容量和产能上有优势。但是,512bit位宽意味着布线难度大幅度上升,而且显卡本身的灵活性下降不少。
除了以上两种可能性,笔者还提出第三种可能性,就是像R7那样采用4096bit HBM2显存,毕竟512bit GDDR6显存的成本(16颗显存颗粒)和4096bit HBM2显存差不多(4颗显存颗粒),GDDR6显存的成本也是HBM2的1/4左右。
采用HBM2显存也意味着布线难度大幅度下降(当然封装成本或许会上升)&功耗大幅度降低。尤其是后者,往往会带来GPU部分可以运行在更高的频率上&显卡本身有更高的能耗比。当然了,目前生产HBM2的厂家(御三家(三棒,海力士,镁光))的产能很难确定,而且a家之前使用hbm显存带来的结果并不好,所以这次AMD是否在big navi上使用hbm2显存还是个未知数。


IP属地:辽宁1楼2020-08-22 23:03回复
    总而言之,三种方法各有优劣,现在总结一下:
    384bit&高频显存:布线成本貌似最低,显卡灵活性较高,但需要显卡本身压缩显存带宽&提升带宽最为困难(功耗较大&还需要和友商抢GDDR6X的产能)。
    512bit&高频显存:布线成本大幅度上升,显卡灵活性下降,可以在较为适宜的情况下提供更高的带宽。
    4096bitHBM2显存:封装成本较高,显存物料成本和512bit位宽差不多。但显存上能耗大幅度降低,可以有效促进显卡整体能耗比上升&GPU核心可以运行在更高的频率上。
    至于显存控制器所占晶圆面积,带宽相同的前提下,第一种>=第二种>第三种,这也是为什么当年fury能堆那么多的sp(比夏威夷多出1280sp)。显存容量上第一种如果使用GDDR6X显存,那如果需要24G的显存容量就需要双面显存颗粒;第二种很轻松就可以提供16GB容量,哪怕32GB也很轻松(参考5500xt,现在2GB容量的GDDR6显存颗粒已经大幅度量产)。第三种提供16GB容量也很轻松(R7就是如此),32GB只要消费者出得起钱也没问题(HBM2本身支持8层堆叠)。


    IP属地:辽宁2楼2020-08-22 23:12
    回复
      考虑到big navi的价格(现在黄记的3080据说都要七八百美金了,big navi的价格不会比这个低),似乎HBM2的封装成本也可以接受(提升的显卡能效比&GPU运行在更高的频率往往意味着更高的售价)。当然了,512bit位宽的显存布线可以部分转嫁给中下游厂家。


      IP属地:辽宁3楼2020-08-22 23:15
      回复
        而且联想起当年夏威夷&fury的情况,不排除a家这次还留有后手,即一开始先放出512bit位宽的big navi,后期不排除释放出规模更大的(6144sp?)big big navi,采用4096bit HBM2显存(根据隔壁黄记的A100核弹,HBM2显存频率运行在1.2GHz毫无问题,这样4096bit HBM2就可以带来1228.8GB/s的位宽,如果采用海力士的HBM2E&镁光的HBM2Next,带宽进一步提升毫无压力)~


        IP属地:辽宁4楼2020-08-22 23:19
        回复
          总而言之,目前的情况和当年28nm世代有点神似~


          IP属地:辽宁6楼2020-08-22 23:27
          回复
            据说大navi是16G显存,那就是512bit了,次旗舰可能是448bit


            IP属地:广东来自Android客户端7楼2020-08-23 00:18
            收起回复
              嗯!严格按照规范512bit布线是存在难度,旗舰卡成本并非最重要的,如果使用更高成本的PCB可以解决,我认为是完全有必要的。特别是可以和专业以及半专业卡通盘考虑,也有利于增加容量和今后马甲。HBM也是一个好的选项。


              IP属地:广东9楼2020-08-25 15:56
              收起回复
                感觉还是会卡在3090的带宽之上,具体用哪一种方法真的猜不透


                IP属地:山东13楼2020-08-30 22:03
                回复
                  1个1bit位宽


                  来自手机贴吧16楼2021-12-05 14:57
                  回复
                    1个1bit位宽


                    来自手机贴吧17楼2021-12-05 14:58
                    回复