转Anandtech: http://www.anandtech.com/show/10536/nvidia-maxwell-tile-rasterization-analysis
渣翻译:
对于俺这种靠分析GPU来混饭吃的人来说,老黄的Maxwell架构是让我比较恼火的一个东西。28nm的Maxwell架构通过不多的核心面积增加,却获得了巨大的能耗比提升,使得老黄在工艺没有升级的情况下获得了一整代的性能提升。虽然以前也有过工艺不升级架构升级的情况,但从来没像Maxwell这次这么暴力过。
让我烦恼的是,NV对外分享了一些Maxwell架构相比Kepler架构效能提升的细节,但他们从来没把最重要的部分公开出来。我们知道,Maxwell的的SM结构进行了改变,使得峰值性能更容易达到,还有什么分区技术可以在内部互联上少费点电,L2缓存也增加了,底层(晶体管层面)也优化了——但是老黄还是隐藏了一些信息——
然后不少人开始怀疑,老黄整了些移动端的高效能技术到Maxwell上去——然后Anandtech的好朋友,David Kanter of Real WorldTech 终于研究透了Maxwell和Pascal,今早发了个视/文章,简述他发现了一个重要的证据,老黄在Maxwell上实现了Tile-based Rendering
简单说,通过折腾一些DirectX的代码来看三角形的光栅化操作,他确信从Kepler开始,NV处理三角形的方式发生了巨大的改变,然后现在的处理方式的Tile-Based Rendering
Tile-Based Rendering在移动GPU上用的很多,Imagination PowerVR和ARM Mali都用这个。它的特点是把画面打碎成块块后,每个块块都可以被GPU整块做光栅化处理掉,相比之下,传统的Immediate mode rendering对整幅画面做光栅化需要消耗更大的内存(和电力)。对于PC这边来说,因为PC传统上一直是immediatemode rendering,所以老黄在Maxwell上用Tile-BasedRendering应该是克服了一些方法上的弱点和潜在的兼容性问题。
(懒得翻译了)NV现在应该是唯一一个在桌面GPU领用用TBR的厂家,同时这也可能可以解释老黄的GPU架构领先于农企和牙膏厂的原因,让我们看看他们将来会干些啥
渣翻译:
对于俺这种靠分析GPU来混饭吃的人来说,老黄的Maxwell架构是让我比较恼火的一个东西。28nm的Maxwell架构通过不多的核心面积增加,却获得了巨大的能耗比提升,使得老黄在工艺没有升级的情况下获得了一整代的性能提升。虽然以前也有过工艺不升级架构升级的情况,但从来没像Maxwell这次这么暴力过。
让我烦恼的是,NV对外分享了一些Maxwell架构相比Kepler架构效能提升的细节,但他们从来没把最重要的部分公开出来。我们知道,Maxwell的的SM结构进行了改变,使得峰值性能更容易达到,还有什么分区技术可以在内部互联上少费点电,L2缓存也增加了,底层(晶体管层面)也优化了——但是老黄还是隐藏了一些信息——
然后不少人开始怀疑,老黄整了些移动端的高效能技术到Maxwell上去——然后Anandtech的好朋友,David Kanter of Real WorldTech 终于研究透了Maxwell和Pascal,今早发了个视/文章,简述他发现了一个重要的证据,老黄在Maxwell上实现了Tile-based Rendering
简单说,通过折腾一些DirectX的代码来看三角形的光栅化操作,他确信从Kepler开始,NV处理三角形的方式发生了巨大的改变,然后现在的处理方式的Tile-Based Rendering
Tile-Based Rendering在移动GPU上用的很多,Imagination PowerVR和ARM Mali都用这个。它的特点是把画面打碎成块块后,每个块块都可以被GPU整块做光栅化处理掉,相比之下,传统的Immediate mode rendering对整幅画面做光栅化需要消耗更大的内存(和电力)。对于PC这边来说,因为PC传统上一直是immediatemode rendering,所以老黄在Maxwell上用Tile-BasedRendering应该是克服了一些方法上的弱点和潜在的兼容性问题。
(懒得翻译了)NV现在应该是唯一一个在桌面GPU领用用TBR的厂家,同时这也可能可以解释老黄的GPU架构领先于农企和牙膏厂的原因,让我们看看他们将来会干些啥