高通吧 关注:173,304贴子:4,211,115

AMD终于顶不住了,放弃GPU高端市场,推出UDNA融合架构

只看楼主收藏回复

在德国柏林举行的 IFA 2024 上,AMD 高级副总裁兼计算和图形业务集团总经理 Jack Huynh 宣布,公司将把面向消费者的 RDNA 和面向数据中心的 CDNA 架构统一为一个名为 UDNA 的微架构,这将为公司更有效地应对 Nvidia 根深蒂固的 CUDA 生态系统奠定基础。AMD 宣布此消息之际,该公司已决定降低高端游戏显卡的优先级,以加速市场份额的增长。
当 AMD 于 2019 年放弃其 GCN 微架构时,该公司决定将其新的图形微架构分为两种不同的设计,其中 RDNA 旨在为消费市场的游戏图形产品提供动力,而 CDNA 架构则专门设计用于满足数据中心以计算为中心的 AI 和 HPC 工作负载。
Huynh 在与媒体的问答环节中解释了拆分背后的原因,以及推进新统一设计的理由。我们还跟进了有关即将推出的架构的更多细节。以下是经过轻微编辑的对话记录:
Jack Huynh [lbk]JH[rbk],AMD:AMD 的重大变革之一是,如今我们为 Instinct 数据中心 GPU 采用了 CDNA 架构,为消费产品采用了 RDNA。它是分叉的。未来,我们将其称为 UDNA。Instinct 和客户端 [lbk]消费者[rbk] 都将有一个统一的架构。我们将统一它,这样开发人员就可以更轻松地使用它,而现在他们必须做出选择,而且价值并没有提高。
我们之所以将它分叉,是因为这样你就可以获得次级优化和微优化,但对于这些开发人员来说,这非常困难,尤其是在我们发展数据中心业务的情况下,所以现在我们需要统一它。这是其中的一部分。因为还记得我之前说过的话吗?我在考虑数百万开发人员;这就是我们想要达到的目标。第一步是达到数百、数千、数万、数十万,希望有一天达到数百万。这就是我现在告诉团队的。这就是我们现在必须建立的规模。


IP属地:上海来自Android客户端1楼2024-09-10 04:48回复
    Paul Alcorn:那么,随着 UDNA 将这些架构重新整合在一起,所有这些是否仍然与 RDNA 和 CDNA 分离向后兼容?
    JH:所以,我们想做的事情之一是……我们在 RDNA 方面犯了一些错误;每次我们更改内存层次结构、子系统时,它都必须重置优化矩阵。我不想这样做。
    因此,展望未来,我们考虑的不仅仅是 RDNA 5、RDNA 6、RDNA 7,还有 UDNA 6 和 UDNA 7。我们计划推出接下来的三代产品,因为一旦我们获得优化,我就不想改变内存层次结构,否则我们会失去很多优化。因此,我们有点强迫解决完全向前和向后兼容的问题。我们今天在 Xbox 上做到了这一点;这是非常可行的,但需要提前规划。还有很多工作要做,但这就是我们的方向。


    IP属地:上海来自Android客户端2楼2024-09-10 04:51
    回复
      PA:当你将其带回到统一架构时,这意味着,需要明确的是,未来的桌面 GPU 将具有与 MI300X 相同的架构?对吗?
      JH:这是一项从云到客户端的战略。我认为这也能让我们变得非常高效。因此,我们不用两个团队来做这件事,而只需要一个团队。这并不是一件疯狂的事情,对吧?我们之所以分叉,是因为我们想在短期内进行微优化,但现在我们已经有规模了,我们必须重新统一起来,我相信这是正确的方法。可能会有一些小问题。
      PA:那么,重新合并需要多长时间?我们还需要多少代产品才能实现?
      JH:我们还没有透露这一点。这是一种策略。策略对我来说非常重要。我认为这是正确的策略。我们必须确保我们做的事情是正确的。事实上,当我们与开发人员交谈时,他们很喜欢,因为同样,他们有其他部门告诉他们做不同的事情。所以,我需要降低复杂性。


      IP属地:上海来自Android客户端3楼2024-09-10 04:53
      回复
        高端硅片可以打造市场,但最终,软件支持往往决定胜负。Nvidia 已经向大师班传授了如何利用其无与伦比的专有 CUDA 生态系统构建看似坚不可摧的护城河。
        十八年前,Nvidia 开始以 CUDA 奠定其帝国的基础,其最根本的优势之一可能是 CUDA(计算统一设备架构)中的“U”。Nvidia 只有一个适用于所有用途的 CUDA 平台,它利用相同的底层微架构来实现 AI、HPC 和游戏。
        CUDA 拥有 400 万名开发人员,他的目标是为 AMD 铺平道路,使其获得类似的成功。这是一项艰巨的任务。AMD 继续依靠开源 ROCm 软件堆栈来对抗 Nvidia,但这需要用户和开源社区的支持,后者将承担优化堆栈的部分负担。AMD 为简化这项工作所做的任何努力,即使以某些类型的应用程序/游戏的一些微优化为代价,都将有助于加速该生态系统的发展。


        IP属地:上海来自Android客户端4楼2024-09-10 04:55
        回复
          AMD 因 ROCm 堆栈的效率经常分散而受到不少批评。2022年收购赛灵思时,AMD 甚至宣布将让赛灵思当时的首席执行官 Victor Peng 负责统一的 ROCm 团队,以更严格地控制该项目(Peng 最近退休)。这项努力至少取得了一些成果,但 AMD 因其 ROCm 堆栈的状态而继续受到批评——很明显,该公司还有很多工作要做,才能完全有能力与 Nvidia 的 CUDA 竞争。
          尽管UXL 基金会(一个针对加速器的开放软件生态系统,得到了高通、三星、Arm 和英特尔等业内其他参与者的广泛支持) 已经出现,但该公司仍然专注于 ROCm。
          与目前的 RDNA 和 CDNA 拆分相比,UDNA 究竟会有什么变化?Huynh 没有详细介绍,显然还有很多基础工作要做。但一个明显的潜在痛点是 RDNA 中缺乏专用的 AI 加速单元。Nvidia 从 2018 年开始将张量核心引入整个 RTX 系列。AMD 在 RDNA 3 中只有有限的 AI 加速,基本上通过 WMMA 指令以更优化的方式访问 FP16 单元,而 RDNA 2 完全依赖 GPU 着色器来完成此类工作。
          我们的假设是,AMD 将在某个时候通过 UDNA 为其 GPU 提供对张量操作的全栈支持。CDNA 自 2020 年以来就拥有这样的功能单元,并在 CDNA 2 (2021) 和 CDNA 3 (2023) 中增加了更高的吞吐量和数字格式支持。鉴于目前在数据中心和客户端 GPU 上进行的 AI 工作占主导地位,为客户端 GPU 添加张量支持似乎是一个关键需求。
          统一的 UDNA 架构是与 CUDA 竞争的下一个合乎逻辑的步骤,但 AMD 还有很长的路要走。Huynh 不会承诺新架构的发布日期,但考虑到 AI 市场涉及数十亿美元,执行新的微架构战略显然是当务之急。不过,根据我们听到的有关AMD RDNA 4的消息,UDNA 似乎至少还需要一代。


          IP属地:上海来自Android客户端5楼2024-09-10 04:55
          收起回复


            IP属地:上海来自Android客户端6楼2024-09-10 05:01
            回复
              RDNA4放弃高端市场,RDNA5会将RDNA和CDNA架构合并,推出UDNA架构,以抗衡NVIDIA的CUDA


              IP属地:上海来自Android客户端7楼2024-09-10 05:05
              回复
                之前chh上某舅舅流出来的RDNA5准备做革新式改变的消息看来是真的了,ATI吧里有供应链消息的人当时也没否定这个说法



                IP属地:广东来自Android客户端8楼2024-09-10 06:22
                回复
                  不过RDNA5也何难出能跟5090/6090级别相抗衡的卡皇。96CU的7900XTX堪堪打平80SM的4080S,完整的GB202可是足足有192SM,再保守点算5090的规模也有160SM相当于两个4080S,对于A卡来说规模没有200CU不可能抗衡


                  IP属地:广东来自Android客户端9楼2024-09-10 06:28
                  回复
                    @Alderlake 现在基本上官方石锤下代RDNA4放弃高端卡了,之前说RDNA5要做革新式改变的消息是真的


                    IP属地:广东来自Android客户端10楼2024-09-10 06:57
                    回复
                      amd的下一代旗舰能打过4090就赢了,卖6999


                      IP属地:黑龙江来自Android客户端11楼2024-09-10 07:02
                      收起回复
                        显卡菜鸡amd在游戏显卡和数据中心市场都被大黄疯狂吊打和暴打 虽然牙膏厂数据中心的市场份额在暴跌,但同时amd份额也在降,因为显卡菜鸡amd和牙膏厂的数据中心市场份额都被大黄吃光了




                        IP属地:加拿大来自Android客户端12楼2024-09-10 07:07
                        收起回复
                          晚了英伟达17年


                          IP属地:内蒙古来自Android客户端13楼2024-09-10 09:11
                          回复
                            就现在2年一代的迭代速度,AMD的显卡业务可能活不到GCN 3.0出生


                            IP属地:重庆来自Android客户端14楼2024-09-10 11:15
                            回复
                              不是早就放弃了吗没有对打4090的这次放弃之后全家打不过5080吗


                              IP属地:广东来自Android客户端15楼2024-09-12 16:54
                              回复