AMD GPU编年史:从ATI R100到RDNA 4,从霸主到追赶者,显卡红色阵营的传奇故事

在半导体历史的长河中,AMD(Advanced Micro Devices)的图形部门是一个充满斗志、屡败屡战却又屡出奇招的传奇。从2006年收购ATI开始,AMD便肩负起了同时对抗Intel(CPU战场)和NVIDIA(GPU战场)的“双线作战”宿命。

image


第一章:前传——ATI的辉煌与统一渲染架构的前夜 (2000-2006)

在并入AMD之前,ATI Technologies是图形领域的霸主之一。这一时期的架构奠定了未来Radeon品牌的基石。

1.1 R100 至 R500:从固定管线到可编程着色

  • R100 (Radeon 256): 2000年发布。引入HyperZ技术(节省显存带宽),支持Charisma Engine(硬件T&L)。
  • R300 (Radeon 9700 Pro): 2002年发布。​历史转折点。它是世界上第一款完全支持DirectX 9.0的GPU,凭借256-bit显存位宽和8条像素管线,彻底击败了NVIDIA当时的GeForce FX系列,确立了ATI的高端地位。
  • R520 (X1000系列): 2005年发布。引入了超线程分配器,为统一渲染架构做铺垫。

1.2 Xbox 360与Xenos:统一渲染的雏形

在PC端还在使用像素/顶点分离架构时,ATI为微软Xbox 360定制的Xenos GPU率先实现了​统一渲染架构 (Unified Shader Architecture) 。这一设计理念直接催生了后来的TeraScale架构。


第二章:TeraScale 架构——超长指令字的豪赌 (2007-2011)

2006年,AMD以54亿美元收购ATI。随后推出的TeraScale架构(VLIW,超长指令字)是AMD时代的第一个重要篇章。

2.1 TeraScale 1 (R600/RV670)

  • 发布时间: 2007年5月

  • 代表型号: Radeon HD 2900 XT, HD 3870

  • 架构特点:

    • VLIW5: 每个着色器核心包含5个ALU(4个简单+1个复杂)。这种架构在理论浮点性能上极其强悍,但极度依赖驱动程序的指令打包效率。
    • 512-bit环形总线 (Ring Bus): HD 2900 XT使用了巨大的位宽,但功耗和发热失控,导致首战失利。
  • 升级点: HD 3800系列迅速修正了R600的错误,改用256-bit位宽,率先引入55nm工艺和DX10.1,主打性价比。

2.2 TeraScale 2 (RV770/Cypress)

  • 发布时间: 2008年6月

  • 代表型号: Radeon HD 4870, HD 5870

  • 架构特点:

    • GDDR5的首秀: HD 4870是显卡史上第一款采用GDDR5显存的产品,用较窄的位宽实现了极高的带宽。
    • “小核心”策略: AMD放弃了与NVIDIA争夺“巨型核心”,转而制造面积更小、良率更高、成本更低的GPU(RV770),通过双芯卡(HD 4870 X2)争夺卡皇。
    • Eyefinity (宽域): HD 5000系列引入,支持单卡多屏输出。
  • 规格概览 (HD 5870):

    • 流处理器: 1600 (VLIW5)
    • 显存: 1GB GDDR5
    • TDP: 188W
    • 评价: HD 5870是AMD历史上最成功的高端卡之一,在Fermi(GTX 480)延期时独霸市场半年。

2.3 TeraScale 3 (Cayman)

  • 发布时间: 2010年12月

  • 代表型号: Radeon HD 6970

  • 架构变革:

    • VLIW4: 将VLIW5精简为VLIW4(去掉了利用率低的复杂ALU,改为4个对等ALU)。提高了每平方毫米的性能效率。
    • 双图形引擎: 增强了曲面细分(Tessellation)性能,这是此前AMD的弱项。

第三章:GCN (Graphics Core Next)——通用计算的十年长跑 (2012-2019)

TeraScale虽然图形性能不错,但通用计算(GPGPU)能力极差。随着计算时代到来,AMD推倒重来,发布了革命性的GCN架构。这是一个为计算而生,却在图形领域“战未来”的架构。

3.1 GCN 1.0 (Tahiti/Pitcairn/Cape Verde)

  • 发布时间: 2011年12月

  • 代表型号: Radeon HD 7970 (Tahiti XT), HD 7850

  • 架构详析:

    • SIMD取代VLIW: 放弃指令打包,转向标量设计。由计算单元 (CU) 组成,每个CU包含64个流处理器(分4组SIMD-16)。
    • 异步计算 (Asynchronous Compute): GCN的杀手锏,允许图形和计算任务同时排队执行。这在后来的DX12和Vulkan游戏中成为了“A卡战未来”的物理基础。
  • HD 7970 规格:

    • 流处理器: 2048
    • 显存: 3GB GDDR5 (384-bit)
    • 历史地位: 第一款PCIe 3.0显卡,第一款28nm显卡。

3.2 GCN 2.0 (Hawaii) & GCN 3.0 (Fiji)

  • 发布时间: 2013年 - 2015年

  • 代表型号: R9 290X, R9 Fury X

  • 架构升级:

    • Hawaii (R9 290X): 暴力堆料的巅峰。512-bit位宽,温度极高(公版设定95度),但性能足以抗衡GTX 780 Ti。
    • Fiji (Fury X):HBM显存的首秀。AMD率先在消费级显卡引入高带宽显存(HBM1),通过中介层(Interposer)封装。虽然显存只有4GB限制了其寿命,但技术极具前瞻性。

3.3 GCN 4.0 (Polaris - 北极星)

  • 发布时间: 2016年6月

  • 代表型号: Radeon RX 480, RX 580, RX 590

  • 战略转移: AMD放弃了与GTX 1080/1070的高端竞争,利用14nm FinFET工艺主攻200-300美元主流市场。

  • 规格 (RX 580):

    • 流处理器: 2304
    • 显存: 8GB GDDR5
    • 评价: 一代神卡。由于出色的挖矿性能和长久的驱动支持,至今仍活跃在二手市场。

3.4 GCN 5.0 (Vega - 织女星)

  • 发布时间: 2017年8月

  • 代表型号: RX Vega 64, RX Vega 56, Radeon VII (Vega 20, 7nm)

  • 技术特点:

    • HBCC (高带宽缓存控制器): 允许将系统内存作为显存扩展。
    • HBM2: 解决了容量问题。
    • 瓶颈: GCN架构在扩展到4096个流处理器时遇到了严重的几何瓶颈和功耗墙。Vega是GCN架构的绝唱,证明了该架构已不适合现代高性能游戏。

第四章:RDNA 架构——为游戏而生的涅槃 (2019-至今)

面对NVIDIA的强势和GCN在游戏效能上的疲态,AMD做出了一个大胆的决定:将架构分叉。CDNA 负责数据中心计算,RDNA 专注游戏图形。

4.1 RDNA 1 (Navi 10)

  • 发布时间: 2019年7月

  • 代表型号: Radeon RX 5700 XT, RX 5600 XT

  • 核心变革:

    • WGP (Work Group Processor): 取代了传统的CU作为基本调度单位。
    • Wave32: 相比GCN的Wave64,RDNA采用Wave32指令执行,更适合游戏这种随机性强、依赖低延迟的负载。
    • IPC提升: 同频性能相比GCN提升约25%。
    • 缺失: 不支持硬件光线追踪。

4.2 RDNA 2 (Navi 21 - Big Navi)

  • 发布时间: 2020年11月

  • 代表型号: Radeon RX 6900 XT, RX 6800 XT, RX 6600

  • 主要突破:

    • Infinity Cache (无限缓存): 这是RDNA 2的灵魂。通过在GPU内部塞入128MB巨大的L3缓存,大幅降低了对显存位宽的依赖(仅需256-bit即可通过缓存命中率通过等效高带宽),极大地提升了能效比。

    • Ray Accelerator (光线加速器): 每个CU配备一个RA单元,实现了硬件光追。

    • 高频设计: 轻松突破2.2GHz - 2.5GHz。

    • RX 6900 XT 规格:

      • 流处理器: 5120
      • 无限缓存: 128MB
      • 显存: 16GB GDDR6
      • 评价: AMD多年来首次在传统光栅化性能上追平NVIDIA旗舰(RTX 3090)。

4.3 RDNA 3 (Navi 31)

  • 发布时间: 2022年12月

  • 代表型号: Radeon RX 7900 XTX, RX 7900 XT

  • 架构创新:

    • Chiplet (小芯片) 设计: 消费级GPU史上首次采用。将计算核心(GCD, 5nm)和显存控制器/缓存(MCD, 6nm)分离。降低了先进制程的成本风险。
    • 双路指令发射: 每个CU包含双倍的SIMD32单元,理论浮点性能翻倍(虽然游戏实测并非线性翻倍)。
    • AI加速器: 引入专用的AI指令单元,虽然不如Tensor Core强大,但在FSR及其他AI应用中提供支持。
  • RX 7900 XTX 规格:

    • 流处理器: 6144
    • 显存: 24GB GDDR6 (384-bit)
    • 无限缓存: 96MB (第二代)

4.4 RDNA 4 (Navi 48/44) [2025年视角]

  • 发布时间: 2025年Q1 (CES 2025)

  • 定位: 放弃旗舰争夺,专注中高端主流市场(甜点级)。

  • 技术预期:

    • 光追性能大幅修正: 重点改进RDNA 2/3时代孱弱的光追性能,采用类似PS5 Pro的RT引擎技术。
    • AI算力增强: 为FSR 4 (AI帧生成) 提供硬件基础。
    • 目标: 以RX 8800 XT替代RX 7900 XT的性能,但功耗和价格大幅降低。

第五章:CDNA 架构——数据中心的AI巨兽

虽然普通消费者接触不到,但CDNA是AMD股价飙升的关键。

  • CDNA 1 (MI100): 去除所有图形显示功能(光栅化、渲染管线),专注于FP32/FP64矩阵计算。

  • CDNA 2 (MI200): 首个多芯片封装(MCM)GPU,FP64性能在当时是世界第一,主要用于超算(如Frontier)。

  • CDNA 3 (MI300系列):

    • MI300A: CPU (Zen 4) + GPU (CDNA 3) 的APU设计,统一内存架构。
    • MI300X: 纯GPU版,拥有192GB HBM3显存,直接对标NVIDIA H100,凭借大显存在LLM推理市场获得一席之地。

第六章:历代核心规格参数速查表 (部分精选)

为了方便查阅,以下列出各代具有里程碑意义的旗舰/次旗舰型号规格。

架构代号 核心代号 型号 发布年份 工艺 流处理器 (SP) 显存 位宽 典型TDP 备注
TeraScale 1 R600 HD 2900 XT 2007 80nm 320 (VLIW5) 512MB G3 512-bit 215W 环形总线失败作
TeraScale 2 RV770 HD 4870 2008 55nm 800 (VLIW5) 512MB G5 256-bit 150W GDDR5首秀
TeraScale 2 Cypress HD 5870 2009 40nm 1600 (VLIW5) 1GB G5 256-bit 188W DX11霸主
GCN 1.0 Tahiti HD 7970 2011 28nm 2048 3GB G5 384-bit 250W GCN首秀
GCN 2.0 Hawaii R9 290X 2013 28nm 2816 4GB G5 512-bit 290W 高温战神
GCN 3.0 Fiji R9 Fury X 2015 28nm 4096 4GB HBM 4096-bit 275W HBM首秀
GCN 4.0 Polaris 10 RX 480 2016 14nm 2304 8GB G5 256-bit 150W 性价比之王
GCN 5.0 Vega 10 RX Vega 64 2017 14nm 4096 8GB HBM2 2048-bit 295W GCN绝唱
RDNA 1 Navi 10 RX 5700 XT 2019 7nm 2560 8GB G6 256-bit 225W 纯游戏架构
RDNA 2 Navi 21 RX 6900 XT 2020 7nm 5120 16GB G6 256-bit 300W 能效比逆袭
RDNA 3 Navi 31 RX 7900 XTX 2022 5/6nm 6144 24GB G6 384-bit 355W 小芯片设计
RDNA 4 Navi 48 RX 8800 XT 2025 4nm (预计) 16GB G6 256-bit <250W 待发布

结语与未来展望

从Radeon 9700 Pro的惊天一击,到HD 5870的独孤求败,再到GCN时代的漫长蛰伏与RDNA的绝地反击,AMD GPU的历史就是一部以弱胜强、技术豪赌的战史。

进入2025年,随着AI成为科技界的主旋律,AMD的策略再次调整。RDNA 4暂时避开了与NVIDIA旗舰卡的正面锋芒,转而巩固玩家基数最大的中端市场;而CDNA架构则全速冲刺,试图在AI数据中心领域打破CUDA的壁垒。

对于发烧友而言,AMD依然是那个不可或缺的“挑战者”。正因为有了红队的坚持,图形技术的演进才没有陷入垄断的停滞。



微信扫描下方的二维码阅读本文

AMD GPU编年史:从ATI R100到RDNA 4,从霸主到追赶者,显卡红色阵营的传奇故事 - AMD, GPU, GPU计算平台, IT史话, 品牌故事, 品类科普, 显卡, 电脑游戏

一叶
一叶

一个好奇的玩家,热爱生活,更热爱探索

文章: 1721

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注

玩亦可及