在半导体历史的长河中,AMD(Advanced Micro Devices)的图形部门是一个充满斗志、屡败屡战却又屡出奇招的传奇。从2006年收购ATI开始,AMD便肩负起了同时对抗Intel(CPU战场)和NVIDIA(GPU战场)的“双线作战”宿命。

第一章:前传——ATI的辉煌与统一渲染架构的前夜 (2000-2006)
在并入AMD之前,ATI Technologies是图形领域的霸主之一。这一时期的架构奠定了未来Radeon品牌的基石。
1.1 R100 至 R500:从固定管线到可编程着色
- R100 (Radeon 256): 2000年发布。引入HyperZ技术(节省显存带宽),支持Charisma Engine(硬件T&L)。
- R300 (Radeon 9700 Pro): 2002年发布。历史转折点。它是世界上第一款完全支持DirectX 9.0的GPU,凭借256-bit显存位宽和8条像素管线,彻底击败了NVIDIA当时的GeForce FX系列,确立了ATI的高端地位。
- R520 (X1000系列): 2005年发布。引入了超线程分配器,为统一渲染架构做铺垫。
1.2 Xbox 360与Xenos:统一渲染的雏形
在PC端还在使用像素/顶点分离架构时,ATI为微软Xbox 360定制的Xenos GPU率先实现了统一渲染架构 (Unified Shader Architecture) 。这一设计理念直接催生了后来的TeraScale架构。
第二章:TeraScale 架构——超长指令字的豪赌 (2007-2011)
2006年,AMD以54亿美元收购ATI。随后推出的TeraScale架构(VLIW,超长指令字)是AMD时代的第一个重要篇章。
2.1 TeraScale 1 (R600/RV670)
-
发布时间: 2007年5月
-
代表型号: Radeon HD 2900 XT, HD 3870
-
架构特点:
- VLIW5: 每个着色器核心包含5个ALU(4个简单+1个复杂)。这种架构在理论浮点性能上极其强悍,但极度依赖驱动程序的指令打包效率。
- 512-bit环形总线 (Ring Bus): HD 2900 XT使用了巨大的位宽,但功耗和发热失控,导致首战失利。
-
升级点: HD 3800系列迅速修正了R600的错误,改用256-bit位宽,率先引入55nm工艺和DX10.1,主打性价比。
2.2 TeraScale 2 (RV770/Cypress)
-
发布时间: 2008年6月
-
代表型号: Radeon HD 4870, HD 5870
-
架构特点:
- GDDR5的首秀: HD 4870是显卡史上第一款采用GDDR5显存的产品,用较窄的位宽实现了极高的带宽。
- “小核心”策略: AMD放弃了与NVIDIA争夺“巨型核心”,转而制造面积更小、良率更高、成本更低的GPU(RV770),通过双芯卡(HD 4870 X2)争夺卡皇。
- Eyefinity (宽域): HD 5000系列引入,支持单卡多屏输出。
-
规格概览 (HD 5870):
- 流处理器: 1600 (VLIW5)
- 显存: 1GB GDDR5
- TDP: 188W
- 评价: HD 5870是AMD历史上最成功的高端卡之一,在Fermi(GTX 480)延期时独霸市场半年。
2.3 TeraScale 3 (Cayman)
-
发布时间: 2010年12月
-
代表型号: Radeon HD 6970
-
架构变革:
- VLIW4: 将VLIW5精简为VLIW4(去掉了利用率低的复杂ALU,改为4个对等ALU)。提高了每平方毫米的性能效率。
- 双图形引擎: 增强了曲面细分(Tessellation)性能,这是此前AMD的弱项。
第三章:GCN (Graphics Core Next)——通用计算的十年长跑 (2012-2019)
TeraScale虽然图形性能不错,但通用计算(GPGPU)能力极差。随着计算时代到来,AMD推倒重来,发布了革命性的GCN架构。这是一个为计算而生,却在图形领域“战未来”的架构。
3.1 GCN 1.0 (Tahiti/Pitcairn/Cape Verde)
-
发布时间: 2011年12月
-
代表型号: Radeon HD 7970 (Tahiti XT), HD 7850
-
架构详析:
- SIMD取代VLIW: 放弃指令打包,转向标量设计。由计算单元 (CU) 组成,每个CU包含64个流处理器(分4组SIMD-16)。
- 异步计算 (Asynchronous Compute): GCN的杀手锏,允许图形和计算任务同时排队执行。这在后来的DX12和Vulkan游戏中成为了“A卡战未来”的物理基础。
-
HD 7970 规格:
- 流处理器: 2048
- 显存: 3GB GDDR5 (384-bit)
- 历史地位: 第一款PCIe 3.0显卡,第一款28nm显卡。
3.2 GCN 2.0 (Hawaii) & GCN 3.0 (Fiji)
-
发布时间: 2013年 - 2015年
-
代表型号: R9 290X, R9 Fury X
-
架构升级:
- Hawaii (R9 290X): 暴力堆料的巅峰。512-bit位宽,温度极高(公版设定95度),但性能足以抗衡GTX 780 Ti。
- Fiji (Fury X): HBM显存的首秀。AMD率先在消费级显卡引入高带宽显存(HBM1),通过中介层(Interposer)封装。虽然显存只有4GB限制了其寿命,但技术极具前瞻性。
3.3 GCN 4.0 (Polaris - 北极星)
-
发布时间: 2016年6月
-
代表型号: Radeon RX 480, RX 580, RX 590
-
战略转移: AMD放弃了与GTX 1080/1070的高端竞争,利用14nm FinFET工艺主攻200-300美元主流市场。
-
规格 (RX 580):
- 流处理器: 2304
- 显存: 8GB GDDR5
- 评价: 一代神卡。由于出色的挖矿性能和长久的驱动支持,至今仍活跃在二手市场。
3.4 GCN 5.0 (Vega - 织女星)
-
发布时间: 2017年8月
-
代表型号: RX Vega 64, RX Vega 56, Radeon VII (Vega 20, 7nm)
-
技术特点:
- HBCC (高带宽缓存控制器): 允许将系统内存作为显存扩展。
- HBM2: 解决了容量问题。
- 瓶颈: GCN架构在扩展到4096个流处理器时遇到了严重的几何瓶颈和功耗墙。Vega是GCN架构的绝唱,证明了该架构已不适合现代高性能游戏。
第四章:RDNA 架构——为游戏而生的涅槃 (2019-至今)
面对NVIDIA的强势和GCN在游戏效能上的疲态,AMD做出了一个大胆的决定:将架构分叉。CDNA 负责数据中心计算,RDNA 专注游戏图形。
4.1 RDNA 1 (Navi 10)
-
发布时间: 2019年7月
-
代表型号: Radeon RX 5700 XT, RX 5600 XT
-
核心变革:
- WGP (Work Group Processor): 取代了传统的CU作为基本调度单位。
- Wave32: 相比GCN的Wave64,RDNA采用Wave32指令执行,更适合游戏这种随机性强、依赖低延迟的负载。
- IPC提升: 同频性能相比GCN提升约25%。
- 缺失: 不支持硬件光线追踪。
4.2 RDNA 2 (Navi 21 - Big Navi)
-
发布时间: 2020年11月
-
代表型号: Radeon RX 6900 XT, RX 6800 XT, RX 6600
-
主要突破:
-
Infinity Cache (无限缓存): 这是RDNA 2的灵魂。通过在GPU内部塞入128MB巨大的L3缓存,大幅降低了对显存位宽的依赖(仅需256-bit即可通过缓存命中率通过等效高带宽),极大地提升了能效比。
-
Ray Accelerator (光线加速器): 每个CU配备一个RA单元,实现了硬件光追。
-
高频设计: 轻松突破2.2GHz - 2.5GHz。
-
RX 6900 XT 规格:
- 流处理器: 5120
- 无限缓存: 128MB
- 显存: 16GB GDDR6
- 评价: AMD多年来首次在传统光栅化性能上追平NVIDIA旗舰(RTX 3090)。
-
4.3 RDNA 3 (Navi 31)
-
发布时间: 2022年12月
-
代表型号: Radeon RX 7900 XTX, RX 7900 XT
-
架构创新:
- Chiplet (小芯片) 设计: 消费级GPU史上首次采用。将计算核心(GCD, 5nm)和显存控制器/缓存(MCD, 6nm)分离。降低了先进制程的成本风险。
- 双路指令发射: 每个CU包含双倍的SIMD32单元,理论浮点性能翻倍(虽然游戏实测并非线性翻倍)。
- AI加速器: 引入专用的AI指令单元,虽然不如Tensor Core强大,但在FSR及其他AI应用中提供支持。
-
RX 7900 XTX 规格:
- 流处理器: 6144
- 显存: 24GB GDDR6 (384-bit)
- 无限缓存: 96MB (第二代)
4.4 RDNA 4 (Navi 48/44) [2025年视角]
-
发布时间: 2025年Q1 (CES 2025)
-
定位: 放弃旗舰争夺,专注中高端主流市场(甜点级)。
-
技术预期:
- 光追性能大幅修正: 重点改进RDNA 2/3时代孱弱的光追性能,采用类似PS5 Pro的RT引擎技术。
- AI算力增强: 为FSR 4 (AI帧生成) 提供硬件基础。
- 目标: 以RX 8800 XT替代RX 7900 XT的性能,但功耗和价格大幅降低。
第五章:CDNA 架构——数据中心的AI巨兽
虽然普通消费者接触不到,但CDNA是AMD股价飙升的关键。
-
CDNA 1 (MI100): 去除所有图形显示功能(光栅化、渲染管线),专注于FP32/FP64矩阵计算。
-
CDNA 2 (MI200): 首个多芯片封装(MCM)GPU,FP64性能在当时是世界第一,主要用于超算(如Frontier)。
-
CDNA 3 (MI300系列):
- MI300A: CPU (Zen 4) + GPU (CDNA 3) 的APU设计,统一内存架构。
- MI300X: 纯GPU版,拥有192GB HBM3显存,直接对标NVIDIA H100,凭借大显存在LLM推理市场获得一席之地。
第六章:历代核心规格参数速查表 (部分精选)
为了方便查阅,以下列出各代具有里程碑意义的旗舰/次旗舰型号规格。
| 架构代号 | 核心代号 | 型号 | 发布年份 | 工艺 | 流处理器 (SP) | 显存 | 位宽 | 典型TDP | 备注 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| TeraScale 1 | R600 | HD 2900 XT | 2007 | 80nm | 320 (VLIW5) | 512MB G3 | 512-bit | 215W | 环形总线失败作 | ||||||||||
| TeraScale 2 | RV770 | HD 4870 | 2008 | 55nm | 800 (VLIW5) | 512MB G5 | 256-bit | 150W | GDDR5首秀 | ||||||||||
| TeraScale 2 | Cypress | HD 5870 | 2009 | 40nm | 1600 (VLIW5) | 1GB G5 | 256-bit | 188W | DX11霸主 | ||||||||||
| GCN 1.0 | Tahiti | HD 7970 | 2011 | 28nm | 2048 | 3GB G5 | 384-bit | 250W | GCN首秀 | ||||||||||
| GCN 2.0 | Hawaii | R9 290X | 2013 | 28nm | 2816 | 4GB G5 | 512-bit | 290W | 高温战神 | ||||||||||
| GCN 3.0 | Fiji | R9 Fury X | 2015 | 28nm | 4096 | 4GB HBM | 4096-bit | 275W | HBM首秀 | ||||||||||
| GCN 4.0 | Polaris 10 | RX 480 | 2016 | 14nm | 2304 | 8GB G5 | 256-bit | 150W | 性价比之王 | ||||||||||
| GCN 5.0 | Vega 10 | RX Vega 64 | 2017 | 14nm | 4096 | 8GB HBM2 | 2048-bit | 295W | GCN绝唱 | ||||||||||
| RDNA 1 | Navi 10 | RX 5700 XT | 2019 | 7nm | 2560 | 8GB G6 | 256-bit | 225W | 纯游戏架构 | ||||||||||
| RDNA 2 | Navi 21 | RX 6900 XT | 2020 | 7nm | 5120 | 16GB G6 | 256-bit | 300W | 能效比逆袭 | ||||||||||
| RDNA 3 | Navi 31 | RX 7900 XTX | 2022 | 5/6nm | 6144 | 24GB G6 | 384-bit | 355W | 小芯片设计 | ||||||||||
| RDNA 4 | Navi 48 | RX 8800 XT | 2025 | 4nm | (预计) | 16GB G6 | 256-bit | <250W | 待发布 |
结语与未来展望
从Radeon 9700 Pro的惊天一击,到HD 5870的独孤求败,再到GCN时代的漫长蛰伏与RDNA的绝地反击,AMD GPU的历史就是一部以弱胜强、技术豪赌的战史。
进入2025年,随着AI成为科技界的主旋律,AMD的策略再次调整。RDNA 4暂时避开了与NVIDIA旗舰卡的正面锋芒,转而巩固玩家基数最大的中端市场;而CDNA架构则全速冲刺,试图在AI数据中心领域打破CUDA的壁垒。
对于发烧友而言,AMD依然是那个不可或缺的“挑战者”。正因为有了红队的坚持,图形技术的演进才没有陷入垄断的停滞。
微信扫描下方的二维码阅读本文

