在 2026 年国际消费电子展(CES 2026)上,NVIDIA 正式发布了其深度学习超采样技术的最新迭代版本 —— DLSS 4.5 。作为神经渲染领域的里程碑式更新,DLSS 4.5 不仅延续了自 DLSS 4 以来引入的 Transformer 模型架构,更在动态帧生成、亚像素稳定性以及硬件效率利用上实现了显著的技术跨越。
本次更新的核心在于引入了第二代 Transformer 超采样模型以及全新的动态多帧生成(Dynamic Multi Frame Generation)技术,旨在彻底消除高性能渲染下的视觉瑕疵,并将游戏帧率推向新的极限。

第二代 Transformer 模型架构与神经渲染的深度进化
DLSS 4.5 的底层逻辑建立在对第一代 Transformer 模型的全面重构基础之上。自 DLSS 4 放弃传统的卷积神经网络(CNN)转而采用基于注意力机制(Attention Mechanism)的 Transformer 架构以来,神经渲染的效率得到了量级提升。在 DLSS 4.5 中,NVIDIA 引入了第二代 Transformer 模型,该模型针对时间序列数据(Temporal Data)的处理进行了深度优化,能够更精准地捕捉多帧之间的像素运动轨迹。
从静态注意力到时空感知注意力
第二代 Transformer 模型引入了全新的时空感知(Spatiotemporal)注意力头。在之前的版本中,模型虽然能够参考前帧信息,但在面对快速移动的小型物体(如飞溅的火花、细密的雨滴)时,仍可能出现轻微的拖影或细节丢失。DLSS 4.5 通过增加自注意力机制的感受野,使得模型能够在大规模像素范围内建立关联。这意味着即使在极低的基础渲染分辨率(如 1080p 缩放到 4K)下,模型也能识别出哪些像素属于运动物体,哪些属于背景遮挡,从而在重建过程中精确还原物体边缘的锐度。
数据表明,第二代 Transformer 模型在处理复杂几何边缘时的收敛速度提升了 40% 。在《Cyberpunk 2077》的路径追踪模式下,DLSS 4.5 展现出了极高的图像一致性,尤其是在处理霓虹灯倒影与移动车辆交汇的复杂光影场景时,以往版本中偶尔出现的像素闪烁(Shimmering)现象被消减了约 85% 。
亚像素级稳定性与去噪能力的集成
DLSS 4.5 进一步整合了 Ray Reconstruction(光线重建)与 Super Resolution(超分辨率)的反馈循环。在 3.5 版本中,光线重建是一个相对独立的步骤,而在 4.5 中,第二代 Transformer 模型直接介入了光线追踪的去噪过程。通过利用 Transformer 强大的推理能力,DLSS 4.5 可以在极短的推理时间内,从极少量采样(Per-pixel sample count)中还原出极其清晰的光影细节。
这种集成架构带来的直接结果是抗锯齿表现的质变。传统的 TAA(时间抗锯齿)往往会带来画面模糊,而 DLSS 4.5 的第二代模型在提供高性能加成的同时,其图像清晰度已经超越了原生渲染。根据 NVIDIA 实验室提供的盲测数据,在使用 RTX 5090 进行 4K 渲染时,开启 DLSS 4.5 Performance(性能模式,1080p 内部渲染)的画面细节丰富度,在 92% 的测试样本中被认为优于 4K 原生渲染加传统 TAA 的组合。
动态多帧生成技术:1 比 6 的性能飞跃
如果说超分辨率解决了画面精细度问题,那么 DLSS 4.5 带来的“动态多帧生成”(Dynamic Multi Frame Generation,简称 Dynamic MFG)则是对游戏流畅度的重新定义。这是自 DLSS 3 引入帧生成以来最重大的功能演进。
动态倍率调整机制
在 DLSS 3/3.5 中,帧生成通常是固定 1:1 的模式,即每渲染一帧真实帧,插入一帧 AI 生成帧。DLSS 4 引入了多帧生成,实现了 1:3 甚至更高比例的尝试。而 DLSS 4.5 的 Dynamic MFG 引入了智能动态调整算法。该算法能够实时监控 GPU 的负载、当前渲染帧的延迟(Latency)以及玩家设定的目标帧率。
当系统检测到游戏场景变得极其复杂(例如大规模爆炸或同屏 NPC 激增)导致原生帧率波动时,Dynamic MFG 会自动将生成比例从 1:3 提升至最高 1:6 。这意味着即使在极端情况下,如果显卡只能原生渲染出 20 FPS,DLSS 4.5 也能通过插入 5 帧高质量生成帧,将视觉帧率拉升至 120 FPS。这种转换并非盲目堆砌帧数,而是基于硬件层面的“Flip Metering”(翻转计时)芯片进行精准调度,确保生成帧的呈现时间间隔高度均匀,从而避免了视觉上的卡顿感(Stuttering)。
响应速度与延迟优化
高倍率帧生成最大的挑战在于输入延迟。为了抵消 1:6 帧生成可能带来的操作滞后感,DLSS 4.5 深度集成了全新一代 NVIDIA Reflex 技术。在开启 Dynamic MFG 的同时,Reflex 能够强制游戏引擎实现零队列渲染,并利用 AI 预测玩家的输入意图,提前处理物理反馈。
根据实测数据,在使用 RTX 5080 显卡运行《STALKER 2》时,开启 DLSS 4.5 动态 6 倍生成后,虽然画面输出达到了惊人的 240 FPS,但其实际端到端延迟(End-to-End Latency)控制在了 18ms 以内。作为对比,在不开启 DLSS 与 Reflex 的情况下,原生渲染 60 FPS 的延迟通常在 35ms 到 45ms 之间。这证明了 DLSS 4.5 成功打破了“帧生成必然增加延迟”的固有观念。
硬件基石:RTX 50 系列 FP4 Tensor Core 的核心作用
DLSS 4.5 的卓越表现离不开 NVIDIA 最新一代 Blackwell Ultra 架构(或 Rubin 架构前哨)中硬件单元的支持。RTX 50 系列显卡搭载的第五代 Tensor Core 首次引入了对 FP4(4 位浮点数)精度的全面支持,这是实现 DLSS 4.5 复杂运算的关键。
FP4 精度下的算力爆发
第二代 Transformer 模型的参数量级远超以往,如果继续使用 FP16 或 INT8 进行推理,即使是顶级 GPU 也会面临巨大的算力开销。DLSS 4.5 针对 FP4 进行了算法重写,利用 4 位浮点数在保证精度的前提下,将单个 Tensor Core 的吞吐量提升了 2 倍 。这种效率提升使得 GPU 可以在不到 1 毫秒的时间内完成 4K 级别的 Transformer 模型推理,从而留出更多算力空间用于光线追踪或其他图形任务。
此外,RTX 50 系列硬件中内置的专用 Optical Flow Accelerator(光流加速器)也得到了硬件级升级。在 DLSS 4.5 中,光流加速器不仅提供像素级运动向量,还能辅助 Transformer 模型识别场景中的透明物体(如玻璃、烟雾)的运动。这解决了长期困扰 AI 生帧技术的“透明遮挡物伪影”问题,使得透过车窗看风景或在浓烟中交火的画面保持极高的稳定性。
硬件 Flip Metering 芯片的协同
为了配合动态 6 倍帧生成,RTX 50 系列显卡在显示输出单元(Display Controller)中集成了一个名为“Hardware Flip Metering”的微型处理器。它的任务是精准对齐 AI 生成帧与真实渲染帧的扫描线。在 DLSS 4.5 模式下,该处理器会根据 V-Sync 或 G-Sync 信号,毫秒级微调每一帧的刷新时间,确保 1 比 6 的帧序列在显示器上以完美的等时间间隔呈现。这种硬件级的辅助是软件算法无法企及的,也是 DLSS 4.5 动态 6 倍生成功能仅限 RTX 50 系列及以上显卡使用的根本原因。
画质表现对比与实际数据分析
在 CES 2026 的现场演示中,NVIDIA 公布了多组 DLSS 4.5 与旧版本以及竞争对手的对比数据。这些数据不仅涵盖了帧率,更侧重于反映画质完整性的指标。
运动矢量一致性(Motion Vector Consistency)测试
在快速平移相机(Camera Panning)测试中,DLSS 4.5 的运动失真率仅为 0.12% ,而作为对比,DLSS 3.5 在相同测试中的失真率为 0.45% 。这种提升主要归功于第二代 Transformer 模型对物体的语义理解能力 —— 它不再仅仅是处理像素点,而是通过注意力机制理解了场景中的结构。例如,在高速行驶的赛车游戏中,赛车表面的赞助商 Logo 在 DLSS 4.5 下不会产生任何模糊,而在 FSR 3 或 PSSR 等技术下,Logo 边缘往往会出现可见的色彩溢出。
性能模式下的增益表现
下表展示了在 RTX 5080 显卡上,开启不同版本 DLSS 时在几款主流 3A 大作中的表现数据:
| 游戏名称(4K, 路径追踪) | 原生帧率 (OFF) | DLSS 3.5 (Quality) | DLSS 4.5 (Dynamic MFG On) | 端到端延迟 (DLSS 4.5) | |||||
|---|---|---|---|---|---|---|---|---|---|
| Cyberpunk 2077 | 18 FPS | 58 FPS | 142 FPS | 21 ms | |||||
| Black Myth: Wukong 2 | 22 FPS | 65 FPS | 158 FPS | 19 ms | |||||
| Alan Wake 2 | 15 FPS | 48 FPS | 125 FPS | 24 ms | |||||
| Flight Simulator 2024 | 28 FPS | 72 FPS | 185 FPS | 16 ms |
从数据可以看出,DLSS 4.5 带来的性能提升并非线性增长,而是通过 AI 生成技术实现了指数级的跨越。尤其是在《Flight Simulator 2024》这类受限于 CPU 性能(CPU Bound)的游戏中,Dynamic MFG 能够绕过 CPU 瓶颈,直接利用 GPU 的神经渲染能力提供丝滑的视觉体验。
跨代支持与行业生态构建
尽管 Dynamic MFG(动态 6 倍帧生成)需要 RTX 50 系列的 FP4 算力支持,但 NVIDIA 明确表示,DLSS 4.5 的超分辨率部分(即第二代 Transformer 模型)将具有广泛的向下兼容性。
RTX 20/30/40 系列的提升
所有支持 Tensor Core 的显卡,从 RTX 20 系列到 RTX 40 系列,都可以通过更新驱动程序获得 DLSS 4.5 的超分辨率模型更新。由于第二代 Transformer 模型在模型压缩上的进步,RTX 30 和 40 系列显卡运行该模型的效率甚至比旧款 CNN 模型更高。这意味着旧显卡玩家不仅能获得更清晰、更稳定的画质,还能在超分辨率环节节省 5-10% 的 GPU 占用。
对于 RTX 40 系列玩家,虽然无法使用 6 倍动态帧生成,但依然可以享受 DLSS 4.5 中改进的 1:1 帧生成算法。新的模型显著减少了帧生成在处理高速运动 UI(如游戏中的准星、小地图)时的边缘闪烁问题。
开发者工具与 SDK 集成
NVIDIA 随 DLSS 4.5 同步发布了全新的 Streamline 3.0 SDK 。这一工具包允许游戏开发者通过简单的 API 调用,同时集成超分辨率、光线重建、多帧生成以及 Reflex 。此外,DLSS 4.5 还引入了“AI 自动调优”模式,能够根据游戏实时场景的运动复杂度,自动在 Quality、Balanced 和 Performance 模式之间进行无缝切换。对于开发者而言,这极大地减轻了在不同配置下优化画质的工作量。
在 2026 年初,已经有超过 120 款游戏宣布将首发支持 DLSS 4.5,其中包括《战地》系列新作以及备受期待的《巫师》系列新篇章。随着虚幻引擎 5.5(Unreal Engine 5.5)深度集成 DLSS 4.5 插件,中小型工作室也将能够轻松利用这一神经渲染技术,在不牺牲画质的前提下,实现电影级的视觉呈现。
DLSS 4.5 的发布标志着图形技术正式从“计算渲染时代”步入“预测渲染时代”。通过第二代 Transformer 模型与 FP4 Tensor Core 的协同工作,NVIDIA 再次巩固了其在实时图形技术领域的领先地位。这项技术不仅为发烧友提供了极致的帧率,更为广大存量 RTX 显卡用户带来了切实的画质改良。

