ADVERTISEMENT
NVIDIA推出DLSS 4升频与Reflex低延迟等强化游戏体验的技术,其中还包括RTX 50系列显示卡独享、能够让游戏FPS效能冲到8倍的多画格补帧效能禁药。
DLSS 4节省15/16绘图负载
NVIDIA应用深度学习研究副总裁(VP of Applied Deep Learning Research)Bryan Catanzaro分析游戏体验受3大即时绘图因素影响,分别为影像画质、流畅度、灵敏度,若将这3个因素转换为量化数据,就是解析度、FPS、操作延迟。然而需要改善这3种因素都会导致运算负载增加,在不提高系统效能的前提下,只能在3者间互相取捨,或是升级更高阶或更大量的显示卡,以满足运算需求。
而NVIDIA也提供另类的解决方案,就是透过DLSS、Relfex等技术,以AI协助改善游戏体验。
延伸阅读:CES2025:黄仁勋手持「硅盾」演讲,发表Blackwell家族显示卡、显示晶片,RTX 5090 71990元月底上市CES2025:NVIDIA GeForce RTX 5090 效能怪兽!双穿透散热设计、电路板解密CES 2025 - NVIDIA编辑日(上):RTX 50系列显示卡与Blackwell架构特色解说CES 2025 - NVIDIA编辑日(下):RTX 50系列显示卡独有DLSS 4多重画格生成功能与Reflex低延迟技术(本文)
NVIDIA推出的DLSS主要可以分为3大类功能,分别为降低游戏绘制解析度并透过AI升频的超解析度(Super Resolution)、透过AI强化光线追蹤绘图的光线重建(Ray Reconstruction),以及透过AI产生额外画格的画格生成(Frame Generation)。前2者皆能降低绘图的实际运算需求,具有降低延迟与提高FPS效能的双重功效,画格生成不会降低绘图运算量且需等待短暂AI运算的间格,所以会造成延迟微幅提高,但仍可提升FPS效能。
(强烈建议读者点击上方3项技术之超连结,複习一下它们的原理。)
新推出的DLSS 4具有2大改变,首先它将超解析度、光线重建、画格生成等3种AI功能使用的模型架构,由原先的卷积神经网路模型(Convolutional neural network,CNN)改为Transformer模型,有助于提升时域稳定性(Temporal Stability),发挥降低鬼影、提高动态细节等效果。
所有的GeForce RTX系列显示卡(包含RTX 20 / 30 / 40 / 50)都可以透过更新驱动程式的方式取得DLSS 4的Transformer模型功能。而NVIDIA也表示,如同过去6年间CNN模型能够透过升级模型改善DLSS的图像品质,Transformer模型也具有相当的发展潜力,并且同样可以藉由软件升级的方式提升品质。
DLSS 4的另一个重大更新是支援多重画格生成(Multi Frame Generation),最多可以参考单一绘制画格以产生3个生成画格。然而这个功能需要在系统绘制1个画格之后,执行5组AI推论运算以产生额外的3个生成画格,AI运算的负载较先前的3组推论高出许多,因此限定只能在RTX 50系列显示卡使用。
NVIDIA App中提供DLSS覆写设定功能(DLSS Overrides),如果原本游戏支援DLSS的超解析度、光线重建、画格生成等功能,则可透过覆写设定强制切换至Transformer模型,以获得更细緻的升频效果,或是将超解析度功能强制切换为DLAA反锯齿功能或超高效能模式(Ultra Performance)。此外如果原本游戏支援DLSS画格生成功能,还强制开启多重画格生成功能(仍只支援RTX 50系列显示卡)。
▲ 游戏体验受影像画质、流畅度、灵敏度等因素影响,若只有单一显示卡就需要在不同因素之间取捨。
▲ 如果使用10张显示卡或许能满足3个因素,但却不切实际。NVIDIA则提出以AI达成相近效果的解决方案。
▲ DLSS 4的2大改变为改用Transformer模型与新增多重画格生成功能。其中Transformer模型具有降低鬼影、提高动态细节等效果。
▲ NVIDIA官方提供的CNN与Transformer超解析度模型对照影片。
▲ 影片中的主角会晃动身体,而使用Transformer模型具有较佳的图像品质,背包的纹理仍清晰可见。
▲ 光线重建功能改用Transformer模型后有具有较佳画质。
▲ CNN模型的铁丝网充满锯齿,后方物件比较模糊。Transformer模型则没有此为问题。
▲ 过去使用DLSS 3的会执行超解析度与光线重建、画格生成、光学流加速器等3套AI推论运算。
▲ DLSS 4的多重画格生成则会执行超解析度与光线重建、画格生成、3组AI光学流,总共5套AI推论运算。
▲ 但是DLSS 4只需执行图中灰色的实际绘图,透过升频方式放大至4倍解析度,并透过多重画格生成产生3个额外画格。等于将实际绘图负载降低只1/16,其于15/16的画面资讯都是由AI生成。
▲ NVIDIA官方提供的DLSS 4效能增益图表,最高可带来8.2倍的增益。
▲ 4种不同情况的FPS与延迟对照。左起为关闭DLSS,开启DLSS 2(超解析度)因降低实际绘图负载,对FPS与延迟都有帮助。DLSS 3.5加入画格生成,可以提升FPS,但延迟持平。DLSS 4则透过多重画格生成进一步提升FPS。
▲ DLSS 4功能相容一览。画格生成需使用RTX 40 / 50系列显示卡,而多重画格生成需RTX 50。
AI协助降低游戏延迟
NVIDIA先前推出的Reflex低延迟技术透过取消绘图伫列的方式降低游戏的操作延迟,进而提升玩家的竞技优势。
Reflex 2则是进一步使用AI图像生成的局部重绘(Inpaint)方式产生2个画格之间的差异,以降低绘制时间(Frame Time),有助于更快将玩家操作后的画面送至萤幕,降低延迟并提高游戏操作的灵敏度。
以射击游戏为例,当游戏的FPS已经很高的时候,玩家移动滑鼠并移动视角时,每个画格的差异就会很小,这时候与其重新绘制整张图片,还不如参考前一张画格与视角变动等资讯,然后以局部重绘方式产生下一张画格,如此一来就能省去很多运算时间,发挥进一步降低延迟的效果。
这是什么诺贝尔奖等级的创意!
▲ 目前已有120款游戏支援Reflex低延迟技术。
▲ 传统绘图机制会在CPU(处理器)完成运算并产生绘图需求后,将需求送进伫列,等待GPU(绘图处理器)进行绘制。
▲ Reflex则是捨弃绘图伫列,绘图需求一旦产生就就直接送进GPU。
▲ Reflex 2维持这样的基本机制,并新增透过AI图像生成的方式缩短部分画格的绘制时间,以降低游戏延迟。请注意GPU栏的3张图,中间图的右半部为滑鼠移动后需要重新绘制的区域,下方图则是透过AI图像生成补上空缺,有助于缩短绘图时间,并降低操作与新图像传送至萤幕的延迟。
▲ 在游戏FPS很高的情况,每个画面的差异就会相对比较小。图中左侧白色标示的部分(画面左上与左下,枪枝右上部)则为需要透过AI图像生成「填空」的部分。
关于Blackwell 架构与RTX 50系列的初步特色功能介绍先到此告一段落,笔者也会在近期持续制作,GeForce RTX 5090效能测试与更多技术解说的专题报导,请读者保持关注。