《黑神话:悟空》揭了GPU的老底

《黑神话:悟空》已横空出世,大家都玩上了吗?电脑还能带动吗?甚至有玩家晒出因为玩《黑神话:悟空》导致电脑主机被烧毁的视频。

《黑神话:悟空》是一款以中国神话为背景的动作角色扮演游戏。故事取材于中国古典小说“四大名著”之一的《西游记》。在游戏中,玩家将扮演一位“天命人”,为了探寻昔日传说的真相,踏上一条充满危险与惊奇的西游之路。

《黑神话:悟空》在8月20日上市后持续引爆市场。有数据显示,《黑神话:悟空》在Steam游戏平台上已售出超过300万份,加上Epic游戏商城、腾讯WeGame和索尼PlayStation平台,总销量超过450万份,总销售额超过15亿元人民币,创下多个国产游戏销售纪录。
官方数据显示,截止到2024年8月23日21点整,《黑神话:悟空》全平台销量已超过1000万套。而高盛集团预测,乐观情况下,该游戏可能售出2000万份,收入超过50亿元人民币。

《黑神话:悟空》也是中国首款3A游戏,这意味着该游戏在高成本、高体量、高质量方面十分突出。该游戏对运行的硬件配置提出了一定的要求,特别是游戏宣传支持全景光线追踪(英伟达称之为路径追踪)、全分辨率多次弹射光线追踪间接照明、全分辨率光线追踪反射、光线追踪粒子反射、光线追踪焦散以及光线追踪阴影。这些技术的应用显著提升了游戏中的光照效果、特效表现和整体沉浸感,使之成为目前市场上最具技术先进性和沉浸感的游戏之一。

一场视觉盛宴

《黑神话:悟空》适用于PC电脑和主机玩家,但如果玩家想在图形表现上体验到游戏的全部魅力,最好使用英伟达GPU显卡。该游戏支持全景光线追踪,但正如预期的那样,这对显卡的需求超高。不过,即使没有英伟达RTX GPU或光线追踪模式,游戏在纯光栅化(Rasterization)模式下也非常美观。在《黑神话:悟空》质量方面,《PC Gamer》为该游戏给打出了87分的成绩,可以作为3A大作的评价参考。

测试人员更感兴趣的是《黑神话:悟空》在一些顶级显卡上的运行情况,并对最新一代的英伟达、AMD和英特尔显卡进行测试,看看它们的表现如何。还有一款独立的《黑神话:悟空》基准测试工具,它使用与主游戏相同的内置基准测试,这对性能检查很有帮助。

令人惊喜的是,《黑神话:悟空》游戏全面支持各类技术,包括DLSS 3.7.1升级版和(frame generation)帧生成,FSR 3.1升级版和帧生成,以及XeSS 1.3升级版功能。然而,FSR似乎仍存在一些渲染问题,相比于DLSS,其重影和伪影更多。本文中选择在所有情况下使用67%的缩放比例进行测试,测试人员表示,这能比原生分辨率提供更高的性能,尽管偶尔会出现图像清晰度的损失。

为了初步了解《黑神话:悟空》在PC电脑上的运行情况,测试人员使用了标准的显卡测试电脑,该配置包括英特尔酷睿i9-13900K Raptor Lake处理器、32GB DDR5-6400内存和4TB英睿达T700 PCIe 5.0固态硬盘存储。然后,测试人员使用各公司最新的驱动程序对当前一代的AMD、英伟达和英特尔显卡进行了测试,包括使用英伟达560.87驱动预览版——很明显这是英伟达推荐的游戏——其游戏优化与公开版560.94驱动相同。还使用AMD 24.7.1和英特尔5971驱动程序,尽管AMD的驱动程序并非是为《黑神话:悟空》特别准备的。

测试人员并没有测试所有当前一代的显卡,而是跳过英伟达RTX 4080和RTX 4070 Ti,选择测试它们的super版本。

测试人员在1080p分辨率下使用中画质预设进行测试,再次手动将缩放比例调整为67%——退出菜单后,游戏总是会将该比例降到66%(如果是从66%开始,则会降到65%,供参考)。测试人员还在1080p、1440p和4K分辨率下使用“影视级画质”预设进行了测试,同样将缩放比例手动调整为67%。几乎所有的测试都是在未启用帧生成的情况下进行的,因为该功能更像是营销手段,而不是能够真正提升整体游戏体验的东西,但仍然有使用图表展示了在启用帧生成模式下游戏的运行情况。

本次基准测试是在纯光栅化模式(使用虚幻引擎的全局光照系统)下运行的,原因显而易见。然后使用相同的设置,只是将“全景光线追踪”打开,并结合中画质、使用低光线追踪预设,然后在1080p、1440p和4K分辨率下使用“影视级画质”预设和超高的光线追踪设置。测试人员还以最高1080p设置并启用帧生成作为最终数据点,以了解这将如何影响“性能”或者至少是影响到显示器上的生成帧数量。

全景光线追踪在低等和中等选项设置下对视觉效果的提升有限,而在非英伟达显卡上,开启“超高”选项则会大幅降低性能。它确实提升了游戏的视觉效果,增加了许多细节,但这主要是为那些至少拥有英伟达RTX 4070或更高级别显卡的玩家所设计的功能。

中画质显卡表现

首先来看一下光栅化的性能表现。每个设置至少运行两次,取较高的结果;第一次测试(即启动游戏后)运行三次,并舍弃第一次结果。内置的基准测试大约持续145秒,要测试每个显卡上的多达九种不同设置需要花费大量时间。

测试人员从中画质预设开始,这提供了视觉保真度和性能的良好平衡。虚幻引擎的Lumen和Nanite技术得到了很好的应用,尽管将Lumen归类为“软件光线追踪”有点勉强——更准确地说,它是“基于着色器的渲染,带有一些近似光线追踪的计算”,这基本上就是人们所认为的“光栅化”的含义。该技术的某些元素可能可以算作轻量级光线追踪,但例如在反射方面,它使用的仍然是传统的SSR(屏幕空间反射)。

还有一点要提的是,游戏在所有设置下默认使用超采样(Upscaling)。它使用一个范围从25到100的滑块,代表16倍超采样。它会在1080p时将比例设置为66%,在1440p时为50%,而在4K时则为44%(1600x900分辨率下默认是80%——只有720p默认是100%缩放)。

如果玩家习惯了标准的画质、平衡和性能放大模式,那么《黑神话:悟空》所使用的值通常更为激进。质量模式通常意味着约2倍放大,或者目标分辨率的约71%;平衡模式使用约3倍放大,或58%的缩放;性能模式使用约4倍放大,或目标分辨率的50%。(DLSS、FSR和XeSS也可以根据游戏和版本使用略有不同的值,但这里不打算深入探讨这些细节。)

为了实现目的,测试人员不想依赖于不同的缩放值,所以为所有测试设置了静态的67%缩放。这意味着在1080p输出时为1280x720渲染分辨率,1440p输出时为1707x960渲染分辨率,而4K输出时为2560x1440渲染分辨率。如果使用游戏的默认值,那么1080p和1440p输出的渲染分辨率将分别为1280x720、1280x720,而4K时为1707x960——这意味着1080p和1440p的结果会非常相似,除了在放大过程中产生的额外开销。如果玩家喜欢更低的帧率,以原生分辨率在最高级设置下运行游戏是进一步降低性能的好方法。

测试人员表示,对性能的初步观察总体上相当不错。测试的几乎所有内容都轻松超过60fps。当然,较老一代的显卡更有可能遇到困难,这将在不久的将来进行尝试测试,但玩家只需要一张预算200美元的显卡就可以在《黑神话:悟空》中获得良好的体验。

AMD与英伟达的结果也相当合理。通常情况下,英伟达RTX 4080 Super略微领先AMD RX 7900 XTX,AMD RX 7900 XT通常与RTX 4070 Ti Super接近。一些较低端的AMD显卡表现得并不那么好。显卡性能排行榜显示,在光栅化性能方面,AMD RX 7700 XT比英伟达RTX 4060 Ti快16%;而在这里,它只快了4%。同样,AMD RX 7800 XT在通常情况下比英伟达 RTX 4070快6%,但在这里却慢了1%。

《黑神话:悟空》一直由英伟达大力推广也说明了一定的问题。尽管虚幻引擎5本身应该在一定程度上与显卡无关,但开发者需要为他们特定的游戏进行调优,这可能导致厂商带来特定的优化。

那么英特尔Arc锐炫显示表现如何?尽管有为该游戏准备的驱动程序,但它实际上仍属于较老一代的硬件——其设计目标是与英伟达RTX 3060竞争,并且在驱动程序不拖后腿的情况下基本可以做到这一点。它在光栅化游戏中往往表现不如AMD的“同等”产品,但在光线追踪方面表现更好。

英特尔Arc A770 16GB和A750是迄今为止测试的最慢的两款显卡,Arc A770刚好超过60fps,而Arc A750只达到52fps。A770还比A750有14%的原始计算能力以及更多的内存,因此比A750的性能高出20%并不完全出乎意料——只是比通常看到的差距更大。英特尔显卡的最低帧数也较低,这表明进一步的驱动程序优化可能会有帮助。不过,这些结果并不令人意外,因为在显卡性能排行榜中,英特尔Arc A770和A750也排在AMD RX 7600之下。

影视级画质显卡性能

在讨论“影视级画质”预设的结果之前,需要明确一点:本次测试并不是在寻找不同显卡的最佳设置组合。目的是展示显卡在性能潜力上的表现,因此测试人员选择使用最高级设置来测试这些显卡。

如果玩家只是想玩《黑神话:悟空》,高画质预设通常比影视级画质预设运行速度快约50%~60%,因此推荐大多数用户使用此设置。稍后会讨论不同预设和图像清晰度的问题,但超过高画质预设的提升效果非常有限。

使用影视级画质预设会导致性能大幅下降,这也是为什么游戏默认开启超采样的原因。本次测试的所有显卡在影视级画质预设下的性能都下降一半或更多,相比于中画质预设。尽管大多数情况下仍然可以勉强运行,但在这些设置下,玩家至少需要一款英伟达RTX 4070 Super才能稳定在60fps以上运行游戏。

与之前一样,AMD和英伟达的对比在高端产品上看起来相近,但在性能较低的显卡上,英伟达RTX显卡的表现稍好一些。虽然英伟达RTX 4060 Ti的价格可能与AMD RX 7700 XT相当,但在光栅化性能方面,AMD通常占有优势。

英特尔的Arc显卡在图表底部的位置再次出现。英特尔Arc A770仅比AMD RX 7600慢约10%,这与通常在光栅化游戏中的表现差异相符,但Arc A770的帧率略低于30fps,最低帧率降到十几fps。其他游戏中的Arc A750 8GB版表现也不佳,但这在《黑神话:悟空》中似乎不是一个大问题。A770比A750快17%,这与计算每秒万亿次浮点运算的差异基本一致。

由于时间限制,本次没有对每个显卡进行高画质设置测试,但如图像质量分析所示,高画质设置通常是在图像质量和性能之间的最佳平衡点。如前所述,它比影视级画质预设快50%~60%,并且总体上看起来几乎一样。阴影和植被的微小差异不足以弥补性能上的损失。

在1440p的影视级画质预设下,性能相比于1080p并没有大幅下降。这可能是由于启用了67%的缩放比例。本次测试的GPU在1440p下普遍比在较低分辨率下慢12%~17%。这使得一些显卡在这些设置下的表现不尽如人意——例如英伟达RTX 4060及以下的GPU在这些设置下的表现相对勉强,但通过调整设置,可以使这些显卡在较低画质下处理1440p。显然,还有许多测试过的GPU性能较差,旧显卡在1440p下表现更差。

与1080p中画质相比,单独GPU的排名没有发生任何变化。这是一个有趣的结果,因为通常会有一些变化。此外,英伟达RTX 4060 Ti 16GB和8GB以及AMD RX 7600 XT和普通TX 7600的性能基本相同。显然,在测试中并没有超过8GB的显存。

在4K的影视级画质预设下,GPU的排名几乎没有变化,只有英特尔Arc A770的位置有所变化。在这些4K结果中,性能下降不像其他游戏中那么明显,这部分是由于超采样的缘故,因为原生4K渲染通常会增加显存的需求。然而,许多其他游戏超出了8GB显存的使用量,因此测试发现AMD RX 7600、英伟达RTX 4060和RTX 4060 Ti在4K下仍能维持性能,令人欣慰。

这些显卡在4K下的表现虽然不能算作流畅,但它们的缓慢并不是由于显存分配不足,而是由于游戏引擎的需求。如果玩家想在4K下获得至少边际可玩的性能,至少需要AMD RX 7800 XT或英伟达RTX 4070(即使是使用超采样技术)。

有趣的是,尽管其他8GB显卡在4K下表现尚可,英特尔Arc A750在这里的表现却落后。虽然19fps比11fps高,但两款Arc显卡在《黑神话:悟空》中都无法达到4K。正如在下一步全光追测试中所看到的,英特尔的驱动程序似乎需要进一步优化以适应这款游戏。

至于在4K下达到60fps,只有强大的英伟达RTX 4090可以做到。这可能会在英伟达布Blackwell GPU(如RTX 5080和5090)和AMD RDNA 4显卡发布后有所改进,但这些产品至少要几个月后才会出现。

如上所述,高画质设置可以提高大约50~60%的性能,在某些情况下可能更多。这将使英伟达RTX 4060 Ti及以上的显卡在4K下变得可行,甚至在紧急情况下,英伟达RTX 4060和AMD RX 7600也可能应对得当。

全景光线追踪性能

如果影视级画质测试的结果有时看起来相当糟糕,请等到启用全景光线追踪后看看会发生什么。在这里,性能成唯一关注点。

使用中画质设置进行测试,将全景光线追踪设置为低等,作为“简单光线追踪”选项,然后使用影视级画质预设,将全景光线追踪设置为“超高”,以获得最高图像质量。

这就涉及到两种GPU类型的故事:英伟达和其他所有GPU。对于RTX 40系列GPU,中等光线追踪测试运行良好。英伟达RTX 4060及以上的所有产品都实现突破60fps(再次强调,这是在没有使用DLSS 3帧生成情况下实现的)。对于英伟达的最新GPU,在这些设置下游戏绝对可玩。

另一方面是AMD的测试结果,如果是900美元的AMD RX 7900 XTX,其一开始就略低于英伟达RTX 4060,而且差距越来越大。考虑到AMD RX 7900 XTX在光栅化结果中的表现非常接近英伟达RTX 4080 Super,但看到其性能下降到不到该水平的一半,意味着大多数AMD用户甚至不应该启用全景光线追踪选项,除非是尝鲜。

至少AMD RX 7700 XT及以上在技术上是可玩的;RX 7600和7600 XT及以下则表现较差。有趣的是,即使启用全景光线追踪,VRAM容量似乎仍然不重要。AMD RX 7600 XT和RX 7600,以及英伟达RTX 4060 Ti 16GB和RTX 4060 Ti,基本上提供相同级别的性能。虚幻引擎5可能存在一些缺陷,但《黑神话:悟空》无需大量VRAM即可实现一些令人惊叹的视觉效果。

除非是玩家拥有英特尔Arc A750(可能还有其他8GB Arc卡)。同样,Arc A770 16GB提供的性能要高得多,不仅仅是原始计算应提供的性能,其平均fps比A750快33%,但更明显的是,在1%的低fps上,它几乎高出两倍。在启用全景光线追踪的初始测试运行后,A750的性能也持续下降,因此驱动程序在这方面还需要做一些工作。

如果回顾“中等光线追踪”测试结果,就会发现“超高光线追踪”性能表现确实很差。英伟达RTX 4070 Super及以上版本的平均帧率可达60fps或更高,而RTX 4060及以上版本可能仍能以超过30fps速度运行。但AMD目前最快的GPU甚至无法突破30fps,而且情况只会越来越糟。

此外,虽然英特尔Arc A770 16GB表现不错,几乎赶上AMD RX 7700 XT,但英特尔Arc A750的性能却一落千丈。

出于图像质量的原因,使用全景光线追踪超高的设置,因为它可以稳定树叶阴影,增加一些漂亮反射,改善整体场景照明,甚至在水面上产生焦散。使用最高光线追踪的高画质预设可以获得基本相同的图像质量,但这不会真正提高性能,因为许多默认渲染选项无论如何都会被光线追踪覆盖。

1440p的最高级设置(包括光线追踪)在英伟达RTX 4090上只能达到60fps以上。玩家也可以使用更高级别的超采样,但如果选择这种方式,图像保真度会降低。但如果拥有英伟达的最顶级显卡,它仍然可以以舒适的76fps运行。

AMD的GPU现在都低于20fps,这就要求使用较低的画质设置。但同样,测试人员注意到VRAM容量并没有成为《黑神话:悟空》的限制因素。GPU功耗也显示出这一点,它基本上达到了所有测试显卡的指定限制。通常,如果达到VRAM容量限制,由于GPU被迫等待数据,功耗会下降很多。

最后但并非不重要的一点(除了帧速率),本次有测试完全最大化设置的4K。英伟达RTX 4090平均为44fps,RTX 4080 Super刚刚超过30fps,最低降至20fps多。其他一切显卡都无法畅玩。换句话说,在具有《黑神话:悟空》这种图形复杂度的游戏上,我们距离实现全景光线追踪和所有花哨的功能还有很长的路要走。

AMD的个位数帧率结果显然不太理想,测试人员怀疑这是由于光线追踪硬件性能不足,或是游戏根本没有针对AMD硬件进行全景光线追踪进行任何优化。可能两者都有,只是程度不同。

如果玩家想创建一个4K图表使其看起来像是可行的选择,解决方案很简单。首先,使用更高级别的超采样—游戏通常会在4K下使用大约5倍的超采样系数,打开帧生成功能。然后玩家可以像英伟达一样实现RTX 4070 Ti Super达到66fps。

帧生成下的1080p最高设置

帧生成是一项备受争议的功能。有些人将生成的帧称为“假帧”,其实这也没有错。因为没有额外的用户输入采样,并且增加了帧生成的开销,所以通常感觉更像是先后退两步,再前进两步。

举一个具体的例子,假设玩家有一款以50fps运行的游戏,并且希望通过帧生成来改善该结果。在最佳情况下,帧生成会将帧数加倍,以监控高达100fps的速率,同时增加一点延迟。假如是这种工作方式,大家对该技术的宽容度将大得多。

而事实是,如果玩家以50fps运行游戏,则打开帧生成功能通常会产生相当大的开销。与简单的帧速率翻倍(其中一半是生成的)不同,玩家通常获得的是感知fps提高约50%。但是使用帧生成的75fps的结果意味着基本fps已降至37.5fps,这会在一开始感觉有些卡钝。

简短来说,为了让帧生成提供不错的体验,人们通常希望生成帧速率超过80fps——这意味着用户输入采样率仍为40fps。在某些情况下可能会发生这种情况,但《黑神话:悟空》在4K下以最高全景光线追踪设置运行往往对大多数GPU要求过高,除非玩家拥有英伟达RTX 4080或RTX 4090。

在该方面,测试人员希望至少能获得一些帧生成有关的性能数据。使用1080p最高画质设置——即影视级画质预设具有超高的光线追踪质量,加上67%的分辨率缩放,然后打开帧生成:其中英伟达RTX显卡使用DLSS 3,AMD和英特尔显卡使用FSR3(XeSS目前没有自己的帧生成风格)。

然后就

出现了一些有趣的结果,比如FSR3帧生成比DLSS3帧生成更能提高帧速率。部分原因可能是AMD GPU在用于测试的全景光线追踪设置下表现不佳。但以英伟达RTX 4070为例,使用帧生成时画面为77fps,而没有使用帧生成时画面为53fps,所以增加了45%。测试结果认为这是可以接受的——从渲染的53fps变为38.5fps,但使用帧生成将其翻倍。

另一方面,AMD RX 7900 XTX从28fps提高到52fps,提升85%。如果以帧生成100fps的结果来看待这种缩放级别,那将是出色的,但帧生成52fps意味着游戏感觉就像以26fps运行。这是AMD的最佳结果。尽管如此,由于更好的缩放(暂不讨论帧生成图像质量,这通常需要更多妥协),AMD RX 7900 XTX和XT最终能够至少超越RTX 4060的性能。

作为第二个示例,AMD RX 7900 GRE从20.9fps提高到39.3fps,帧速率提高88%,但在启用帧生成的情况下,低于40fps的体验并不好,在玩《黑神话:悟空》时会死得更频繁。虽然不是完全没法玩,但体验也不同于非帧生成的40fps。其他AMD GPU也同样无法使用这些设置提供良好的体验——帧生成只能做到这么多了。

当然,如果玩家不使用光线追踪,或者只有高端英伟达RTX 40系列显卡,可以通过帧生成获得更高的帧速率。例如,在1080p测试中,英伟达RTX 4070 Ti Super、RTX 4080 Super和RTX 4090都突破了理想的100+fps范围。这三款显卡的帧速率都提高约45%~50%,因此增益相当一致。基本渲染的fps仍然会下降,但就可玩性而言,还是可以接受的。

其他英伟达GPU的体验并不那么好。英伟达RTX 4070 Super和RTX 4070运行良好,但RTX 4060 Ti及以下型号的帧率低于60fps,这意味着它们可能看起来运行良好,但在使用帧生成情况下,感觉运行速度会低于30fps。

设置和图像质量

玩家已经看到性能差异,英伟达在全景光线追踪性能方面击败了竞争对手,但总体而言,光栅化性能相当接近。这些设置在实践中又会产生多大的差异,玩家可以理解为不需要绝对的全景光线追踪即可享受该游戏。

《黑神话:悟空》使用虚幻引擎5,包括Nanite功能,可实现令人难以置信的细节水平。但它还使用基于软件的Lumen光线追踪进行照明和其他效果,这肯定不是完美的。或者,玩家可以启用全景光线追踪选项,以“修复”Lumen的一些不太理想的渲染方面——闪烁和斑点阴影、破碎(遮挡)的屏幕空间反射以及其他一些方面。Lumen不会在英伟达RTX 40系列和AMD RX 7000系列等GPU中利用光线追踪硬件,但它甚至可以在英伟达GTX 1060和AMD RX 580等较旧的DX11级GPU上运行。

Lumen渲染引擎的优缺点开始变得相当知名。它大多数时候看起来都很不错,使得《黑神话:悟空》看起来很惊艳,但偶尔的卡顿可能是个问题,即使是高端PC硬件也可能不够。虽然全景光线追踪照明确实看起来更好,但对于大多数游戏玩家来说,Lumen看起来已“足够好”,并且在各种硬件上运行得比全景光线追踪模式好得多。换句话说,使用软件近似值进行渲染通常比运行速度明显较慢的更精确的光线追踪渲染更可取。

还有一点需要再次提及,这是一款英伟达推荐的游戏。虽然它使用了虚幻引擎5,但目前尚不清楚它针对英伟达硬件进行了多少优化,尤其是针对全景光线追踪模式。另一个有趣的消息是,《黑神话:悟空》当前不支持英伟达的DLSS 3.5光线重建技术,这似乎是错失了良机。DLSS 3.5功能的支持将为游戏提供明显更出色的视觉效果,而且通常还具有性能优势。也许它将在《黑神话:悟空》后续的补丁中被添加。

测试人员在AMD RX 7900 XTX和英伟达RTX 4080 Super上设置了影视级画质,以1080p和67%缩放率运行(AMD为FSR3,英伟达为DLSS3)。这两款显卡的光栅化性能大致相同,英伟达显卡的价格略高,但性能也略高。

结果显示,差异有时似乎很微妙。在某些比较中,显然可以从光线追踪照明、阴影和反射中得到一些好处,但AMD和英伟达的结果之间也存在明显差异。

首先,很明显,DLSS现在提供更清晰的图像。据《黑神话:悟空》开发人员称,FSR图像质量正在改进中,因此情况应该会随着时间的推移而改善。目前,FSR超采样会导致某些区域的细节丢失,并且在查看光线追踪结果时,整体模糊变得更加明显。

将光线追踪图像与光栅化结果再次进行比较,在每个场景中都会出现一些非常明显的差异,但变化并不总是明显有利于光线追踪——例如在一些序列中,没有任何反射,阴影和灯光看起来不同,但光线追踪本身并不优越。不过,这部分是因为这些是静态照片,而不是动态图像。

光线追踪效果值得一提的一点是支持基于粒子的反射,而基准测试序列中并未突出这一点。在某些打斗场景中,添加反射光线看起来非常引人注目,而关闭光线追踪后玩家会发现它消失了——但还需要使用设置超高的光线追踪才能获得这些粒子反射,除非运行的是1080p且FSR超采样级别更高,否则非英伟达显卡将无法使用。

总体而言,光线追踪看起来令人印象深刻,看到这样的游戏支持该功能真是太酷了,即使它不太适合运行在很多GPU上。至少玩家们可以这样强调:“这就是全景光线追踪可以带来的好处,这也是它现在还远未成为主流的原因。”如果玩家拥有高端英伟达GPU,那么在启用全景光线追踪的情况下,绝对可以获得不错的性能,特别是如果愿意调整一些设置并使用更高级别的超采样。

另外值得关注的是,在启用和不使用光线追踪的情况下,各种预设在整体图像质量方面如何比较。这里有五个标准画质预设:低、中、高、超高和影视级。其中最后两个绝对是梦想级领域,至少就图像保真度而言,但它们对性能的影响非常真实。但也有三种光线追踪选项:低等、中等和超高。

玩家可以将这三个光线追踪选项中的任何一个与每个全局画质预设一起使用,或者甚至可以选择自定义十个单独的设置。不过,除了三个预设级别之外,光线追踪选项没有真正的自定义。《黑神话:悟空》使用ReSTIR全局照明来实现其照明效果,并且还支持光线追踪阴影、反射和焦散。

即使是低画质预设看起来也相当不错,证明虚幻引擎5的外观有多好,尽管最低设置确实在照明、纹理和阴影质量等方面有所妥协——没有动态阴影,许多应该显示静态阴影的区域根本没有显示。如果选择低设置,在游戏世界中移动时阴影的截止点也非常明显,植被的数量也会减少很多。

中等设置代表了一种更合理的妥协,很多电脑能够毫不费力地运行。阴影看起来不错,有更多的植被,符合对一款要求苛刻的现代游戏所期望的那样。

由中画质等升级到高、超高和影视级画质预设级别只会显示相对较小的变化,至少在静止图像中是这样。有一件事不是立竿见影的,那就是即使在最高质量下,高分辨率场景的阴影中也存在一些闪烁和斑点。玩家必须体验动态游戏,才能看到这多么令人分心。仅凭这一点就足以让玩家想要启用全景光线追踪选项,因为它基本上完全解决了阴影问题。

但是,低等设置的全景光线追踪是一个取舍的好例子。阴影看起来更稳定,整体效果更好,但缺乏适当的反射意味着所有水面看起来都很糟糕——水基本上比使用Lumen的低全局预设更糟糕。考虑到阴影问题和水/反射问题之间的选择,以及性能下降的因素,玩家预计更倾向使用传统的光栅化(或至少通过Lumen的软件照明和阴影)方法。

使用中等设置进行全景光线追踪可显著改善水的外观,但即便如此,由于使用分辨率反射减半,它仍然非常模糊,玩家也不会得到光线追踪焦散或粒子反射。但是,如果考虑到性能下降——光线追踪设置超高时,英伟达RTX 4080 Super帧率会从超40fps下降到刚过30fps——玩家可能会愿意忍受这种模糊。

这是对性能的不同看法,使用4K和67%缩放比例以及所有画质预设,包括高画质和影视级画质,并结合三种光线追踪设置。英伟达RTX 4080 Super和AMD RX 7900 XTX的结果,显示出与无全景光线追踪的影视级画质预设相比的相对性能。

在英伟达RTX 4080 Super上,基准影视级画质性能为56fps—代表绝对可以玩,但并不完全流畅。超高画质的预设可将性能提高18%,突破60fps的阈值,而高画质预设可带来57%的提升,并使GPU达到稳定的88fps。中画质预设比影视级画质快89%,最后,低画质预设可提供2.34倍的速度,并使GPU超过120fps。

启用全景光线追踪会降低性能,但如果使用高画质预设运行,则不会降低那么多。将光线追踪设置为低时,高画质预设与影视级画质预设基本相同,而将光线追踪设置为中等时,运行速度仅慢5%。光线追踪达到最大设置时,高画质预设的性能会降低30%。将影视级画质设置与光线追踪一起使用时,性能会下降20%、21%和41%。最后一个选项是将光线追踪设置为最高,同时启用帧生成时,高画质预设下英伟达RTX 4080 Super可达到可观的61fps(感觉上速度只有一半)。

AMD的RX 7900 XTX在查看光栅化结果时,最初显示出相对相似的缩放比例,但随着画质质量设置的降低,速度会加快。基准4K影视级画质性能为49fps,降低画质预设值时,在超高的设置下,相对性能提高18%——与在英伟达RTX 4080 Super上看到的改进相同。但随后,在高画质下,速度提高63%,在中画质设置下,速度提高106%,在最低画质设置下,速度提高2.65倍。有趣的是,AMD的GPU似乎比英伟达GPU更能从较低的画质设置中获益,打开全景光线追踪模式时则会不一样。

与基准影视级画质性能相比,光线追踪低等选项的高画质预设会导致性能下降59%。光线追踪中等选择预设会导致61%的下降,而超高光线追踪设置会使性能下降80%—例如,AMD RX 7900 XTX的运行速度是影视级画质的五分之一。GPU从在最大非光线追踪设置下至少还算合理可玩,变成了完全不够用。使用光线追踪模式升级到影视级画质预设会显示更大的增量:在低等、中等和超高的全景光线追踪模式下,性能分别下降65%、67%和82%。并且使用帧生成,使用高画质加光线追踪超高选项,则可以降到20fps。

与性能至少有些相似的英伟达RTX 4080 Super相比,AMD最快的GPU在所有全景光线追踪模式下表现都很糟糕。之前已经看到英伟达的光线追踪硬件往往表现更好,而更多的光线(或光线追踪效果)会扩大差距,但很难确切地说出为什么具有完整光线追踪的游戏会如此失败。这真的只是硬件问题,还是软件优化不足也起到了一定作用?

《黑神话:悟空》游戏中的瀑布场景展示了光线追踪的潜力。全景光线追踪在最大设置下看起来非常漂亮,当玩家四处移动时,水反射的焦散都会动起来。降到中等选项的全景光线追踪设置,分辨率反射减半看起来还行,但远没有那么令人印象深刻,而低等光线追踪设置看起来比Lumen渲染的水更差。

无论它如何运行,《黑神话:悟空》中的光线追踪选项确实让人感觉要么拉高到最大设置,要么关闭光线追踪。问题在于,超高的光线追踪设置需要同样高端的英伟达GPU。基本上,玩家需要英伟达RTX 3080或RTX 4070或更高版本才能在1080p下开启画质模式超采样和最大光线追踪设置,甚至无法达到稳定的60fps;AMD的顶级GPU甚至无法达到稳定的30fps。

毋庸置疑,在如此低的基础帧速率下生成帧感觉很一般,我们完全不相信英伟达声称使用生成帧时可能会显示的性能提升。使用生成帧的60fps实际上在用户输入采样时以30fps运行,并将该值加倍,因此当出现故障并且生成帧速率下降到40fps时,这意味着用户会感觉到它大幅下降到20fps,并且任何低于30fps的情况都会被视为严重卡顿。此外,测试表明,如果性能太低,帧生成(包括DLSS和FSR)就会开始出现故障,因为渲染帧之间的差异可能会变得太大。在《黑神话:悟空》中,使用帧生成的50~60fps通常可以玩,但不使用帧生成的25~30fps也可以玩,只是体验不太好。

因此,对于当前的AMD GPU,测试人员建议不要启用全景光线追踪选项,除非驱动程序或游戏更新改善了这种情况。在任何AMD RDNA 3硬件上,在超高的设置下全景光线追踪都是不可行的,更不用说RDNA 2了。或者至少,在《黑神话:悟空》中启用全景光线追踪的方式在AMD上是不可行的,尽管可能还有更好的运行方式。在使用超高的光线追踪设置和影视级画质预设时,即使是AMD RX 7900 XTX上1080p的超采样也会降至30fps以下,因此即使降到全景光线追踪的高画质预设也可能只能达到30fps。

总结

作为一款游戏,《黑神话:悟空》看起来很棒,但更高的设置绝对需要一张性能强大的显卡。1080p中等分辨率加上超采样后在低规格GPU上运行良好,在AMD RX 6650 XT上轻松突破60 fps,但影视级画质“超高”设置会导致要求大幅增加,性能下降一半以上。如果玩家不太担心错过一些视觉附加功能,中高画质预设应该足够了。

超高设置下的全景光线追踪,这才是我们真正想要的全景光线追踪,基本上需要英伟达的顶级GPU。AMD的RX 7900 XTX在中低选项的光线追踪测试中实现超过60fps的速度,但水看起来不如标准Lumen渲染德好。然而,在最大光线追踪设置下,性能下降到只有28fps,表明无法畅玩。英伟达RTX 4080 Super的性能提高了一倍多,在1440p分辨率下仍可畅玩,甚至在4K下也还可以。

目前尚不清楚非英伟达显卡上全景光线追踪模式的糟糕性能有多少源于这些GPU缺乏光线追踪能力,又有多少是因为游戏针对英伟达品牌的光线追踪硬件进行了高度优化。如果想使用英伟达的方式来运行全景光线追踪,那么条件将非常苛刻。游戏是否可以更好地优化以在AMD品牌的光线追踪硬件上运行?几乎可以肯定。然而,这可能只会实现两位数百分比增长,而不会是性能翻倍或三倍以缩小与英伟达GPU的差距。

本次没有进行CPU测试,但测试者可能会在未来将这款游戏(不包含光线追踪)加入到CPU测试套件中。系统需求表明,该游戏实际上并不需要超过6核心的CPU,顶配预计8核心,因为没有列出高于英特尔酷睿i7-9700或AMD Ryzen 5 5500的CPU。GPU建议要高得多,正如测试人员所展示的性能测试结果那样。

《黑神话:悟空》的玩家评价非常积极,它融合了古怪而视觉上有趣的Boss和其他敌人,使其脱颖而出。中国的神话也增添了吸引力和趣味性。

在完成所有这些初步测试之后,测试人员一如既往地建议,如果玩家没有顶级GPU,不要过于纠结追求最高的图形设置。中高画质(无全景光线追踪)应该在大多数不错的游戏PC上都可以实现,而且额外的视觉效果并不能带来更好的游戏体验。不过,如果玩家拥有高端英伟达RTX 40系列GPU,那么在游戏的许多区域,使用粒子反射系统和焦散的全景光线追踪将带来令人印象深刻的体验。

(校对/张杰)


夕夕海 » 《黑神话:悟空》揭了GPU的老底

发表回复