用户
 找回密码
 立即注册
搜索

中端显卡之争,理性分析RTX2060 super与5700XT那个香

[复制链接]

1301

主题

1281

帖子

6193

积分

论坛元老

Rank: 8Rank: 8

积分
6193
发表于 2020-3-31 16:25:51
不少朋友都有遇到过,游戏的优化问题。当今主流的GPU厂家有三家,抛开以核显为主的inte不论,NVIDIA和AMD两家都是各具特色的品牌,但两者架构以及理念上上存在巨大的差异。

先来说说AMD吧,早在2011年的HD7970开始,GCN架构就已经开始, Navi之前的显卡均为GNC架构。GCN架构作为VLIW架构的继任者,当年这可是AMD首次针对3D渲染/GPU计算双重使命而设计的最强架构,第一款产品是Radeon HD7700。
在GCN1.0的时代,A卡还是一副春风得意的样子,但从GCN2.0开始,A卡的产品线就开始频繁地出现马甲卡产品,开始不断地叠加流处理器数量,并且在显存和显存位宽上面做文章,大家应该已经注意到了,
最近几年每一代A卡好像在显存规格上都表现地非常良心,但实际上根本原因就在于GCN架构的特性,注定促使A卡向这些方向演化。


Navi之前的显卡使用的是GCN架构,RX Vega上是GCN 5.0架构,而Navi是RDNA架构,全称是Radeon DNA架构,官方表示它是专为新一代高效率、高性能游戏而设计。它是为你的游戏提供动力的 DNA、让你的游戏生动逼真的 DNA、不断发展进化的 DNA。
需要重点说明的是,尽管早前传闻Navi是最后一代GCN架构,但AMD不仅是改了新架构的命名方式,还极力否认RDNA架构跟GCN有关系,强调RDNA是全新开发的架构,跟GCN没啥关系,不是GCN升级也不是GCN混合,唯一有关的就是指令集继承了,使得现有技术可以兼容,避免软件、游戏重新为RNDA开发一遍。
不能单纯去否定GCN技术的优势,GCN技术简单理解就是多核心,早期是5个GCN核心组成一个完整的运算单元,而后期是四个GCN核心组成一个完整单元。


Navi是否完全掘弃了GCN这个颇具争议,但是不可否认的是RDNA2才具备RDNA架构的全部特性,包括现在最火的光线追踪技术。
有意思的是,虽然说游戏主机上面已经支持RDNA2的GPU,但微软和索尼都不约而同的采用了“自定义RDNA2架构”命名,依依酱相信这和AMD的强制要求有着很大关系,因为在RDNA2架构产品上AMD并不希望用户把游戏主机的定制RDNA2和独立显卡的RDNA2架构所混淆。但是至于具体自定义RDNA2架构和RDNA2架构有哪些不同。简单来说,RDNA2显卡效能以及A卡的光线追踪效果的水准依然是未知。


再来看看NVIDIA方面,早在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作(主要是并行计算部分)。GPU具有强大的浮点数编程和计算能力,在计算吞吐量和内存带宽上,现代的GPU远远超过CPU。
当年ATI也有一个VPU的概念,后来也归为了GPU一类。
而NVIDIA在8800GT的时候已经提出了CUDA的概念。CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范,NVIDIA™(英伟达™)发明了CUDA(Compute Unified Device Architecture,统一计算设备架构)这一编程模型,是想在应用程序中充分利用CPU和GPU各自的优点。


不过,8800GT尚算是试水阶段,真正CUDA走向前台的应该是费米架构。上图是Fermi架构的GPU的核心架构图。基于GPU的第一代Fermi 架构拥有30亿个晶体管,512个CUDA Core。一个CUDA Core在一个时钟周期内执行一个线程(或kernel)中的一个浮点数或整数指令。512个CUDA Core是按照16个含有32个Core的SM(流式多处理器,也叫ScalarProcessor,标量处理器)进行组织的。

Kepler架构是以第二代的Fermi为基础全面革新,以及专为游戏性能和视觉体验优化的新特性,包括SMX架构、GPU动态提速技术(GPUBoost)、全新的抗锯齿技术TXAA、自适应垂直同步(AdapitiveVsync)以及单芯3D立体幻镜环绕等等。
当然了,开普勒架构给我们最大的印象莫过于超高的能耗比。


Maxwell 针对流式多处理器(SM) 而采用一种全新设计,可大幅提高每瓦特性能和每单位面积的性能。虽然Kepler SMX 设计在这一代产品中已经相当高效,但是随着它的发展,NVIDIA 的 GPU 架构师看到了架构效率再一次重大飞跃的机遇。Maxwell SM 设计实现了这一愿景。

Pascal之所有能够成为有史以来能效最高的GPU,原因不仅仅 是16nm FinFET带来的制造工艺精进,更得益于持续提高的核心效率。NVIDIA工程团队的一大精力投入重点是GPU核心运行频率, GeForce GTX 1080的核心运行频率要比GTX 980高出40%之多!单靠16nm FinFET的制造工艺,是不能够带来如此高比例的核心频率提升的。
与前代显卡相比,帕斯卡架构的显存由GDDR5升级为GDDR5X、甚至HBM 2,这将带来显存带宽的巨大提升。
同时,Pascal已经加入了AI人工智能算法。


全新的图灵架构,和前代帕斯卡架构相比,后者新增了RT Core(光线追踪核心)、Tensor Core(张量核心)等计算模块。

RT(Ray Tracing,光线追踪),其特点在于可实现混合渲染,它将传统的光栅化与光线追踪相结合,可提供更快、更高效的渲染速度。作为专用的光线追踪单元,它还为“射线和三角形的相交检测”与“层次包围盒(BVH)”提供加速计算,后者(BVH)是三维场景中一种常见的数据结构。


RT core实质上就是SM里面加了一条专用的流水线(ASIC)来计算射线和三角形求交,可以访问BVH,由于是ASIC专用电路逻辑,所以和用shader code来做求交计算相比,性能/mm^2可以有数量级的提升。RT CORE的工作原理就是,着色器(Shaders)发出光线追踪的请求,交给RT CORE来处理,RT CORE将进行两种测试,分别为Box IntersectionEvaluators和Triangle Intersection Evaluators。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。



花了那么多篇幅去回顾,其实是为了反驳某些人所谓的CUDA用了十代的错误说法,虽然NVIDIA一直都是CUDA单元的说法,但架构上的变化确实巨大的。而且,基本上是类似于Tick-Tock模式去发展。费米之前已经有CUDA通用计算的概念,开普勒又在费米基础上让能耗比迈进了一大步,Maxwell让能耗比的概念普及到了全系列,而Pascal的发展不仅仅是从核心频率上面而是从整体的执行效率上面都是质变。
相信,面世已久的图灵架构,不少人都已经对于光线追踪、DLSS深度学习抗锯齿的概念非常熟悉。而DLSS深度学习抗锯齿,就是AI人工智能从理论落实到真正提升游戏效能的新技术。


近日,微软宣布Windows 10 20H1版中DX12功能将大幅升级,带来新的DXR 1.1光追、网格渲染及采样反馈等新功能,3D显卡要洗牌了。
这次的DX12功能中,DirectXRaytracing Tier 1.1在现有的光线追踪管线状态对象Pipeline State Object中加入了额外的着色器Shader,这可以让开发人员调用包含光线追踪功能的着色器,这套着色器可以出现在光线追踪运算过程中的任何阶段,支持光线追踪的间接执行,并引入内联光线追踪,对光线遍历算法和着色器进行管理。这相当于在DXR 1.0的基础上一套更高阶且更有效的玩法
DirectX Raytracing Tier 1.1还得到了更广泛的游戏支持,目前为止,已经有超过30款即将和已经发布的游戏宣布兼容DXR 1.1性能,比如NVIDIA GeForce RTX宣布完全支持DXR 1.1新特效。
除了DXR光追技术升级,微软在DX12最新版中还会引入网格渲染(mesh shader),这是下一代GPU的几何处理功能,取代当前的输入汇编器、顶点渲染器、船形渲染器、曲面细分、域渲染器、几何渲染器等。


对于NV和AMD来说,其都表示将全面对DirectX 12 Ultimate提供支持,比如即将推出的AMD RDNA 2游戏架构中就全面支持DirectX 12 Ultimate所有新特性,而对于普通玩家而言,正在使用的GeForceRTX显卡则直接成为体验下一波新游戏画面升级的免费门票,无需再对硬件有任何额外投入。



早在2018年10月入手图灵架构显卡的用户,算起来已经体验了一年半光线追踪技术了。




支持光线追踪的大作也越来越多,甚至某些经典IP如雷神之锤、我的世界都通过光线追踪焕发二次生命。











而作为市面上光线追踪显卡的代表,RTX2060 super会是不少画质控玩家的选择。其中,采用了TU106-410芯片,供电规模达到了12相,全部采用超合金电感和超合金电容的ROG Strix RTX 2060 SUPER O8G GAMING显卡可以说是超越公版的存在。
ROG Strix RTX 2060 SUPER O8G GAMING显卡还配有支持智能启停的翼形叶片风扇,还采用SAPII 超合金供电设计,拥有MaxContact 镜面直触技术,第二代华硕FanConnect技术,散热更强更智能。支持Aura Sync神光同步,NVIDIA G-SYNC技术,消除画面撕裂。









受限于RDNA2显卡暂未发布,AMD在光线追踪上的表现只能等后续。抛开光线追踪的因素,RTX2060 super相比于价位相近的AMD 5700XT的表现又如何呢?
我们还是通过测试数据讲话吧。
先来看看,我的测试平台:
CPU:i9 9900k ES版

散热器:ROG STRIX LC 飞龙240RGB

主板:ROG STRIX Z390-E GAMING

内存:铭瑄 DDR4 2400 灯条(支持AURA神光同步)

显卡:华硕ROG STRIX RTX2060 super以及5700XT

SSD:WD 黑盘 1TB

机箱:安钛克DP501 RGB(支持AURA)

1、3DMark
3Dmark是futuremark公司的一款专门测量显卡性能的软件,现已发行3Dmark99、3Dmark2001、3Dmark2003、3Dmark2005、3Dmark2006、3Dmark vantage、3Dmark 11和The new 3Dmark。而现在的3Dmark已不仅仅是一款衡量显卡性能的软件,已渐渐转变成了一款衡量整机性能的软件。

新版本的3DMark已经支持测试光线追踪以及DLSS两大特效。




Timespy DX12测试场景下面,ROGSTRIX RTX2060 super取得8919分,领先于5700XT的8746分。



FireStrike场景EX模式DX11游戏性能测试,ROG STRIX RTX2060 super取得10343分,领先于5700XT的11899分。
从测试分数来说,RTX2060 super在DX12游戏测试下面领先,但是却在DX11测试中不敌。但是,如前面所述,5700XT不支持光线追踪以及DLSS,所以只有RTX2060 super的跑分。


ROG STRIX RTX2060 super取得5284分

2、地铁:离去






地铁:离去支持光线追踪以及DLSS两大特效,不过需要RTX20系列才能打开。在1080p分辨率下面,关闭光线追踪以及DLSS,ROG STRIX RTX2060 super取得69帧,领先于5700XT的63帧。而ROG STRIX RTX2060 super打开最高特效光线追踪和DLSS后,依然可以获得56帧,性能影响不算大。
3、战地5
战地5是最早支持光线追踪和DLSS特效的游戏,为了对比5700XT,RTX2060 Super分别打开和关闭光线追踪和DLSS测试了两次。






关闭光线追踪以及DLSS,ROG STRIXRTX2060 super取得122帧,领先于5700XT的115帧。而ROG STRIX RTX2060 super打开最高特效光线追踪和DLSS后,依然可以获得70帧,相比于帧数降低,但是获得的画面效果质变还是值得的。

4、古墓丽影11暗影





关闭光线追踪以及DLSS,ROG STRIXRTX2060 super取得106帧,打开最高特效光线追踪和DLSS后,依然可以获得72帧,相比于帧数降低,5700XT暂无法完成测试,等以后有新驱动再补上。

5、逆水寒




ROG STRIX RTX2060 super取得127帧,领先于5700XT的90帧。

6、绝地求生




ROG STRIX RTX2060 super取得140-170帧,领先于5700XT的110-130帧。

7、古墓丽影10崛起





ROG STRIX RTX2060 super取得93帧,领先于5700XT的81帧。

8、杀手6




两者都是118、119帧,平手,差距忽略不算。


9、奇点燃尽





测试也是平手,都是69帧左右的幅度,差距可以忽略了。

10、彩虹六号:围攻




ROG STRIX RTX2060 super取得221帧,领先于5700XT的212帧。
测试了多个项目,除了3DMARK的FireStrike场景DX11测试不敌5700xt以及杀手6和奇点燃尽打平外,其余项目都是ROG STRIX RTX2060 super获胜,真正的技术性击倒。

再来看看温度和功耗方面。




ROG STRIX RTX2060 super满载22分钟的温度是68度,而5700XT满载16分钟是85度。




功耗方面,ROG STRIX RTX2060 super满载功耗是306w,而5700XT满载功耗是342w。

综上测试来看,采用图灵新架构的RTX2060 Super虽然是12nm技术,制程上面不如7nm的5700XT。但是,从实际测试结果来看,温度功耗5700XT都比起2060s大,但是就是不算光线追踪和DLSS深度学习超采样抗锯齿技术,5700XT的测试都几乎全部输给RTX2060 super,从数据和测试结果来看,RTX2060 Super更为优胜。未来光线追踪和DLSS游戏越来越多,两者的差距会越来越大。


而作为信仰之眼家族的ROG STRIX RTX2060 super,不仅仅频率和性能超越公版,散热、造工都可圈可点,同时AURA神光同步灯效也必然为你的游戏主机增添品味。



当然了,若是需要体验最新的大作比方说--《使命召唤:战区》,1080P分辨率下面推荐RTX2060 super,2k分辨率推荐RTX2070 super。

而更加硬核的FPS大作《逃离塔克夫》,1080P下面推荐RTX2060 super,2k建议考虑RTX2070super开中高画质或者上RTX2080 super。





不过,对于FPS类型游戏来说,除了显卡,外设同样重要。专业的电竞外设,从键鼠到耳机都不可少,尤其是脱离塔可夫,没有地图没有标注,除了通过专业的电竞耳机进行听声辩位,根本很难通过肉眼去搜索到敌人。
同时,要实现流畅、不会撕裂、不会延迟的画面,一台专业的144Hz以上高刷新率的电竞显示器必不可少。市面上,144Hz属于常规的电竞显示器,ROG最高还有280Hz的电竞选手级别的产品。
可以说,玩FPS大作和实战一样,有更好的装备才有更好的体验。

使用道具 举报 回复
发表于 2020-7-26 19:08:01
本帖最后由 kwcha333 于 2020-9-9 15:08 编辑

楼主如果有更多资讯可多分享出来想了解更多 谢谢

fav link:
學英語

使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则