电脑硬件
触摸真实世界,从光线追踪说FPS游戏的变迁
4847
相信不少游戏玩家都会有对游戏真实感,沉浸感更加高的渴求。从早期雅加达的像素点游戏乒乓球,红白机时期的2D像素画世界,超任时期的伪3D都曾经给我们带来了震撼。
这种横向清版游戏,虽然还能跳起来蹦着,但说到底,不过就是增加了一条Z轴,可以实现2.5D的效果而已。同理,类似于魂斗罗2第二关的纵向射击以及战场之狼一类的纵向清版,说白了就是改变了前进方向的而已。
而FC红白机上比较小众的游戏《孤独战士》,算是45度伪3D的始祖,流畅度不错,剧情紧凑好玩,就是难度有点高,手残劝退。
同时期的PC游戏不见得高明太多,PC早期还有不少文字冒险游戏,像素画级别的莫过于《波斯王子》初代有意思。而FPS游戏,本就是PC平台更为合适,《重返德军总部》可以说是元祖FPS,而其后的《DOOM毁灭公爵》更是引发世界级别的讨论。
不过,真正意义的FPS游戏引路人,莫过于《Quake雷神之锤》。尤其是《雷神之锤2》,更带来了业界新的思考。
早期,电脑并没有独立显卡的概念,而所要显示的信息是经过CPU计算后,输出到主板上由若干个集成电路块组成的显示单元,再经过转换后成为显示器所能辨认的信号,进行输出显示,而这种显示设备只能完成一些最基本的显示功能。
真正的显卡诞生还要归功于新显示模式的出现,因为在VGA标准出现以前,显示器所支持的最高颜色数也只有8到16种,所以计算机系统和显示系统间所要处理的数据少,色彩组合非常简单,但当VGA标准被采用以后,虽然可提供的色彩数同样为8到16种,但在模拟电路中,可以把每个色彩用64种不同的亮度表示出来,因此系统可支持的色彩数就达到了262144色和6777216色,也就是我们平时所称作的256色和24位色,而在此时,计算机设计者们便将具有显示功能的单元,从主板上分离出来制作成了专门的显卡,但这时的显卡体积庞大,功能单一,而且由于接口的限制,速度很慢,但与在主板上的显示单元相比还是进步了许多的。第一代的显卡是基于ISA总线的。
ISA总线,本人仅仅用过创新的独立声卡sound Blaste 16.ISA显卡仅限于就单位废弃物资见过。
显然,像素画并不是FPS题材最好的载体,要实现3D效果,当然不能指望2D显卡。而且,当年的2D显卡,技能树是点在VCD硬件解压之类的地方,根本不是专业为游戏服务的。
因此,出现了3D加速卡。最早实现这个概念的是3DFX的子卡—Voodoo。Voodoo并不能独立使用,只能搭配原有的2D显卡才能进行游戏。
对于不少7080玩家来说,当年的3D显卡初恋,莫过于发布于1997年来自NVIDIA的riva128.
早期FPS游戏里面,粗制滥造的产品不少,而除了雷神之锤系列以外,毁灭公爵也是不可多得的佳品。不过,如你所见,当年的FPS游戏受限于硬件技能,多边形的数量还是非常缺少的,以至于经常出现各种迷之锥子体或者不可描述的贴图丢失。
说起早期的FPS游戏,不得不说背后的3DAPI。3D APIAPI是ApplicationProgramming Interface的缩写,是应用程序接口的意思,而3D API则是指显卡与应用程序直接的接口。3D API能让编程人员所设计的3D软件只要调用其API内的程序,从而让API自动和硬件的驱动程序沟通,启动3D芯片内强大的3D图形处理功能,从而大幅度地提高了3D程序的设计效率。而没有3D API之前,程序员必须要针对于每一个图形处理器的特性来独立编写驱动程序。
当年的3D API有四大门派。
DirectX
3D API能让编程人员所设计的3D软件只要调用其API内的程序,从而让API自动和硬件的驱动程序沟通,启动3D芯片内强大的3D图形处理功能,从而大幅度地提高了3D程序的设计效率。几乎所有的3D加速芯片都有自己专用的3D API,目前普遍应用的3D API有DirectX、OpenGL、Glide、Heidi等。
微软公司专为PC游戏开发的API,与Windows操作系统兼容性好,可绕过图形显示接口(GDI)直接进行支持该API的各种硬件的底层操作,大大提高了游戏的运行速度,而且目前基本上是免费使用的。由于要考虑与各方面的兼容性,DirectX用起来比较麻烦、在执行效率上也未见得最优。
Glide
这是3Dfx公司为VOODOO系列3D加速卡设计的专用3DAPI,它可以最大限度发挥VOODOO系列芯片的3D图形处理功能,由于不考虑兼容性,其工作效率远比OpenGL和Direct 3D高,所以Glide是各3D游戏开发商优先选用的3D API。不过,这样一来就使得许多精美的3D游戏在刚推出时,只支持3Dfx公司的VOODOO系列3D加速卡,而其它类型的3D加速卡则要等待其生产厂商提供该游戏的补丁程序。
Heidi
Heidi是一个由Autodesk公司提出来的规格。目前,采用Heidi系统的应用程序包括3D Studio MAX动画制作程序、Autodesk公司为AutoCAD R13开发的WHIP加速驱动程序。
OpenGL
(开放式图形接口)由Silicon Graphics公司开发,能够在Windows 95、Windows NT、Macos、Beos、OS/2、以及Unix上应用的API。由于OpenGL起步较早,一直用于高档图形工作站,其3D图形功能很强,超过DirectX,能最大限度地发挥3D芯片的巨大潜力。在Windows中已经全面支持DirectX和OpenGL。在OpenGL的1.2版中还增加了对3DNow!标准的支持。
不得不说,早期的3D加速卡领先者是3Dfx的Voodoo系列,但是其专用3D API-Glide是一把双刃剑。一方面,专用API,效率非常高,但此3D API仅仅支持16bit颜色(大后期才有所改进)而且对于3D制造设计软件基本上没有帮助。另外一方面,中后期的3Dfx有点飘了,不仅仅是收购了STB公司自己生产显卡,还拒绝外放芯片,间接造成战略合作伙伴帝盟的衰败,也导致了十八路诸侯讨董卓的局面。
3Dfx要独食,自然就逼着显卡厂家另谋出路。MGA的芯片也是自家用,ATI也几乎和拓海的86一样---藤原豆腐店自家用。当年市面上,真正开放意义的3D加速卡芯片厂家并不多。3D lab的芯片偏向于专业设计方面,而S3明显落后于3Dfx、NVIDIA、ATI。相信,用过S3 Savege 3D的朋友会记忆犹新,一个月升级两次显卡bios,三天升级一次显卡驱动,savege 3D除了便宜,其他都不靠谱。
而NVIDIA具备了厂家需要一切特性,首先是开放,NVIDIA至今都没有直接的显卡成品,公版卡也是委托制作,纯指导意义。其次,NVIDIA对于技术和创新层面更加持有开放态度。不仅仅是微软Direct X的坚决支持者,也对open GL的完整支持。因而不仅仅是3D游戏,专业3D设计者同样获益。而rivaTNT的出现,隐约已经成为十八路诸侯里面,真正能和董卓扳手腕的领头羊。
3Dfx一定程度推动了3D游戏以及硬件业界的发展,但是其滞后的技术和固执,最终导致了自身覆灭。后被NVIDIA收购,其技术对后世影响最深的莫过于SLI技术。
SLI就是通过两块或以上的3D加速芯片实现更高的3D处理能力。上图可以说是3Dfx遗作--Voodoo5 9000,单槽单卡32路SLI。
NVIDIA并没有完全照抄,SLI并不能实现1=1=2,顶多只能无限接近而且对于驱动以及游戏的设计都有着更复杂的要求。NVIDIA最高是可以实现四卡SLI,也是成本和收益最高的方案。
虽然成为独立显卡,但是在3D生成过程里面,cpu扮演的角色还是非常重要的。简单来说,低端的处理器会影响到高端显卡的发挥,也就是一般人经常说的带不动的问题。
升级游戏平台就要一套换,从cpu、主板、内存都要换,这并不符合一般游戏玩家的计划。毕竟,游戏性能更多是从显卡决定的。
于是,NVIDIA首创了GPU的概念。GPU就是图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。
GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。
NVIDIA第一款GPU产品就是GEForce 256,当年大家都在以为TNT2以后就是TNT3的时候,NVIDIA一下子发布了一个划时代的产品,也使得图形处理器这个过往仅仅是CPU的僚机变成了独立的一方诸侯。
也是因为硬件的升级,推动着游戏的发展。虽然说,1999年优秀的游戏很多,但是对于业界来说,最大影响的莫过于CS。
CS是不少人接触的第一款拟真型FPS,在此之前有三角洲部队,但是画质、玩法、节凑性各方面还是差远了,这也是确定了一大FPS流派。现实派、赛博朋克、魔幻派三教鼎立。
CS也可以说是第一个从地图编辑器MOD出来的作品,转正成为系列大作的典型。后面魔兽争霸3演变出DOTA,DOTA开创出MOBA流也是受此启发。
当大家都以为,显卡就是无脑提高频率的时候,NVIDIA又推出了新的CUDA通用计算的概念。
CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
第一代的CUDA是8800GTS,其中G92芯片可以说是一个跨时代的产品,性能强大,可惜就是发热有点不省心。可以说,G92推动了显卡散热的发展。其中,映众的烤肉架散热器、海格力斯散热系统也是从那时就开始。
说起G92,当然不能说说,当年第一代的显卡危机—孤岛惊魂第一代,惊艳的画面效果,真实感极高的光影,可以说是划时代的。
Kepler架构是NVIDIA的新生代产物,在设计思路上颠覆了许多Fermi的元素,两者是有一定继承关系的。Fermi是NVIDIA为了支持DX11全新设计的产品,它摒弃了GT200的模式,结构变化非常大。在Fermi中,NVIDIA提出GPC和SM的结构概念,以此将GPU分成若干平级并行的工作组,每一个SM有32个CUDA核心,而每一个GPC则有4个SM。重点在于为了尽可能地满足DX11曲面细分计算需求,NVIDIA为每一个SM组配置了独立的几何引擎,并且拥有独立的纹理单元。
可以说,开普勒架构改变了游戏规则,过往高端显卡等于高功耗高发热量的时代过去了,甚至说足够让高端电源黯然销魂。那么,映众这一类持之以恒搞散热的厂家,又是为什么?
很简单,一方面是稳定性,一方面是boost。Boost有点像cpu的睿频一样,说白了就是当你的散热有冗余,GPU会自动提高频率给你发福利。反之,散热搞不好,就自动降频自保。你说,散热重要不重要呢?
要说到同时期的FPS大作,相信很多人都不能忘记被显卡危机也就是孤岛危机支配的恐怖吧。超炫的光影效果,对硬件硬件超苛刻的要求,可以说难住了好几代的旗舰。可惜,这么好的引擎,却运营一般,现在已经慢慢被UT系列超越。
不过,单机再好还是单机,尤其是CS让大家尝试到一种新的快乐—团队合作。
然而,CS系列门槛还是高,基本上都是硬核的FPS大神在玩,而且CS对于配置要求很低,甚至还远不如5年前的单机大作。倒是《守望先锋》的出现,让业界有了新的话题和方向。前面说了,早期的FPS游戏,重返德军总部、雷神之锤、毁灭战士、毁灭公爵都有一定的科幻、未来的画风, CS的前身Hlaf life也是。但是CS是写实派,虽然动作不大协调。
基本上就是赛博朋克和现实主义两种。而守望先锋,融入了不少MOBA的理念,不仅仅魔幻、赛博朋克结合,更有技能,团队策略的概念。
不过,守望先锋对于纯粹的FPS玩家来说,不是那么容易适应。毕竟CS的写实派很难理解治疗,复活,瞬移一类的概念的。
虽然说,守望先锋在国外还是火热,但是对国内玩家来说,真正让他们舍得砸自己的钱罐子的是《绝地求生》。
其实,绝地求生对于显卡要去也不算太高。一般来说,1080P下面的话,GTX1060 6GB版本够了。但是对于网游配置要求不高的玩家来说,倒是头一次感受到1000元档次甜点显卡的魅力。
后面的APEX就水到渠成了,APEX和堡垒之夜对显卡反而没有绝地求生高,而且免费玩,在国内火得快,冷得也快。有意思的是,绝地求生可以说给电脑城装机店一次开香槟的机会。不仅仅显卡升级,路由器、外设、显示器和网络软件都一波升级。当然了,不少朋友倒是好不容易找到升级主机的机会,暗爽ing。
FPS电竞游戏的崛起,带动了外设行业的发展,除了我们熟知的键盘、鼠标、游戏耳机以外,高刷新率显示器以及支持G-SYNC的专业游戏显示器,也慢慢成为新宠。
G-SYNC技术在显示器中内置一枚可与GeForce硬件直接通讯的芯片,这枚自带缓存的芯片可以协调显示器与GPU outputbuffer之间的数据同步。通过G-SYNC芯片的控制,显示器的刷新延迟将可以与GPU帧输出延迟保持完全一致,支持G-SYNC技术的显示器会根据GPU当前的性能水平自动调节刷新率,
在G-SYNC芯片侦测到GPU的帧输出延迟大于16ms时,它便会自动延长显示器的刷新延迟,避免传统的帧丢弃问题所导致的视觉卡顿现象。
G-Sync能够去除游戏垂直同步(VSync)开启时的画面滞后问题,也能够克服垂直同步关闭时画面失真问题。常规显示器会直接同步GPU的处理结果,而借助G-Sync模块,只有当GPU完成一帧的渲染和画面优化后,显示器才会刷新显示内容。
FPS游戏跟其他类型的游戏要求不一样。一般而言,其他类型游戏有85帧已经流畅,甚至手速不大好的朋友,40帧都问题不大。但是对于FPS来说,低于85帧就是击中和被击中的问题。为了保证帧速,玩家和开发商不约而同选择了同样一个做法—对画质妥协。
不客气说一句,绝地求生、apex、守望先锋、堡垒之夜的画质还远远不如孤岛危机3。网游大作就等于没有好画质吗?
非也,请看一下,第一个支持光线追踪以及DLSS的游戏,最核心的玩法是多人对战。
而光线追踪和DLSS两大技术的奠基人就是NVIDIA,AMD的RDNA2据说可以支持光线追踪,而FidelityFX本质和DLSS是同类型的技术。
要玩光线追踪和DLSS,一年半之前我们就可以买买NVIDIA图灵架构的RTX20系列显卡。如上TU104-410就是2080 super的核心,TU代表的就是图灵架构。
图灵架构最为划时代的创新是加入了光线追踪以及人工智能运算的部分。其中,RT(Ray Tracing,光线追踪),其特点在于可实现混合渲染,它将传统的光栅化与光线追踪相结合,可提供更快、更高效的渲染速度。作为专用的光线追踪单元,它还为“射线和三角形的相交检测”与“层次包围盒(BVH)”提供加速计算,后者(BVH)是三维场景中一种常见的数据结构。
RT core实质上就是SM里面加了一条专用的流水线(ASIC)来计算射线和三角形求交,可以访问BVH,由于是ASIC专用电路逻辑,所以和用shader code来做求交计算相比,性能/mm^2可以有数量级的提升。RT CORE的工作原理就是,着色器(Shaders)发出光线追踪的请求,交给RT CORE来处理,RT CORE将进行两种测试,分别为Box IntersectionEvaluators和Triangle Intersection Evaluators。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而DLSS技术,可以说是人工智能技术落实到游戏体验体验之中。以往的AA抗锯齿技术都是由GPU对画面进行实时处理,很消耗资源,但好处是对外部条件需求很少,只要游戏支持就能开,哪怕低端显卡帧率会很惨也能开。
DLSS则既然不同,它基于AI人工智能和DL深度学习,需要首先对游戏画面进行采样,在NVIDIA的服务器上使用4K或者8K超高清分辨率处理,然后降回到游戏分辨率,结合玩家实际场景来提升画质。
可以想象,不同玩家、不同显卡、不同分辨率、不同画质、不同场景所得到的游戏画面都是不一样的,极端条件下DLSS需要对所有场景的每一帧进行单独学习和处理,数据量和任务量是极为恐怖的。
虽然DLSS可以自我学习改进,但需要时间,在游戏发售初期肯定不可能来得及处理所有场景,效果也不会太好,所以上述限制就很容易理解了,因为那些不能开启的情况,显然就是还没有学习到位的,详细后期会逐渐开放。
市面上的RTX20系列显卡,基本上已经全部升级为super系列,也就是相对1.5代的升级。基本上来说,super后缀新卡都比起之前的型号规格和频率有所提升,而价格不变。也就是说用过往映众RTX2080冰龙超级版的资金,现在就可以入手同档次的映众RTX2080 super冰龙超级版。
一如既往,映众RTX2080 super 冰龙超级版的散热还是海格力斯的系统,不过明显比起过往的开普勒架构、Maxwell、Pascal架构有所修身。估计也是因为整体能耗比再度提升的结果,而且这一代的图灵结构显卡,频率都非常高,这架构上的红利,真心可以。
信仰背板就不在话下,再来看看供电部分。映众RTX2080 super冰龙超级版采用的是G180公版PCB方案,12层板子设计,8+2相奢华供电绝对是旗舰级别的待遇,贴片电容、铁素体电感一个不少。采用了全数字供电,其中显存部分采用的是GStek9216芯片。映众RTX2080 Super冰龙超级版的接口方面是3*DP+1*HDMI接口的组合,支持8K输出,并且支持SLI。
好了,显卡赏析结束,我们还是来看看实测性能吧。
性能实测篇:
老规矩先来看看测试平台,如下:
CPU:i5 96000kf
主板:微星Z390
内存:十铨 T1 Gaming DDR4 2666 8GBX2
显卡:映众 RTX2080 Super 冰龙超级版
硬盘:WD Black 1TB
电源:酷冷额定750W
先来看看光线追踪以及DLSS测试的部分,现在能完整支持两大特效的测试和游戏仅有3DMark、战地5、地铁:离去、古墓丽影11暗影,相信后续还会有新游戏支持
1、3DMark Port royal场景测试
3DMark Port Royal测试基于DirectX Raytracing技术,在图形渲染过程中实时跟踪物体和环境的光线,准确进行光线反射和折射、全局照明、物理阴影的绘制,可以带来近乎百分之百真实的渲染画面,尤其是光影效果。
除了基准测试性能之外,3DMark Port Royal同样也是展示了光线追踪令人惊叹的画面表现,它通过2560×1440分辨率为玩家展示了显卡在游戏中应用的光追效果。
映众RTX2080 Super获得7013分。
RTX20系列除了光线追踪还有DLSS深度学习抗锯齿技术,而3Dmark提供了一个测试项目可以清晰看到开启DLSS和关闭DLSS的性能差别。通过测试,我们可以看到,映众RTX2080Super开启DLSS是46.61帧,关闭是32.5帧,很明显,开启DLSS以后能够节省大量的资源,从而获得更高的帧数和更好的游戏体验。
2、战地5
1080P分辨率下面,关闭光线追踪、光线追踪高特效、光线追踪极限特效的帧速分别是174、95、76帧。不过,RTX2080 Super 在1080P下面是无法打开DLSS特效的,2k和4k就可以。
2k分辨率
2K分辨率下面,关闭光线追踪、开启DLSS光线追踪高特效、开启DLSS光线追踪极限特效的帧速分别是122、95、76帧。不过,RTX2080super在2k分辨率下面可以打开DLSS特效的,实用性还是很高的说
4K分辨率
4K分辨率下面,事情就非常复杂了,关闭光线追踪、开启DLSS光线追踪高特效、开启DLSS光线追踪极限特效、关闭DLSS光线追踪极限特效的帧速分别是69、44、33、20帧。感觉RTX2080 super还是不足够在4k分辨率下面开启光线追踪。
2、地铁:离去
地铁:离去同样是一个同时支持DXR实时光线追踪、DLSS深度学习超采样抗锯齿的3A大作,来自俄罗斯不一样的风味不一样的世界观,却给我们同样顶级的画面和手感。
1080P分辨率的成绩有点奇怪,关闭光线追踪和DLSS以后居然比起开启更低,估计是负载不够,无法让显卡全速运行,我们还是看2K和4K分辨率吧。
2K分辨率
2k分辨率下面,《地铁:离去》关闭光线追踪、开启光线追踪最高特效、开启光线追踪最高特效而且打开DLSS的帧数,分别是65.67、46、56.54帧,可以看到,光线追踪开启以后,确实对显卡压力大,万幸同时开启DLSS以后,效果也是明显的。
4K分辨率
4k分辨率下面,《地铁:离去》关闭光线追踪、开启光线追踪最高特效、开启光线追踪最高特效而且打开DLSS的帧数,分别是51、25、39帧
3.古墓丽影11暗影
2k分辨率
2k分辨率下面,《古墓丽影11暗影》关闭光线追踪、开启光线追踪最高特效的帧数,分别是96、57帧。
4k分辨率下面,《古墓丽影11暗影》关闭光线追踪、开启光线追踪最高特效、开启光线追踪最高特效而且打开DLSS的帧数,分别是52、29、41帧
常规测试方面,3DMark Timesky场景和Fire Strike场景EX模式的得分分别是9845和12049很明显,新显卡在规格和频率上面的提升,带来了比起之前RTX2080更好的体验。
在规格、频率、性能都有所提升的同时,发热会不会变大呢?得益于映众冰龙超级版系列的海格力斯散热器,即使长时间满载,温度依然稳定在72度左右,风扇的噪音也极低。
当我们生活水准提高,慢慢我们已经从被动性接受安排到主动提出要求。游戏体验同样如此,过往我们只能有什么玩什么,慢慢我们要求更好的体验。不仅仅是游戏方式,系统,画面、光影效果、流畅度我们都有所要求。也是因为如此,软硬件厂家不断推陈出新,
以FPS游戏为例,过去雷神之锤第一代基本上是cpu运算为主,到了第二代已经必须要有一定性能的独立显卡,第三代更加对显卡性能要求达到时代的顶峰。而图形处理器厂家,以NVIDIA为例,从过往的一定程度依赖cpu,到T&L引擎从原有系统一定程度独立,到CUDA通用计算。而图灵架构这一代,表面上是光线追踪,其实更深一层的意义在于,人工智能的运用。
图灵架构的光线追踪单元带来更真实的光影和更好的沉浸感,而DLSS深度学习抗锯齿技术,不过就是人工智能的一大应用而已。而现在,微软以及AMD都已经明确支持光线追踪,一年多前非要争论光线追踪实用性的朋友,估计已经没词了。
|
|
|
|