Na neki točki bo vsak računalniški navdušenec želel narediti nekakšno nadgradnjo. Morda je celotna platforma z novim CPE-jem, matično ploščo in kompletom modnega RAM-a. Lahko pa je samo en element, na primer nov pogon SSD.
Kaj pa, ko iščete novo grafično kartico in so cene še vedno v nebo visoke? Koliko boljši je eden najnovejših grafičnih procesorjev v primerjavi z arhitekturo, ki se je prvič pojavila pred več kot štirimi leti? No, berite naprej, če želite izvedeti, kako se je izbira nadgradnje ene osebe obnesla.
Kakšno kartico dobiti? Izbire in odločitve
Vsak ima svojo grafično kartico drugače – za nekatere bo izključno za zabavo (igre, gledanje videoposnetkov), medtem ko bo za druge v celoti temeljila na delu (upodabljanje, urejanje videa, računalniške delovne obremenitve). Zame je to mešanica vseh, z velikim poudarkom na eksperimentiranju s tehnikami upodabljanja, zlasti sledenjem žarkom, in AI.
V zadnjih treh letih sem za vse te naloge uporabljal MSI GeForce RTX 2080 Super Ventus XS OC. Če pustimo neumno ime na strani, bil je pravi vlečni konj, ki se je odrezal pri večini poslanih stvari. Vendar se kartica spopada z visokimi ločljivostmi, je precej brezupna pri sledenju žarkom in resnično začenja kazati svojo starost pri računanju.
Torej, ko je prišlo do izbire nadgradnje, ki jo je treba upoštevati, je pri odločitvi prevladovala ena beseda: CUDA. V dobrem ali slabem je Nvidijina platforma GPE in programske opreme v veliki meri standard, ko gre za računanje in upodabljanje. AMD in Intel sta vložila veliko časa in denarja v razvoj ROCm in OneAPI, vendar nobena od programske opreme, ki jo uporabljam, ne nudi nobene podpore zanju.
To je pomenilo vztrajanje pri Nvidii in nato druga izbira — Ampere ali Ada? Kljub temu, da je star več kot dve leti, je nekaj podobnega GeForce RTX 3080 10 GB še vedno zelo zmogljivo in ga je mogoče najti novega v Združenem kraljestvu za približno 700 GBP. Trg rabljenih izdelkov je še posebej poln in tudi po odličnih cenah, vendar to preprosto ni pot, o kateri bi želel razmišljati.
Edini model Ada, ki je blizu te cene, je seveda GeForce RTX 4080 12 GB 4070 Ti, s priporočeno maloprodajno ceno £799 — le da niso te cene. Najcenejši modeli so običajno okoli £830, kar je majhna, a moteča 4-odstotna razlika.
Parametri GPE | RTX 2080 Super | RTX 3080 | RTX 4070 Ti |
Povečana ura (GHz) | 1,815 | 1.710 | 2.610 |
GPC | TPC šteje | 6 | 24 | 6 | 34 | 5 | 30 |
Število SM | 48 | 68 | 60 |
Jedra FP32 | 3072 | 8704 | 7680 |
INT32 jedra | 3072 | 4352 | 3840 |
Tenzorska jedra | 384 | 272 | 240 |
TMU-ji | 192 | 272 | 240 |
ROP-ji | 64 | 96 | 80 |
Predpomnilnik L1 na SM | 64 kB | 128 kB | 128 kB |
Predpomnilnik L2 | 4 MB | 5 MB | 48 MB |
Širina vodila VRAM | 256 bitov | 320 bitov | 192 bitov |
Količina/vrsta VRAM-a | 8 GB GDDR6 | 10 GB GDDR6X | 12 GB GDDR6X |
Pasovna širina VRAM (GB/s) | 496 | 760 | 504 |
Na papirju se zdi 3080 boljša izbira, pa ne samo zato, ker je cenejši od 4070 Ti. Ima fizično večji čip glede na število struktur — ima največ grozdov za obdelavo grafike in teksture (GPC, TPC), tako da lahko obravnava več trikotnikov hkrati kot drugi. Ima tudi največ enot za preslikavo tekstur (TMU) in izhodnih enot za upodabljanje (ROP), pri čemer so slednje pomembne pri visokih ločljivostih.
Na tem mestu je vredno omeniti še en kriterij za odločitev in to je ločljivost mojih monitorjev: 4K. Zaradi tega bi moral biti 4070 Ti drugi kandidat za 3080, vendar ima prvi dve glavni prednosti: takt in količino predpomnilnika L2.
Z referenčno pospešeno frekvenco 2,61 GHz je skoraj 50 % višja kot pri drugih dveh modelih, kar več kot nadomesti relativno pomanjkanje komponent. Najvišja prepustnost FP32 je na primer 40,3 TFLOPS. 2080 Super se znajde z 11,2, 3080 pa 29,8 — za delo z umetno inteligenco in upodabljanje brez povezave je to velika razlika.
Ven s starim (zgoraj) in notri z novim
In tu je predpomnilnik L2. AMD-jeva arhitektura RDNA 2 je pokazala, kako pomemben je sistem predpomnilnika za igranje iger, z L4 Infinity Cache, ki olajša obremenitev VRAM-a. Nvidia je vedno uporabljala preprosto dvonivojsko hierarhijo predpomnilnika in zelo velike posamezne ravni lahko povzročijo povečane zakasnitve; veliko višje frekvence ure pa bi to izravnale.
Ampere in Ada imata zelo podobni strukturi Tensor Core – morda je videti, da ima 2080 Super tukaj prednost, vendar imajo novejše arhitekture jedra z dvojnim številom operacij na uro kot stari Turingov dizajn.
Glede na to, za kaj bom kartico uporabljal, je izbira postala preprosta. Zdaj je preostala le še izbira znamke in modela 4070 Ti, vendar je bilo to enostavno. Odločil sem se le za najcenejšo, za katero se je izkazalo, da je Zotac RTX 4070 Ti Trinity OC. Običajno se ne bi obremenjeval z overclockiranim modelom katerega koli prodajalca AIB, toda ta je bil po naključju cenejši od vseh ostalih.
Velika pričakovanja od nove kartice?
Seveda sem že vedel, kakšen je 4070 Ti v primerjavi s 3080, saj ga je Steve že temeljito preizkusil. Z geometrijsko povprečno hitrostjo sličic, ki je bila za 21 % višja kot pri 3080, je bila nova kartica Ada slabša glede na specifikacije papirja (4070 je 35 % višja pri vseh meritvah upodabljanja kot kartica Ampere), vendar je pogosto tako.
Edina težava je bila, da 2080 Super ni bil vključen v te teste. Vendar pa je bil vključen v Steveove ocene za kartice RTX 3070, 3080 in 3090. V testih 4K so te tri grafične kartice v primerjavi s ploščo Turing dosegle takole:
- RTX 3070=20 % višje nizke vrednosti, 19 % višje povprečje
- RTX 3080=59 % višje nizke vrednosti, 61 % višje povprečje
- RTX 3090=77 % višje nizke vrednosti, 79 % višje povprečje
Iz pregleda 4070 Ti so njegove geosrednje vrednosti 4K izgledale takole:
- RTX 3070=57 % višje nizke vrednosti, 61 % višje povprečje
- RTX 3080=20 % višje nizke vrednosti, 21 % višje povprečje
- RTX 3090=4 % višje nizke vrednosti, 6 % višje povprečje
Če združim vse te številke, sem ocenil, da bi lahko bil 4070 Ti med 90 % in 95 % hitrejši od mojega starega 2080 Super. Lahko vendar je to operativna beseda, saj so bili vsi uporabljeni različni testni stroji in različna merila.
Kako bi se vse to obneslo na mojem računalniku Intel Core i7-9700K, Asus Z390, 16GB DDR4-3000, je bila povsem druga stvar. Tako pomemben skok v zmogljivosti lahko na koncu pokaže jasne znake, da je merilo uspešnosti sistemsko omejeno. Vse bi se zmanjšalo na posamezne teste.
Ne, da mi je s temi uspelo priti zelo daleč, ko je prispela nova kartica. Delovalo je popolnoma dobro približno 8 ur, preden sta se en krmilnik ventilatorja in krmilnik LED odločila zapakirati predstavo in se odpraviti na plažo. Lepe luči, brez katerih bi lahko živel, toda pokvarjen krmilnik ventilatorjev je upravljal dva od treh ventilatorjev, tako da to vsekakor ni bilo sprejemljivo. En hiter RMA (in s hitrim mislim 5 dni …) pozneje in spet smo bili v poslu.
Prva analiza z mikromerili
Prvi sklop testov, ki sem jih izvedel na novem 4070 Ti, je bil majhen primerjalni paket nekoga, ki se imenuje Nemez. Na njeno delo sem naletel prek ekipe pri Chips and Cheese in gre za serijo testov, ki temeljijo na Vulkanu in so zasnovani za ustvarjanje podatkov o prepustnosti in zakasnitvi za temeljne operacije GPE.
Čeprav sem pregledal vse teste, ki jih je ponujal paket, so me najbolj zanimali trije, ki so bili izračuni združenega množenja in dodajanja ter merila pasovne širine in zakasnitve za predpomnilnik in pomnilniški sistem. Prva (običajno skrajšana na FMA) je meso in krompir večine operacij GPE; drugi test ugotavlja, koliko hitrih podatkov je mogoče prenesti v/iz SM, slednji pa je, koliko nanosekund zakasnitve je vključenih v te prenose.
Če najprej pogledamo rezultate FMA, ne pozabite, da ima 4070 Ti najvišjo prepustnost FP32 40,3 TFLOPS in najvišjo prepustnost INT32 20,1 TOPS. Zakaj je torej moja kartica nekoliko boljša od te? Da, to je tovarniško overclockiran model, vendar je njegova ura Boost le 2,625 GHz – le 0,6 % hitreje. Tukaj vidimo najvišjo stopnjo FP32 41,4 TFLOPs, kar je povečanje za 2,7 %.
Preprosta resnica je, da bodo Nvidijine kartice presegle svoje referenčne ure, če ne bodo dosegle meje moči ali toplote. Med preskusom je 4070 Ti dejansko deloval pri 2,835 GHz, kar je enako teoretični najvišji hitrosti FP32 43,5 TFLOPS. 2080 Super je počel isto stvar, zato so tudi njegove številke višje od pričakovanih.
Razlika med novo in staro grafično kartico je bila od 80 % (FP16) do 244 % (FP32). Čeprav nisem pričakoval, da bom videl slednjo številko v igrah, bo veliko primerov, kjer bom videl to stopnjo izboljšave.
Preizkus pasovne širine uporablja računske senčnike Vulkan za izračun hitrosti prenosa podatkov v več velikostih preizkusa z uporabo vseh SM-jev v GPE. Turingovi čipi imajo predpomnilnik L1 velikosti 96 kB, ki ga razdeli gonilnik. V grafičnem načinu bo 64 kB nastavljenih kot skupni pomnilnik za shaderje, preostalih 32 kB pa kot podatkovni predpomnilnik L1/predpomnilnik teksture/prelivanje datoteke registra.
Vendar pa je v računalniškem načinu ta predpomnilnik mogoče nastaviti kot 32 kB v skupni rabi/64 kB podatkov ali obratno. Ker 2080 Super dosega pričakovane pasovne širine L1, padec na stopnji 32 kB kaže, da gonilniki razlagajo senčnike Vulkan kot „grafiko”, torej samo 32 kB podatkovnega predpomnilnika.
TU104 je veliko večji čip od AD104. Zasluge: Fritzchens Fritz
V Adi Lovelace je skupno 128 kB predpomnilnika L1, vendar je particioniranje predpomnilnika bolj zapleteno. Gonilniki zdaj presojajo, da je test v 'računskem načinu’, ker pasovna širina pade na 112 kB, kar kaže, da se 16 kB uporablja kot skupni pomnilnik, ostalo pa kot podatkovni predpomnilnik.
Sprašujem se, koliko drugih aplikacij gonilniki ne „berejo” pravilno. A ne glede na to, saj preostali del preizkusa deluje natanko po pričakovanjih – 48 MB L2 predpomnilnika 4070 Ti, višje takte in večje število SM-jev so jasno prikazani. In pri obeh karticah, ko se preskusna velikost preseže meja predpomnilnika, sta pasovni širini praktično enaki, ker se podatki črpajo iz VRAM-a.
Nekaj je bilo posebej zanimivo, vsaj zame, razlika v izmerjeni pasovni širini predpomnilnika L1 v primerjavi s teoretično vrednostjo. 2080 Super je skoraj dosegel 100 %, medtem ko je bil 4070 Ti približno 92 %. Morda je to le nenavadnost samega testa.
Rezultati zakasnitve so potrdili, kar sem že sumil – Nvidia ni storila ničesar, da bi zmanjšala število ciklov za branje/pisanje predpomnilnika L1 v Adi, saj je nižja zakasnitev 4070 Ti (24 % nižja) izključno posledica višjih taktov (vsak Ada cikel je 30 % hitrejši od Turingovega cikla). Vendar pa je impresivno, da je kljub povečanju velikosti predpomnilnika L2 za faktor 12 skupna zakasnitev še vedno nižja kot pri Turingu.
Računalniške hitrosti in pasovna širina so tako višje, boljše pa so tudi splošne zakasnitve, kar je idealno za predvideno uporabo nove grafične kartice. Seveda ni presenečenje, a dobro, da se je izšlo po pričakovanjih.
Druga analiza s sintetičnimi merili
Preizkušanje grafičnih procesorjev je dolgočasno delo. Veliko ponovitev: konfiguriranje meril uspešnosti in iger, preklapljanje med različno strojno in programsko opremo, večkratni zagoni za zanesljivost, ponovno testiranje nenavadnih rezultatov, znova in znova in znova. Ker nisem želel porabiti veliko časa za ta vidik (tj. samo želel sem se lotiti in uporabljati zadevo), sem zagnal nekaj standardnih meril uspešnosti, ki jih lahko preizkusi vsak.
Za začetek sem uporabil merila uspešnosti Blender, V-Ray in 3DMark. Vse je lepo in preprosto za uporabo, brez skrbnih nastavitev ali podobnega.
Blender 3.10.0 (vzorci na minuto) | RTX 2080 Super | RTX 4070 Ti | % Razlika |
Prizor pošasti | 987 | 3566 | +261 % |
Scena trgovine z odpadki | 622 | 1602 | +158 % |
Scena v razredu | 614 | 1756 | +186 % |
V teh testih se nič ne upodobi na zaslonu, vse so tako rekoč izračuni v zakulisju. Toda test Monster jasno kaže, koliko zmogljivosti FP32 ima 4070 Ti v primerjavi z 2080 Super. Drugi testi so očitno manj osredotočeni na ta vidik GPE-ja, vendar je izboljšava še vedno dobrodošla – v mojem gospodinjstvu veliko delamo z Blenderjem, zato je bil zelo dobro sprejet.
V-Ray 5.0.2 | RTX 2080 Super | RTX 4070 Ti | % Razlika |
GPU CUDA (vpaths) | 672 | 2260 | +236 % |
GPE RTX (vrays) | 851 | 2809 | +230 % |
Primerjalna merila V-Ray GPU so zasnovana za delovanje samo na karticah Nvidia, saj oba preizkusa uporabljata CUDA. Prvi preizkus je klasično upodabljanje brez povezave, podobno Blenderju, drugi pa dostopa do jeder za sledenje žarkom v GPU.
Škoda, da je Chaosova programska oprema tako strojno zaklenjena, vendar to ni paket, ki bi ga uporabljal zelo pogosto (če sploh, dandanes), saj so na voljo upodobitve, ki so prav tako dobre in popolnoma odprtokodne. Vsaj podatki zagotavljajo dodatno potrditev povečanja računalniške zmogljivosti.
Ker je povečanje neobdelanega računalništva enostavno prikazano (žal nisem imel časa raziskati nobenih paketov AI ali analize podatkov), je bil čas za preizkus 'grafičnega’ dela nove grafične kartice.
3DMark (prikazano povprečje fps) | RTX 2080 Super | RTX 4070 Ti | % Razlika |
Speed Way | 22 | 54 | +145 % |
Port Royal | 32 | 65 | +104 % |
Preizkus funkcij DXR | 22 | 68 | +209 % |
Time Spy Extreme (GT1) | 34 | 69 | +105 % |
Fire Strike Ultra (GT1) | 39 | 77 | +94 % |
UL-ov 3DMark uporablja Direct3D za izvedbo celotnega upodabljanja, toda v primeru prvih treh testov se uporablja tudi DirectX Ray Tracing pipeline (DXR); za preskus funkcij je skoraj vsa grafika izdelana na ta način. Primerjalna merila so zasnovana tudi tako, da čim manj obremenijo CPE, zato zgornji rezultati predstavljajo najboljši scenarij za novo grafično kartico. Največje presenečenje je bila izboljšava DXR, vendar le zato, ker je treba Nvidiji verjeti na besedo, ko gre za zmogljivost njenih enot za sledenje žarkom.
Za 2080 Super je 'RT TFLOPS’ (karkoli že naj bi bilo) zahtevanih 33,7, medtem ko je za 4070 Ti 92,7 — povečanje za 260 %. Preizkus 3DMark se ne ujema povsem s to številko, vendar je zadostna izboljšava, da preverimo, ali povečano število enot RT, večja prepustnost senčil ter večji in hitrejši predpomnilnik L2 močno prispevajo k izboljšanju zmogljivosti sledenja žarkom.
Trenutno me manj zanima njegova velika uporaba v igrah (obstaja le peščica naslovov, kjer resnično blesti) in bolj raziskovanje modelov osvetlitve v razvojnih motorjih in odrezkih kode. Seveda ne dobim več funkcij RT, samo večjo zmogljivost.
Ena od prednosti uporabe 3DMark je možnost neskončnega zankanja meril uspešnosti, kar mi omogoča uporabo GPU-Z za beleženje povprečnih vrednosti porabe energije plošče med temi testi. Čeprav morda obstaja nekaj dvomov o natančnosti številk v realnem času, je uporaba snemalnika električne energije v stenski vtičnici pomenila, da sem lahko potrdil, da so povprečne številke dovolj natančne za uporabo.
Zmogljivost na vat (povprečna fps na uporabljen vat) | RTX 2080 Super | RTX 4070 Ti | % Razlika |
Speed Way | 0,11 | 0,24 | +128 % |
Port Royal | 0,14 | 0,24 | +74 % |
Time Spy Extreme (GT1) | 0,13 | 0,26 | +91 % |
Fire Strike Ultra (GT1) | 0,16 | 0,28 | +74 % |
4070 Ti je v povprečju porabil 11 % več energije kot 2080 Super v testih 3DMark (preizkus funkcij DXR je bil za to analizo izpuščen), vendar je bilo povprečno izboljšanje zmogljivosti 120 % — od tod zgornji 'Perf na vat’ figure.
Torej, več kot zadovoljen z računalniško in sintetično zmogljivostjo, zdaj je čas, da pogledamo delovne obremenitve upodabljanja v igrah.
Tretja analiza z igralnimi merili
Za recenzije grafičnih procesorjev, ki jih berete na TechSpotu, skoraj vsak rezultat primerjalnega preizkusa izhaja iz vzorčenja podatkov o hitrosti sličic med dejanskim igranjem, da se zagotovijo najbolj realistične grafične obremenitve, ki jih bodo kartice verjetno doživele. Slaba stran uporabe te metode je, da je zelo zamudna – ne morete kar pustiti testa, da opravi svoje, medtem ko delate na nečem drugem. V ta namen sem vzel zbirko iger, ki ponujajo vgrajene primerjalne načine, jih zagnal in uporabil CapFrameX za zbiranje potrebnih podatkov (namesto uporabe statističnih podatkov igre).
Drug vidik, ki ga morate upoštevati pri vgrajenih merilih uspešnosti, je, da je grafična obremenitev le redko enaka tisti med igro. Na primer, v Assassin’s Creed: Valhalla kamera niha po mestu in prikazuje epski razgled z ogromnimi razdaljami, toda ko dejansko igrate naslov, je kamera skoraj vedno v fiksni tretji osebi, komaj nad tlemi. Torej, čeprav upodabljanje ni v celoti reprezentativno za samo igro, še vedno uporablja isti mehanizem in rutine senčenja.
Vsi testi so bili izvedeni 5-krat, podatki pa so bili nato povprečeni, da so dobili povprečno in 1 % nizko hitrost sličic. Merila uspešnosti so bila izvedena brez omogočenega povečanja ločljivosti in nato ponovljena za FSR in/ali DLSS, nastavljena na uravnoteženo. Nazadnje, kjer igra to podpira, je bil omogočen HDR.
Najprej je igra, ki sem jo pravkar omenil, ki uporablja Ubisoftov motor Anvil za vse naloge upodabljanja. Ta programski paket je bil uporabljen za prvo igro Assassin’s Creed in z leti je bil posodobljen tako, da vključuje skoraj vse grafične trike v knjigi (sledenje črtnih žarkov).
Pri nastavitvah ultra visoke kakovosti je merilo uspešnosti terjalo svoj davek pri 2080 Super, vendar uporaba FSR 1.0 zagotavlja prepotrebno spodbudo. Po drugi strani pa se 4070 Ti odlično spopada s povprečnim izboljšanjem sličic na sekundo okoli 117 % (z ali brez omogočenega FSR). Vizualno je videti bolje brez povečanja ločljivosti, čeprav nastavitev v kakovostni način zelo pomaga.
Valhalla je bila prvotno predstavljena brez možnosti nadgradnje, vendar je bila dodana pozneje v popravku; Ubisoft se je odločil, da ne bo posodobil motorja, da bi ponudil sence s sledjo žarkov ali globalno osvetlitev. Res razumna izbira, saj ne gre za igro, ki teče zelo hitro.
Naslednji in iz istega leta je Horizon Zero Dawn Guerrilla Games, ki uporablja njihov lastni motor Decima. Tako kot Valhalla tudi tukaj ni sledenja žarkom, vendar so na voljo tri možnosti povečanja.
Pri tem posebnem preizkusu je bilo opravljenih veliko dodatnih potekov in nekaj preverjanj skaliranja ločljivosti, saj je bilo obnašanje 1 % Low še posebej čudno pri 2080 Super. Uporaba FSR ali DLSS s kartico 4070 Ti ni povzročila več kot 52-odstotnega izboljšanja povprečne hitrosti sličic v primerjavi s kartico Turing. Torej, kaj se tukaj dogaja?
Izkazalo se je, da je vgrajeno merilo uspešnosti v Horizon Zero Dawn precej obremenjeno s procesorjem/sistemom, kar dokazuje dejstvo, da je pri 720 p z zviševanjem ločljivosti 1 % nizka in povprečna hitrost sličic 4070 Ti znašala 70 oziroma 138 — samo delež nižji kot pri 4K. To velja tudi med igranjem v realnem času, vendar se igra v nobenem trenutku ni zdela počasna pri 4K s povečanjem ločljivosti.
Še en Ubisoftov naslov, vendar tokrat z uporabo njihovega motorja Dunia (ki je začel življenje kot posodobljen CryEngine). Sledenje žarkom in povečanje ločljivosti sta obe možnosti, čeprav se prva uporablja samo za sence in odseve. Zagotavlja opazno izboljšavo vizualnih podob na nekaterih področjih, vendar ni nekaj, kar spremeni celoten pogled.
Ne glede na to, kakšno povečanje je uporabljeno, 2080 Super precej dobro obvlada 4K, vendar ga sledenje žarkom popolnoma uniči – to je skoraj zagotovo odvisno od nastavitev, ki zahtevajo VRAM nad 8 GB, ki je na voljo na tej kartici, in motor tega ne obvlada. pravilno izdati. Z 12 GB 4070 Ti ne trpi zaradi te težave in ima le 17-odstotno zmanjšanje povprečne hitrosti sličic z omogočenim sledenjem žarkom (in brez povečanja).
Vendar pa je Far Cry 6 še eno merilo, ki je lahko precej zahtevno za CPE/sistem. Z znižanjem ločljivosti na 720p ter pustitvijo RT in povečanja ločljivosti oba vključena, dobimo 1-odstotno nizko hitrost le 77 sličic na sekundo in povprečje 97. Brez sledenja žarkom gredo stvari nekoliko bolje, vendar je preostali del mojega računalnika nekoliko slabši. omejevanje.
Shadow of the Tomb Raider, ki ga je razvil Eidos-Montréal z uporabo njihovega lastnega motorja, je primer igre z zelo omejeno implementacijo sledenja žarkom – samo sence se izvajajo prek cevovoda DXR in razlika je tako majhna, da preprosto se ne splača omogočiti. RTX 2080 Super se je s to nastavitvijo zagotovo spopadel in niti uporaba DLSS ni kaj dosti pomagala.
Nova grafična procesorska enota Ada Lovelace je prav tako občutno poslabšala svojo zmogljivost, čeprav jo je zvišanje ločljivosti potegnilo nazaj in ko je bila nastavljena na kakovostni način, sta bila hitrost sličic in slike v redu. Igra je povsem v redu, ne da bi imela super ostre sence povsod.
Še en zgodnji posvojitelj RT je Wolfenstein: Youngblood, nekoliko povprečen vnos v sicer odlični seriji iger o srečanju z okultno drugo svetovno vojno. Za razliko od meril uspešnosti pred tem naslovom Youngblood uporablja motor id Tech 6 podjetja id Software, ki deluje na Vulkanu in OpenGL (drugi uporabljajo Direct3D). To pomeni, da se do sledenja žarkom dostopa prek razširitev API-ja, kar bi teoretično moralo zagotoviti boljšo zmogljivost.
Le da v tej igri ni in tako kot pri Shadow of the Tomb Raider, vizualne izboljšave enostavno niso vredne padca hitrosti sličic. Vsaj tako je bilo pri 2080 Super; nova kartica pa ima dovolj presežka zmogljivosti, da ne potrebuje nadgradnje.
1-odstotne najnižje vrednosti so bile v tem merilu uspešnosti povsod, kar je zahtevalo na desetine izvajanj in zavrnitev izstopajočih vrednosti, da bi dobili kakršen koli videz spodobne statistike. Glede na to, da se ta številka bistveno izboljša pri obeh karticah pri uporabi DLSS, kaže, da te različice niso bile posledica ozkega grla procesorja – v veliki meri gre za težavo z upodabljanjem.
Chernobylite je nedavni naslov majhne poljske razvojne ekipe in uporablja Unreal Engine 4 za ustvarjanje resnično spektakularne pokrajine, zlasti z uporabo HDR in sledenja žarkom. Za vse lepe vizualne podobe je treba plačati ceno in celo upoštevajoč, da ima merilnik prednost širok pogled kamere namesto običajnega prvoosebnega položaja, zmogljivost 4070 Ti ni odlična, a tudi ne grozna.
Niti DLSS v načinu Performance ni pomagal dovolj, da bi se splačalo uporabljati RT – res škoda, ker je to eden od relativno redkih naslovov, ki prikazujejo, kako lahko sledenje žarkom resnično dvigne kakovost globalne osvetlitve. Ugotavljanje, ali je to v mejah novega GPU-ja ali uporabe UE4, ni bilo vredno raziskovati, saj bodo nove igre z RT, ki uporabljajo Epicov motor, uporabljale različico 5.
Drug motor, drugo merilo. Tokrat je to okorno nadaljevanje Techlandove Umirajoče svetlobe. Uporaba sledenja žarkom ni tako učinkovita kot v Chernobylitu, čeprav je nočna kulisa s svetilko impresivna. Nastop? Ne preveč.
Uporaba RT, še posebej, če gre za več sistemov osvetlitve (npr. odsevi, sence, globalna osvetlitev), CPE-ju doda precej dodatnega dela, zato uporaba FSR/DLSS ni naredila veliko za 1 % nizke številke.
Dying Light 2 kljub igranju parkour-n-zombies v resnici ne potrebuje ultra-visokih hitrosti sličic, da bi jo lahko igral. Torej, čeprav zgornje številke ne izgledajo tako impresivno, je bila zmogljivost v igri s sledenjem žarkom pri 4070 Ti sprejemljiva. 2080 Super je očitno samo izdeloval lepa ozadja, eno vsako sekundo.
In za konec, Cyberpunk 2077 je standard za sledenje žarkom. Igranje pri 4K z 4070 Ti je bilo več kot dosegljivo, z ali brez povečanja ločljivosti, vendar je bil RT nekoliko preveč za 800 GBP vredno grafično kartico.
To ni povsem pošteno, saj sta z nekaj prilagoditvami nastavitev in uporabo FSR/DLSS v načinu Performance tako merilo uspešnosti kot igra delovala precej dosledno, čeprav okoli oznake 60 sličic na sekundo. Za nekatere to ni dovolj, za druge in zase se s tem lahko spopadem.
Bistvo vseh teh testov je bilo: (a) zagotoviti zamenjavo kartica delovala pravilno, in (b) da bi ugotovili, ali je združevanje rezultatov iz različnih pregledov mogoče uporabiti kot razumno natančen ocenjevalec zmogljivosti. Če se spomnite prej v tem članku, me je uporaba Stevovih mnenj o karticah Ampere in 4070 Ti pripeljala do +92 %. Če upoštevamo geometrično sredino vseh zgornjih meril uspešnosti igre, dobimo to končno oceno.
Geomean izboljšanje fps | 1 % nizko | Povpr |
Brez RT, brez povečanja | +100 % | +89 % |
Brez RT, FSR/DLSS Uravnotežen | +77 % | +77 % |
RT vklopljen, brez povečanja | +1017 % | +481 % |
RT vklopljen, FSR/DLSS uravnotežen | +350 % | +141 % |
Posamezen poskus, kot je ta, ni povsem dovolj dokazov, da bi bili popolnoma prepričani v oceno, vendar podatki kažejo, da je približno pravilna – razlog, zakaj povprečno povečanje sličic na sekundo ni tako visoko, kot je bilo pričakovano, je v omejitvah procesorja v nekaterih testih.
Številke RT brez povečanja je seveda treba zanemariti, saj RTX 2080 Super na splošno ni mogel izvajati večine teh določenih meril uspešnosti nad 1 ali 2 fps. Toda kjer uporaba FSR in DLSS ni resnično pomagala stari kartici Turing, se nova Ada še posebej dobro obnese. Njegova geosrednja 1-odstotna nizka in povprečna hitrost sličic je bila 55 oziroma 74 in to je zame dovolj dobro.
Torej, vsi smo končali, kajne? Čas za čaj in piškote? Ne še.
Končne misli o debelokožcih v računalniku
Nekaj stvari je treba obravnavati, preden zaključim to zgodbo o nadgradnji, in prva zame je bil tisti prekleti priključek 12VHPWR. Zotac je kartici priskrbel 3-smerni 8-pinski ključek PCIe in zdi se, da je dobro izdelan, primerne dolžine itd. Vendar sem z leti združil dodatne napajalne kable PCIe za svojo Corsair RM1000 PSU.
Edina rešitev je bila pridobiti Corsairov 2-way PCIe-to-12VHPWR kabel za napajanje — je več kot dovolj dolg, uporablja pletene kable in se res dobro prilega, vendar je bilo dodatnih 20 GBP, ki jih prvotno nisem imel pričakovano.
Neumnost z moje strani je povzročila, da sem moral kupiti enega od teh
Tako je ta grafična kartica pri MSRP v vrednosti 799 GBP skupaj znašala 860 GBP (840 GBP za kartico). Nisem proti plačilu visoke cene za komponente računalnika, če ustrezajo vlogi, za katero jih potrebujem, vendar bi se temu dodatnemu strošku zlahka izognili, če bi Nvidia uporabila samo standardne napajalne priključke PCIe. S TDP 285 W bi bili dve 8-pinski vtičnici več kot zadostni in tiskano vezje kartice je dovolj veliko, da ju sprejme.
Medtem ko smo že pri ceni, je večina mnenja o prodajni oznaki 4070 Ti, da je previsoka za model serije 70 in s tem se popolnoma strinjam. Je vsaj 33 % višji od 3070 Ti in 60 % višji od 2070 Super. Nvidia je prvotno želela odvrni to tržite to grafično procesorsko enoto kot izdelek razreda 80 in na tej podlagi je njena priporočena maloprodajna cena le 11 % višja od vrednosti 2080 Super. Toda to naj bi bil 'bottom end’ 4080, ne novi Super.
Če ne bi bilo CUDA, bi bil to resen kandidat za izbiro nadgradnje
Glede na vse povedano, mislim, da ne bo kmalu prišlo do kakršnih koli sprememb paradigme v tržnih cenah za grafične procesorje (če sploh) in me pravzaprav ne zanima, kako se temu reče. Nvidia bi ga lahko poimenovala RTX Slartibartfast, kar me zanima – pomemben je bil nabor funkcij in izboljšanje zmogljivosti, oboje pa je bilo v cenovnem razredu, ki sem ga bil pripravljen sprejeti. Če bi se zeleni velikan držal prvotnega načrta in ga izdal kot 4080 za 899 GBP, je možno, da bi namesto tega izbral novo pot 3080.
In če bi obstajala boljša programska podpora za AMD-jeve grafične kartice, bi Radeon RX 7900 XT verjetno resno pogledal. Čeprav njegova zmogljivost sledenja žarkom ni tako močna kot pri 4070 Ti, je vseeno boljša od moje stare 2080 Super in ima veliko računalniške zmogljivosti in VRAM-a. Edina slaba stran je, da je 7900 XT približno 60 do 70 £ dražji od kartice Nvidia, čeprav ne bi potreboval kabla 12VHPWR.
Ustvarjanje okvirov globokega učenja v akciji. Mah.
Ena funkcija, ki je doslej nisem omenil, je ustvarjanje okvirjev DLSS (alias DLSS 3). To je zato, ker sem ga preizkusil samo v enem naslovu (Spider-Man: Miles Morales) in tudi takrat je bila zelo subjektivna analiza – v bistvu sem ga samo omogočil in pustil, da gospodinjski strokovnjak Spidey izrazi svoje mnenje o tem, kako se počuti /pogleda. Ne bom ponavljal natančnih besednih zvez, izrečenih med eksperimentom, lahko pa jih parafraziram z eno besedo: zaostanek.
Igro je najbolje igrati s krmilnikom in po tem, ko sem jo preizkusil sam in nato ponovno uporabil tipkovnico in miško, se lahko strinjam, da je opazna počasnost. Ne gre za dejansko zamudo pri premikanju krmilnih palic in odzivu na zaslonu; to je bolj občutek kot karkoli drugega. Preklop na miško in tipkovnico pa naredi veliko manj opazen. Ko bom imel čas, ga bom preizkusil v nekaterih drugih naslovih, vendar trenutno ni velikega števila naslovov, ki bi to podpirali.
In s tem je čas, da končamo to zgodbo o nadgradnji. Nova kartica deluje po pričakovanjih (vsaj večinoma tako) in je opazen napredek v primerjavi z 2080 Super – ne samo v zmogljivosti, ampak tudi v učinkovitosti in hrupu. Čas je, da začnete delovati!
Nakupovalne bližnjice
- Nvidia GeForce RTX 4070 Ti na Amazonu
- Nvidia GeForce RTX 4080 na Amazonu
- Nvidia GeForce RTX 3080 na Amazonu
- AMD Radeon RX 7900 XTX na Amazonu
- AMD Radeon RX 7900 XT na Amazonu