nVidia RTX 2080 - revolucija na področju računalniške grafike
Podjetje Nvidia je nedavno predstavilo serijo 20, novo in dolgo pričakovano generacijo grafičnih kartic, ki je naslednica serije 10. Večino medijske pozornosti je pritegnila kratica RTX, ki napoveduje uporabo tehnike sledenja žarkom v realnem času, a so zelo pomembne tudi druge novosti, ki jih prinaša nova generacija.
Upodabljanje s tehniko sledenja žarkom (glej okvirček) v realnem času je t. i. sveti gral na področju računalniške grafike vse od iznajdbe metode ob koncu 70. let prejšnjega stoletja. Tehniko so s pridom uporabljali v filmski industriji, arhitekturi in marketingu, za uporabo v igričarski industriji pa je bila do sedaj prevelik računski zalogaj. Nvidia obljublja in s svojimi tehnološkimi demonstracijskimi primeri tudi nakazuje, da se zna v bližnji prihodnosti marsikaj spremeniti.
Surovi moči Quader primerna je seveda tudi cena, ki naj bi za najmočnejšo kartico dosegla vrtoglavo vrednost 10.000 dolarjev.
Serija grafičnih kartic 10 je bila predstavljena že (davnega) leta 2016, zato lahko od letošnje novosti pričakujemo marsikaj; za začetek predvsem gladko igranje iger pri ločljivosti 4k z vsaj 60 sličicami na sekundo. Najprej bosta iz nove serije dostopni najboljši grafični kartici, GeForce RTX 2080 in 2080 Ti. Obe poleg tega, da ponujata boljše zmogljivosti za izris grafike na stari način z uporabo jeder CUDA oz. senčilnih jeder, ponujata še dodatni procesni enoti, ki vsebujeta jedri RT in Tensor. Kasneje bodo sledile še dostopnejše kartice 2070, 2060 in morda celo 2050, napovedana pa je tudi serija treh profesionalnih kartic Quadro. Medtem ko so jedra Tensor prišla na trg s starejšo arhitekturo Volta in so namenjena predvsem rabi v umetni inteligenci z modeli globokega učenja, so jedra RT, ki so namenjena računanju sledenja žarkom v realnem času, noviteta arhitekture Turing.
Sledenje žarkom
Sledenje žarkom je tehnika izračuna osvetlitve v 3D prizoru, ki simulira pot svetlobnih žarkov po svetu. Gre za zamisel, da svetlobnemu žarku sledimo od cilja (pike na sliki) k izvoru (lučem) in pri tem hranimo odzive ob odbojih od površin in lomih svetlobe na poti skozi prosojne površine. Postopek je pri kompleksnih prizorih procesorsko nadvse zahteven, še posebej, kadar želimo žarkom slediti prek veliko odbojev in/ali prehodov skozi objekte.
Končni rezultat predstavlja slika z visoko stopnjo realizma. Ravno pospeševanju algoritmov, ki temeljijo na sledenju žarkov, je namenjeno novo Nvidino računsko jedro na grafičnih karticah serije RTX – jedra RT. V zadnjem času se uporabljajo približne metode za izračun osvetlitve, ki se nato kombinirajo s filtri za odpravo šuma. Tako Nvidia že dosega izvajanje v realnem času.
Senčenje in še enkrat senčenje
Ker ni pričakovati, da bodo razvijalci iger čez noč močno spremenili razvojni proces in s tem povsem izkoristili novo arhitekturo, bodo imele večji vpliv na igričarsko industrijo predvsem tehnologije in funkcionalnosti, ki so uporabne tudi sicer. Takšni sta na primer tehnologiji večločljivostno senčenje (angl. multi-resolution shading - MRS) in senčenje, prilagojeno lečam (angl. lens-matched shading - LMS). Kljub temu da sta bili v osnovi obe tehniki razviti za pospeševanje v navidezni resničnosti, sta uporabni tudi drugače.
MRS tako omogoča, da grafična kartica prikazano sceno pred samim izrisom v realnem času razreže z mrežo, nato pa posamezne celice mreže osenči glede na pričakovano izhodno kvaliteto.
Na zgornji sliki tako na primer neobarvane celice osenči pri polni kakovosti. Pri obarvanih, kjer ni potrebe po enaki kakovosti, pa se za rdeče celice pri izračunu senčenja združi 4x4 pike, za modre pa na primer 2x2 piki. Glede na nizko stopnjo podrobnosti v obarvanih celicah je razlika v končni sliki bolj ali manj neopazna. Tak koncept lahko zelo enostavno prevedemo na igranje dirkalnih iger, kjer je igralec osredotočen na horizont in vozila, drugo pa je zunaj središča pozornosti. Pri Nvidii pravijo, da je v gibanju razlika nezaznavna, močno pa razbremeni obremenitev senčilnih jeder in s tem omogoča hitrejše stopnje osveževanja.
Enaka tehnika je uporabna tudi v navidezni resničnosti, kjer je uporabnik večinoma osredotočen na sredino slike.
Po drugi strani pa je zaradi deformacij leč smiselno slike izrisovati v drugačni obliki in s tem poskrbeti za zmanjšanje popačenja, obenem je lahko končna izrisana slika tudi nekoliko manjša. Prav to naslavlja tehnika LMS.
Pri Nvidii razvijajo tudi naprednejše metode, ki bodo omogočale novo rabo že osenčenih tekstur prek več zaporednih sličic in spreminjanje kakovosti izrisa premikajočih se objektov za primere, ko oči ne zaznajo razlik. V tehnološki demonstraciji je Nvidia pokazala, da lahko v najnovejših igrah, kot je Wolfenstein II: The New Colossus, z uporabo predstavljenih tehnologij dosežejo 15–20 % pospešitev z zanemarljivo izgubo kakovosti.
RTX 2080 Ti ima dodatnih 768 jeder CUDA in seveda jedra Tensor in RT. Kartica 2080 Ti ima 11 GB pomnilnika, kar je enako kot najboljše kartice serije 10, a je pomnilnik novejše generacije GDDR6, ki namesto 11 Gb/s podpira hitrost 14 Gb/s. Kartica razreda Ti tako omogoča gladko igranje tudi najzahtevnejših iger pri ločljivosti 4k pri hitrostih nad 60 sličic na sekundo. To smo lahko doslej dosegli le, če smo v računalnik hkrati vpregli dve kartici GeForce GTX 1080 Ti. Že to je zadosten razlog za navdušenje, novosti pa je še kar nekaj.
Novosti pri razvoju iger
Nove tehnologije in nova jedra omogočajo, da razvijalci del procesorske moči iz senčilnih jeder preložijo v dva nova tipa računskih jeder, ki so veliko bolje prilagojena za določene naloge. Tako lahko računanje korakov v igro vgrajene umetne inteligence prenesejo na jedra Tensor. Nanje lahko prenesejo tudi izvajanje »pametnih« filtrov, kot so DLSS (glej okvirček) za izboljšanje končne kakovosti slike. Na jedra RT lahko prenesejo izračun osvetlitve, fizike in, nenazadnje, tudi obnašanje zvoka v prostoru (odmevi in odboji). Tako se lahko obremenitev osnovnih senčilnih jeder bistveno zniža in jih lahko uporabijo za izračun osnovne slike igre v višji ločljivosti in pri višji frekvenci osveževanja. Vse to pa pride še posebej do izraza v aplikacijah in igrah za navidezno resničnost, kjer je potreba po višjih hitrostih izrisa in višjih ločljivostih verjetno največja.
Cilj je prikaz v ločljivosti 4K z vsaj 60 sličicami na sekundo.
Novosti za druge aplikacije
Podobno kot pri igrah bodo lahko razvijalci nove Nvidiine tehnologije uporabili tudi pri pospeševanju drugih aplikacij, kot so na primer aplikacije za 3D upodabljanje in aplikacije za urejanje videa. Tem so namesto serije GeForce bolj namenjene kartice serije Quadro, ki je prav tako doživela preporod v tehnologiji RTX. Uporabniki bodo tako lahko v delovni postaji združili do dve kartici, v strežniških rezinah pa tudi večje število kartic te serije.
Specifičen algoritem za glajenje je ustvarjen s superračunalnikom.
Serija Quadro RTX obljublja od 16 do 48 GB pomnilnika na kartico, do 4608 jeder CUDA in do 576 jeder Tensor. Število jeder RT še ni znano. Nvidia obljublja realnočasovno urejanje in popravljanje videa, hitro izvajanje algoritmov za »pametno korekcijo«, realnočasovno osvetljene 3D modele med samim procesom oblikovanja in še več.
Surovi moči primerna je seveda tudi cena, ki naj bi za najmočnejšo kartico dosegla vrtoglavih 10.000 dolarjev.
Globoko učenje
Tehniki MRS in LMS predstavljata tehniki pospeševanja, primerni za vse igre. A Nvidia ima ambicije narediti še korak dlje. Vprašanje je, kako razbremeniti obremenitev senčilnih jeder, ravno to pa prinaša koncept tehnike supervzorčenja z globokim učenjem (angl. deep learning super sampling – DLSS). DLSS je nova tehnika glajenja robov, za razliko od dosedanjih tehnik ne izkorišča istih jeder kot se uporabljajo za senčenje (jedra CUDA), temveč jedra na novem delu čipa, ki je predstavljeno z generacijo RTX.
Pri DLSS gre za zamisel, da se za posamično igro razvije specifičen algoritem za glajenje, ustvarjen s superračunalnikom. Poenostavljeno povedano, superračunalnik za vhod uporabi velikansko količino slik igre v izredno visokih ločljivostih, nato pa razvije globoki model, ki na podlagi visoločljivih slik in originalnega vhodnega slikovnega signala razvije model, ki vhodni signal »filtrira« in ustvari čim bolj enakovredno izhodno sliko.
Izgradnja takega modela lahko terja precej časa, a Nvidia razvijalcem to možnost ponuja brezplačno. Ko se razvijalci igre povežejo z Nvidio, igro naložijo v Nvidiin oblak. Tam se nato uči zgoraj predstavljeni model supervzorčenja. Ko je model dovolj dobro naučen in vrača zadovoljive rezultate, ga pri Nvidii »zapakirajo« in pošljejo igralcem v paketu prek aplikacije GeForce Experience. Slika z uporabo DLSS je večinoma ostrejša kot z uporabo najbolj priljubljene tehnike časovnega glajenja robov (angl. temporal anti aliasing).
DLSS tako predstavlja odlično alternativno obstoječim tehnikam glajenja robov, saj za delovanje ne obremenjuje senčilnih jeder, temveč nova jedra Tensor. Zaradi tega lahko dodaten procesorski čas, ki bi ga sicer porabili za glajenje robov, uporabimo za kaj drugega.
Največjo omejitev predstavlja to, da mora Nvidia za vsako igro razviti prilagojen algoritem DLSS. Kot smo že omenili, to sicer ponuja na voljo kot brezplačno storitev, s katero pa se mora seveda strinjati tudi razvijalec. S tem omejimo tudi končne uporabnike, ki so za uporabo DLSS primorani izbrati grafično kartico iz Nvidiinega nabora. Po drugi strani uporaba DLSSja ne zahteva skoraj nič dodatnega vložka s strani razvijalca, kar pomeni, da se bo morda zanjo odločilo več ljudi. Podpora je že napovedana za nekaj velikih težko pričakovanih naslovov, kot so Final Fantasy XV, Hitman 2 in Shadow of the Tomb Rider.