Portal Prelude RTX porta una classica mod di Source all’avanguardia della tecnologia grafica

Portal Prelude RTX modding Source with cutting-edge graphics technology

Portal: Prelude RTX è un impressionante showcase della tecnologia RTX Remix di Nvidia, che prende ciò che era una mod di Source per Portal e gli conferisce caratteristiche visive e tecnologia che rivalizzano e superano persino i giochi AAA di alta qualità. È davvero spettacolare – e speriamo che sia uno dei tanti remaster basati su tracciamento dei raggi che verranno in futuro, quando gli strumenti di modding di RTX Remix saranno disponibili.

Ma ancora più interessante, Prelude è anche il primo gioco a supportare RTX IO, uno schema di decompressione accelerato dalla GPU che funziona sotto Vulkan. Questa è essenzialmente una versione di Nvidia del Direct Storage 1.2, che è inclusa anche in Ratchet and Clank: Rift Apart che verrà lanciato su PC questo mese. Il suo scopo è accelerare il caricamento dei giochi e lo streaming delle risorse sulla piattaforma PC, e la sua inclusione qui ci dà una buona scusa per vedere come funziona la tecnologia.

Storicamente, il caricamento coinvolgeva il trasferimento di dati di gioco come texture o modelli da un disco rigido alla memoria di sistema e poi alla GPU sotto il controllo della CPU. Questo era un approccio abbastanza lento in termini di latenza, poiché il disco doveva girare fisicamente, individuare i dati e quindi caricarli blocco per blocco in modo da minimizzare la quantità di ricerca necessaria.

Ecco la presentazione video completa di Alex Battaglia su RTX IO in Portal: Prelude RTX.

Questa tecnica funzionava abbastanza bene con asset di gioco relativamente piccoli caricati da HDD, ma con i giochi che ora occupano centinaia di gigabyte di spazio e con asset estremamente dettagliati, tutti questi dati devono essere compressi per sfruttare al meglio lo spazio di archiviazione disponibile e la larghezza di banda. Ciò significa che gli asset devono essere decompressi dalla CPU prima di poter essere utilizzati sulla GPU, e il tempo aggiuntivo e il carico sulla CPU che questo comporta significa che l’approccio tradizionale inizia a cedere.

Felizmente, l’avvento di memorie flash rapide a bassa latenza negli SSD significa che non è necessario leggere i dati in modo sequenziale per minimizzare i tempi di ricerca – possiamo creare uno nuovo standard. Prima di tutto, vogliamo accedere ai dati in parallelo per ridurre massivamente i tempi di caricamento rispetto allo standard I/O di Windows precedente. In secondo luogo, vogliamo assicurarci che i dati vengano spostati dalla memoria di archiviazione alla GPU prima di essere decompressi. Le GPU hanno molti core e svolgono compiti enormemente paralleli come la decompressione meglio delle CPU, quindi questo approccio risparmia molto tempo. Questo è il nuovo sistema immaginato per RTX IO e Direct Storage 1.2, e offre tempi di caricamento più veloci e, quando utilizzato nel gameplay a scopo di streaming, una riduzione del carico sulla CPU che può potenzialmente migliorare le prestazioni.

Per RTX IO, come avviene qui in Portal Prelude RTX, i dati su disco vengono compressi utilizzando il formato GDeflate e temporaneamente spostati nella memoria di sistema, quindi nella VRAM e decompressi lì dalla GPU. Questo formato GDeflate è uno standard di compressione GPU aperto di Nvidia, che è stato trasferito a Microsoft e al Kronos Group, ed è il formato che mi aspetto di vedere utilizzato nei giochi con Direct Storage 1.2 che utilizzano DirectX su PC – con supporto per GPU di Nvidia, AMD e Intel.

Questa spiegazione funziona meglio in video, ma l’idea principale di RTX IO è che stiamo riducendo il carico sulla CPU decomprimendo i dati direttamente sulla GPU e velocizzando i tempi di caricamento leggendo i dati in parallelo dall’SSD.

Al contrario, Portal: Prelude RTX utilizza l’API grafica Vulkan, che non ha chiamate standard indipendenti dal produttore per la decompressione della GPU; per quanto ne so, al momento ci sono solo le estensioni proposte da Nvidia. Queste estensioni di Nvidia per la decompressione della GPU potrebbero potenzialmente essere quelle che verranno adottate interamente dal gruppo Kronos per l’equivalente di Direct Storage di Vulkan. Nel frattempo, la rapida decompressione della GPU in Portal Prelude: RTX funzionerà solo su driver che supportano queste specifiche estensioni, cioè sulle schede grafiche Nvidia RTX.

Tuttavia, Portal Prelude RTX opera ancora secondo un paradigma di caricamento più tradizionale, il che significa che RTX IO non migliora i frame-rate. Dopotutto, RTX Remix non sta sostituendo il motore di gioco o alterando come i livelli vengono suddivisi e caricati; RTX Remix sta invece semplicemente cambiando il modo in cui viene eseguito il rendering e come vengono caricati gli asset per alimentare quel rendering. Questo è diverso da Ratchet and Clank: Rift Apart, che dovrebbe anche utilizzare la decompressione della GPU per velocizzare il gameplay. Pertanto, Portal Prelude RTX beneficia principalmente in termini di tempi di caricamento dedicati e tempi di caricamento delle texture visibili.

Per testare quanto effetto abbia qui la tecnologia, ho provato una versione del gioco in esecuzione con RTX IO disattivato e in esecuzione su un SSD SATA limitato a 500MB/s. Il gioco si carica abbastanza velocemente, ma le texture impiegano del tempo per raggiungere la loro massima qualità – senza la compressione GDeflate di RTXIO, il gioco su disco è completamente non compresso e ~60 percento più grande. Quindi la larghezza di banda è corrispondentemente sfruttata per spostare le texture nella VRAM, impiegando poco più di un secondo per caricare l’ultima texture. Con RTX IO attivo, quella stessa texture su un SSD SATA si carica in meno della metà del tempo.

Configurazione Caricamento al gioco Caricamento texture
12900K + SSD SATA 500MB/s + RTX IO disattivato 1,13s 2,36s
12900K + SSD SATA 500MB/s + RTX IO attivo 0,67s 1,16s
12900K + SSD NVMe 3,5GB/s + RTX IO disattivato 0,57s 1,45s
12900K + SSD NVMe 3,5GB/s + RTX IO attivo 0,53s 1,07s

Questa non è esattamente la differenza più grande nel mondo reale, dato che mezzo secondo passa in un attimo, ma dimezzare il tempo è comunque impressionante. Dopo aver effettuato una serie di test con diverse configurazioni, ho tratto due conclusioni interessanti. In primo luogo, un’unità SATA da 500MB/s con RTX IO abilitato batte un’unità NVMe da 3,5GB/s con RTX IO disabilitato – davvero eccezionale. In secondo luogo, le differenze hardware della CPU e della GPU non hanno avuto un impatto significativo sui tempi di caricamento, con il sistema RTX 2060 Super + Core i9 12900K che ha prestazioni molto simili alla stessa CPU con la scheda RTX 4090 di punta; anche un sistema con RTX 4070 e Ryzen 5 3600 era molto vicino in termini di tempi di caricamento.

Quindi Portal: Prelude RTX è un promettente primo tentativo di questa tecnologia su PC, ma allo stesso tempo è banale perché si applica a un gioco che utilizza un vecchio paradigma di caricamento in primo luogo. Con giochi che utilizzano lo streaming attivo e nessuno schermo di caricamento di alcun tipo, come Ratchet and Clank: Rift Apart e altri giochi futuri, è qui che questa tecnologia mostrerà al meglio la sua efficacia. Naturalmente, non vediamo l’ora di coprire presto quel titolo, con il gioco che arriverà su PC il 26 luglio – quindi rimanete sintonizzati.