W tym artykule postanowiłem rozbić na czynniki pierwsze, co DLSS 4.0 wprowadza w stosunku do swoich poprzedników (m.in. DLSS 3.5), jak działa jego nowa architektura sztuczna inteligencja oparta na transformatorach, co wnosi Reflex 2 i co to wszystko oznacza w praktyce. Oczywiście wszystko to z jedynej słusznej perspektywy, czyli z punktu widzenia gracza.

DLSS 4.0 – rewolucja, nie ewolucja
DLSS to skrót od Deep Learning Super Sampling, czyli zestawu technologii renderowania neuronowego firmy NVIDIA, który wykorzystuje sztuczną inteligencję do bardziej efektywnego renderowania gier. W poprzednich wersjach (DLSS 2.x i 3.x) oznaczało to renderowanie klatek w niższej rozdzielczości i używanie SI do ich skalowania w górę, zwiększając liczbę klatek i poprawiając jakość obrazu. Wersja DLSS 3.5 wydana pod koniec 2023 roku wprowadziła jednak pierwszą nowość, bo Ray Reconstruction, czyli technikę odszumiania efektów ray tracingu na bazie SI, ale to DLSS 4.0 stanowi bezapelacyjnie najważniejszą aktualizację od czasu DLSS 2.0 w 2020 roku. Dlaczego? Ano dlatego, że zbiera w sobie rewolucyjne wręcz ulepszenia, a w tym:
- Multi Frame Generation (MFG) – DLSS 4.0 może wygenerować do trzech dodatkowych klatek na każdą rzeczywistą renderowaną klatkę, podczas gdy Frame Generation z DLSS 3 dodawało tylko jedną sztuczną klatkę. Oznacza to wzrost liczby klatek nawet o osiem razy względem tradycyjnego renderowania. W teorii umożliwia to wreszcie granie w 4K przy 240 FPS z pełnym ray tracingiem na najlepszych modelach, a to po prostu ogromny skok płynności.
- Modele SI oparte na transformatorach – NVIDIA przebudowała algorytmy DLSS, wprowadzając nową architekturę opartą na transformatorach, co jest pierwszym użyciem transformatorów w czasie rzeczywistym w grafice gamingowej. W porównaniu do stosowanych wcześniej konwolucyjnych sieci neuronowych (CNN), model transformatora DLSS 4 ma dwa razy więcej parametrów i głębsze zrozumienie każdej sceny, co daje zauważalnie lepsze rezultaty.
- Lepsza jakość obrazu – dzięki inteligentniejszemu przetwarzaniu, DLSS 4.0 oferuje stabilniejszy framerate, znacznie mniej ghostingu i wyższą szczegółowość w ruchu niż DLSS 3.5. Drobne tekstury i krawędzie mają z kolei być wyraźniejsze, a szybko poruszające się obiekty mają zachowywać szczegóły bez smug i migotania, które często występowały w starszych wersjach.
- Ulepszony pipeline generowania klatek – NVIDIA nie tylko dodała więcej klatek, ale też udoskonaliła cały proces ich generowania. Dlatego też nowy model generatora klatek DLSS 4 ma być około 40% szybszy i zużywać o 30% mniej pamięci VRAM niż wersja z DLSS 3. Efekt? Wystarczy jedno wywołanie generatora na każdą rzeczywistą klatkę, aby wygenerować wiele pośrednich klatek, co z kolei przekłada się na mniejsze obciążenie komputera samym algorytmem generowania klatek.
- Szersze wsparcie i kompatybilność wsteczna – świetną informacją jest również to, że DLSS 4.0 nie jest zarezerwowane tylko dla nowych GPU. Główna funkcja w postaci Multi Frame Generation wymaga wprawdzie nowych kart GeForce RTX z serii 5000, ale starsze karty RTX również zyskują. Wszystkie GPU z serii RTX 20, 30 i 40 mogą bowiem używać nowego Super Resolution, Ray Reconstruction i ulepszeń DLAA opartych na transformatorach.
Architektura transformatorowa DLSS 4.0, czyli inteligentniejsze skalowanie i rekonstrukcja ruchu
Jedną z głównych cech wyróżniających DLSS 4.0 jest jego nowy model SI oparty na transformatorach – DLSS Transformers. To ta sama klasa modeli SI, które napędzają przetwarzanie języka naturalnego (jak ChatGPT), ale NVIDIA zaadaptowała je do przetwarzania obrazu w czasie rzeczywistym. To akurat nie byle zmiana, a ogromne ulepszenie, ponieważ transformatory doskonale rozumieją kontekst i zależności w danych, czyli w tym przypadku piksele w jednej konkretnej i kolejnych klatkach.
Efekt? Nowy model wykorzystuje architekturę Vision Transformer, która stosuje mechanizm self-attention na całej klatce (a nawet między kolejnymi klatkami). W praktyce nie analizuje on tylko małego bloku pikseli w oderwaniu od reszty, a zamiast tego spogląda na cały obraz oraz poprzednie klatki, aby jak najlepiej odtworzyć wszelkie szczegóły. To globalne podejście pozwala sztucznej inteligencji np. rozpoznać, że krawędź obiektu w jednym miejscu powinna zgadzać się z jego ruchem w następnej klatce albo że wzór na teksturze (np. siatka ogrodzenia) powinien pozostać spójny, a nie migotać.




W praktyce oznacza to wyraźnie ostrzejszy i bardziej stabilny obraz. Już wczesne przykłady z gry Alan Wake 2 pokazały korzyści z tego podejścia. Drobne detale jak ogrodzenie z siatki pozostają ostre i stabilne, zamiast migotać, poruszające się łopatki wentylatora nie zostawiają smug, a cienkie obiekty jak linie energetyczne nie błyskają w zmiennym oświetleniu. Innymi słowy, transformator eliminuje wiele artefaktów ruchu i problemów z aliasingiem, z którymi nawet wcześniejsze wersje DLSS czy inne upscalery sobie nie radziły.
Multi Frame Generation, czyli wreszcie przestaniesz narzekać na płynność w grach
Drugim dużym osiągnięciem DLSS 4.0 jest Multi Frame Generation (MFG), czyli ewolucja funkcji Frame Generation z DLSS 3. Zamiast dodawać jedną sztuczną klatkę na każdą rzeczywistą klatkę, DLSS 4.0 idzie o krok dalej, bo może wstawić w cały potok wyświetlania aż trzy. W praktyce więc GPU renderuje jedną “prawdziwą” klatkę, a system DLSS generuje trzy klatki dodatkowe, a więc międzyklatkowe, co z kolei oznacza, że dla każdej symulowanej klatki gry wyświetlane są cztery. Pozostaje więc pytanie – jak to w ogóle możliwe bez zwiększania opóźnień?
Aby nadać takiemu podejściu sens, NVIDIA musiała przeprojektować cały pipeline generowania klatek. Wcześniej wygenerowanie każdej sztucznej klatki wymagało osobnego uruchomienia obliczeń optycznego przepływu oraz sieci neuronowej, co przy generowaniu wielu klatek było zbyt kosztowne. Z DLSS 4 rozwiązano to, czyniąc SI znacznie bardziej wydajną na klatkę. Zaktualizowany model generatora klatek (nadal oparty na sieci neuronowej, choć niekoniecznie transformatorze) działa raz i generuje wiele klatek pośrednich – jest 40% szybszy i zużywa 30% mniej pamięci niż wcześniej. Więc pożera mniej wydajności komponentów dla całej magii DLSS. W praktyce Multi Frame Generation gwarantuje więc ogromny wzrost wydajności, a to zwłaszcza na high-endowych kartach graficznych.
Warto podkreślić, że NVIDIA ściśle kontroluje opóźnienia wejścia w funkcji generowania klatek. Tradycyjnie dodawanie sztucznych klatek może zwiększać input lag, ponieważ te klatki nie odzwierciedlają nowych ruchów gracza, a tym samym przekłada się to na mniejszą responsywność w grach. Właśnie dlatego technologia NVIDIA Reflex była zawsze powiązana z DLSS 3, by utrzymać symulację gry w synchronizacji. Teraz, z DLSS 4, mimo generowania jeszcze większej liczby klatek, NVIDIA twierdzi, że opóźnienie zostało nawet zmniejszone o połowę. Jak? Częściowo dzięki usprawnieniom w technologii Reflex (o którym za chwilę), a częściowo dzięki lepszej wydajności samego DLSS. GPU nie jest przeciążone, więc może szybciej przetwarzać nowe dane wejściowe.

Reflex 2: NVIDIA ścina input lag jak nigdy wcześniej
Wysoka liczba klatek jest sama w sobie świetna, ale dla najlepszych wrażeń z gry musi iść w parze z niskimi opóźnieniami wejścia – szczególnie dla graczy grających w dynamiczne gry. Albo to, albo granie będzie przypominać poruszanie się w gęstym mule. Tu właśnie wkracza NVIDIA Reflex 2, czyli następca techniki Reflex wprowadzonej w 2020 roku. To rozwiązanie NVIDIA zmniejszające opóźnienia systemowe poprzez optymalizację komunikacji między CPU a GPU. Działa tak, że utrzymuje GPU zsynchronizowane z CPU i eliminuje wąskie gardła w kolejce renderowania, co oznacza, że kliknięcie myszką szybciej trafia na ekran. Wiele gier obsługuje już oczywiście Reflex 1.0, często zmniejszając opóźnienia nawet o 30–50%, ale Reflex 2 idzie znacznie dalej, wprowadzając nową technikę zwaną Frame Warp.



Na targach CES 2025 NVIDIA ogłosiła, że Reflex 2 może zmniejszyć opóźnienie systemowe PC nawet o 75%. Jak to możliwe? Dzięki Frame Warp system nie tylko renderuje szybciej. W praktyce reprojektuje klatki w ostatniej milisekundzie na podstawie najnowszych danych wejściowych. Innymi słowy, nawet po tym, jak GPU wyrenderuje klatkę, Reflex 2 może jeszcze dostosować jej pozycję kamery lub celowania tuż przed wyświetleniem, by odzwierciedlać ostatnie ruchy gracza. Działa to tak, że gdy GPU renderuje klatkę X, CPU równocześnie przewiduje, gdzie znajdzie się kamera lub celownik gracza w klatce X+1 na podstawie najnowszego ruchu myszy, lub kontrolera. Gdy GPU skończy renderować klatkę X (na podstawie nieco starszych danych), system deformuje tę klatkę, dopasowując ją do nowej pozycji kamery przewidzianej dla klatki X+1. Ta zniekształcona klatka jest następnie wysyłana na ekran.
Co ciekawe, tego typu podejście przypomina techniki stosowane w VR, jak np. asynchroniczna reprojekcja. Działa to tak, że jeśli ostatnia klatka w hełmie VR jest już trochę nieaktualna, system ją zniekształca, by zmniejszyć postrzegalne opóźnienie. Tutaj ta koncepcja przeniesiona jest na myszkę i gry PC. Efekt? Ogromna różnica, bo pewny spadek opóźnienia z kilkudziesięciu milisekund do kilkunastu… a nawet jeszcze niżej w przypadku mniej wymagających gier. Niestety Reflex 2 jest aktualnie dostępny tylko w nielicznych grach pokroju Valoranta czy The Finals i wymaga do działania karty z serii GeForce RTX 5000.
Wsparcie w grach i adopcja przez twórców, czyli DLSS 4.0 jako niezakazany owoc
Nawet najlepsza technologia nie ma znaczenia, jeśli nie jest używana — ale na szczęście NVIDIA zadbała, by DLSS 4.0 miało szerokie wsparcie już od startu. Przy premierze kart graficznych z serii RTX 50 firma ogłosiła, że 75 gier i aplikacji będzie wspierać Multi Frame Generation (MFG) w dniu premiery, a z miesiąca na miesiąc ta liczba ciągle rośnie. Już dziś DLSS 4.0 możemy sprawdzić w Cyberpunku 2077, Alan Wake II, Diablo IV, God of War Ragnarok, czy Star Wars Outlaws. Co ważne — nie tylko zupełnie nowe gry mogą korzystać z DLSS 4, bo dzięki naciskowi NVIDIA na kompatybilność wsteczną, twórcy gier, które już doczekały się DLSS 2 lub 3, mogą łatwo zaktualizować swoje gry. Często wystarczy jedynie zaktualizować wtyczkę DLSS, by aktywować nowy model transformatorowy oraz Multi Frame Generation. Bardziej leniwe studia i deweloperzy nie są też przeszkodą, bo NVIDIA oferuje alternatywę w postaci funkcji override w DLSS SDK. Dzięki niej użytkownicy mogą ręcznie wymusić ustawienia DLSS w obsługiwanych grach nawet bez oficjalnej aktualizacji samej gry.

Dziś pewne jest więc, że rendering wspomagany sztuczną inteligencją stał się jednym z filarów nowoczesnej produkcji gier. Technologia ta rozwija się błyskawicznie, ale NVIDIA dba o to, aby kolejne wersje nie tylko były przynajmniej częściowo kompatybilne z tymi starszymi, ale też były proste w implementacji. To kluczowe, bo na cóż byłaby nam super hiper nowa technologia, gdyby jej wsparcie było wręcz marginalne? Tylko czas jednak pokaże, czy DLSS 4.0 i tym bardziej Reflex 2 zyskają powszechne wsparcie w grach, a na dodatek czy konkurencja w postaci firmy Intel oraz AMD zaoferuje coś równie zaawansowanego i skutecznego.