Skocz do zawartości

Ada Lovelace - wątek o kartach RTX 4000


Recommended Posts

23 godziny temu, Adames napisał:

Dla tych co się zastanawiają nad DLSS 3.0 i tym, że tylko RTX 40xx może to odpalić:

https://developer.nvidia.com/blog/opencv-optical-flow-algorithms-with-nvidia-turing-gpus/

 

Przypominam, że sam "Optical Flow Accelerator" jest z nami już od RTX 20xx :), podczas kiedy większość źródeł sugeruje, że to nowy element.

Rozumiem, że nowy akcelerator jest szybszy, może dokładniejszy, natomiast zupełnie nie rozumiem, dlaczego potrzeba tego nowego akceleratora do działania DLSS 3.0. Wersja 2.0 działa szybciej z Amperami niż z Turingami, ale to nie wyklucza używania DLSS 2.0 na Turingach. Obecnie brakuje jeszcze info dot. co dokładnie zmieniło się w API / HW, że te nowe akceleratory są takie zajefajne.

 

image.thumb.png.e0ab997bbfd20a91b61ca17eed7e4af7.png

 

A tu jeszcze tabelka z dokumentacji NVidii, dot. wydajności :

image.png.9c995b68998998a6bdbb8802f8899368.png

Taki mały pstryczek:

image.thumb.png.61e07a5801772f332ff7dc5aed4d978f.png

Więcej można poczytać na: https://docs.nvidia.com/video-technologies/optical-flow-sdk/nvofa-application-note/

 

 

To takie moje luźne rozważania, czy DLSS 3.0 ma szansę pojawić się na RTX 20/30 

mówiłem że to ściema i te pajace tak pierdzielą żeby sprzedaż rtx 40 im szła ,to samo było z rebarem dla starych inteli .Także tylko czekać aż ktoś to obejdzie i będzie dlss 3 na mojej rtx 30 i wyjebundo w te nowe karty

Link to post
Share on other sites

W Częstochowie bez zmian. 

 

Cytat

Ile się czeka na realizację zamówienia z x-kom? Dzwoniłem i się dowiedziałem, że karty które są wrzucane na sklep, to dopiero są w dostawie. Jest ich ograniczona ilość i przypisują. 

Nie byli w stanie mi powiedzieć czy zostałem przypisany już do karty, ktore beda w najblizszej dostawie, ani brak zblizonego terminu realizacji. 

 

Kontynuacja:

Cytat

Zadzwonili z x-komu:
Mam czekać 20 dni roboczych na kartę, więc powtórka z rozrywki z 3xxx. Na razie czekam, bo nie wiadomo jak się sytuacja na świecie zmieni. 

Kabaret
 

Edytowane przez Artok
zbędne odstępy w cytatach
Link to post
Share on other sites
18 godzin temu, Joint21 napisał:

mówiłem że to ściema i te pajace tak pierdzielą żeby sprzedaż rtx 40 im szła ,to samo było z rebarem dla starych inteli .Także tylko czekać aż ktoś to obejdzie i będzie dlss 3 na mojej rtx 30 i wyjebundo w te nowe karty

Będzie DLSS 3.0 dla RTX 20/30 tak samo, jak Ray Tracing dla GTXów odblokowali :) Czyli raczej ciekawostka niż realna funkcja. 

Godzinę temu, Artok napisał:

Zadzwonili z x-komu:
Mam czekać 20 dni roboczych na kartę, więc powtórka z rozrywki z 3xxx. Na razie czekam, bo nie wiadomo jak się sytuacja na świecie zmieni. 

Kabaret

Typowy X-Kom -.-’

A czy ktoś się już w polskiej sieci chwalił, że ma i testuje RTX 4080? 

  • Popieram 1
Link to post
Share on other sites
25 minut temu, Rebelmind napisał:

Ta, 4080/12. Przyszła paczka z jakąś dziwą naklejka; patrzę a pod spodem 3080 Ti. I wydajność się nawet zgadza :pajac:

 

RTX 3080 Ti to Ty nie obrażaj porównując go do plugastwa jakiego się wstydzi sama NVIDIA :) Ja z kolei nieco żałuje, że ta karta się nie pojawi bo chciałem się nad nią pastwić, znęcać, odradzać. Gdyż nic ale to nic nie wskazywało na to by była jakkolwiek sensownym produktem który choć minimalnie zasługiwał na x80 w nazwie.

Edytowane przez EH_Gosu
Link to post
Share on other sites

Jestem niemalże pewien @EH_Gosuże to gUano by schodziło za 5500+ PLN jak świeże bułeczki. Ludzie się przyzwyczaili, że 3080 był po 6000 i po tyle schodził - a jeszcze jakby Nv zagrała tą samą kartą co przy dystrybucji 4090 (~limited availability)... 

 

Link to post
Share on other sites

Z 3 dni temu na kanale DF podsumowali temat premiery NVIDII i poruszyli tam ciekawą kwestię... Co gdyby DLSS 3.0 FG generowało nie jedną, a dwie klatki pośrednie :evil: A z tego co zrozumiałem, to inżynierowie NVIDI już teraz pozytywnie się o tej kwestii wyrażają... To oznaczałoby nawet 3x wyższą płynność animacji :menda:

Link to post
Share on other sites

Opóźnienia będą takie same niezależnie od ilości generowanych klatek (nadal będą one wciskane między te same dwie klatki. Oczywiście - nie zwiększamy tu responsywnosci gry, tylko płynność jej animacji. 

 

Grając teraz w Plague Tale Requiem (nie wiem czy czytaliście nasz test kart i procesrów: https://www.benchmark.pl/testy_i_recenzje/a-plague-tale-requiem-test-kart-i-procesorow.html) na 4090 z aktywnym DLAA i DLSS FG (bez Super Resolution) w 5120x1440p realnie widzę same zalety obecności tej technologii. Dla RTX 4090 nie jest ona jeszcze kluczowa, ale taki RTX 4070 stanowczo dużo na niej zyska w tego typu grach.  

Link to post
Share on other sites
2 minuty temu, wojciech spychała napisał:

Opóźnienia będą takie same niezależnie


W ostatniej klatce generowanej normalnie wykonujesz nagły manewr o 180. Dlss3 dalej myśli że działasz po staremu i potrzebuje 3 klatek aby to skorygować. No ja tam widzę kolosalne opóźnienia.  

Link to post
Share on other sites

Jakby dali 2 klatki zamiast jednej, wtedy stosunek szamba do pereł by się zmienił z 1-1 na 2-1, więc ta "jakość" generowanych klatek byłaby bardziej odczuwalna. Już teraz jak większość widzi, jest problem z miganiem różnych artefaktów. 

 

Mnie dziwi co innego, dlaczego zastosowano "generowanie" klatek pośrednich, zamiast predykcji. Mając 2 (lub więcej) historyczne klatki, wektory ruchu, optical flow, itd, można by próbować robić predykcję obrazu i czasu generowania kolejnej klatki. W ten sposób wpływ na input lag byłby marginalny, bo rzeczywista nowa klatka pojawiała by się o czasie kiedy została wyrenderowana, a nie po wyznaczeniu klatek pośrednich. Czyli w takim układzie zamiast czekać na "nową klatkę" i obliczać obraz pośredni, a potem wyświetlać seryjnie, można by wyświetlić "predyktowaną" klatkę w połowie czasu potrzebnego do wyznaczenia kolejnej klatki.  Podejrzewam, że NVidia dawno temu na to wpadła, tylko jakość predykcji była tak zaskakująco dobra, że zachowali to na DLFF4.0 i premierę RTX 50xx, które otrzymają TensorCores 4. 

Edytowane przez Adames
Link to post
Share on other sites
17 minut temu, MiK napisał:


W ostatniej klatce generowanej normalnie wykonujesz nagły manewr o 180. Dlss3 dalej myśli że działasz po staremu i potrzebuje 3 klatek aby to skorygować. No ja tam widzę kolosalne opóźnienia.  

To tak nie działa. DLSS analizuje dwie klatki które gra renderuje czy z niego korzystamy czy też nie. Na podstawie tej analizy wstawia te wygenerowane klatki pomiędzy te utworzone przez silnik gry. Jeżeli gra jest w stanie zapewnić 60 FPS to pomiędzy klatkami mamy 16,6 ms o które DLSS opóźnia obraz. W takim przypadku proces wygląda tak:
czas = 0 ms => silnik renderuje klatkę nr 1 i ale jej nie wyświetla
czas = 0-16,6 ms => silnik renderuję klatkę nr 2 i wyświetlona zostaje klatka nr 1
czas = 25 ms => karta wyświetla klatkę nr  1,5 wygenerowaną przez AI, a silnik gry już pracuje nad klatką nr 3
czas = 33,2 ms => karta wyświetla klatkę nr 2 a silnik zaczyna pracę nad klatką nr 4
czas = 49,8 ms => karta wyświetla klatkę nr 2,5 wygenerowaną przez AI
czas = 66,4 ms => karta wyświetla klatkę nr 3, a silnik zaczyna prace nad klatką nr 5.

Na same opóźnienia jeszcze wpływa działanie NV Reflex i ogólnie zmienna płynność gry, ale bardziej chodziło mi tu o pokazanie schematu działania tej funkcji. 


Teraz, gdyby AI miało generować nie jedną a dwie (trzy? :D) klatki to one nadal były by wyświetlane pomiędzy klatkami o pełnym numerze powyżej. Tylko że pomiędzy taką klatką nr 1 i nr 2 byłyby to klatki nr 1,33 i  nr 1,67. (albo nr 1,25, nr 1,5, nr 1,75 dla DLSS FG generującego 3 klatki).

 

Efekt będzie taki że dostajesz więcej pośrednich informacji z tego obrotu 180°, choć niestety nie były by to informacje istotne z punktu widzenia kompetywnej rozgrywki - przykładowo jeżeli miał gdzieś tam mignąć łeb przeciwnika to AI tego nie wygeneruje... Ale jak już pisałem przy recenzji samej karty - DLSS 3.0 FG to nie jest funkcja dla e-sportu, tylko do gier AAA. W grach takich jak Plague Tale najwięcej daje wizualne zwiększenie płynności. I to potwierdzam empirycznymi testami - gra się po prostu przyjemniej, nawet jeżeli responsywność gry zostaje taka sama.  

Link to post
Share on other sites
2 minuty temu, Adames napisał:

Podejrzewam, że NVidia dawno temu na to wpadła, tylko jakość predykcji była tak zaskakująco dobra, że zachowali to na DLFF4.0 i premierę RTX 50xx, które otrzymają TensorCores 4.

I tutaj ja również dopatruje się takowej opcji. I cyk: nowy fjuczer RTX 5000 only, rtx 5090 z 2000$ MSRP + USD po 5.25 PLN... 

Link to post
Share on other sites
6 minut temu, Adames napisał:

Mnie dziwi co innego, dlaczego zastosowano "generowanie" klatek pośrednich, zamiast predykcji. Mając 2 (lub więcej) historyczne klatki, wektory ruchu, optical flow, itd, można by próbować robić predykcję obrazu i czasu generowania kolejnej klatki. W ten sposób wpływ na input lag byłby marginalny, bo rzeczywista nowa klatka pojawiała by się o czasie kiedy została wyrenderowana, a nie po wyznaczeniu klatek pośrednich.

To by sie wyłożyło na tzw. frame pacingu - klatki byłyby generowane bardzo nierównomiernie, co pogarsza odbiór płynności animacji. A tak mamy zawsze "w połowie" drogi między dwoma klatkami :)

A ilość klatek pośrednich, jak na ironię, podniosłaby jakość i zmniejszyłaby artefakty, bo przejścia byłyby płynniejsze. 

Link to post
Share on other sites
6 minut temu, wojciech spychała napisał:

To by sie wyłożyło na tzw. frame pacingu - klatki byłyby generowane bardzo nierównomiernie, co pogarsza odbiór płynności animacji. A tak mamy zawsze "w połowie" drogi między dwoma klatkami :)

Jeżeli silnik gry jest skopany i jedną klatkę liczy 16 [ms] a drugą 60[ms], to żadna technika nie pomoże. Sytuacja normalna, czyli kiedy klatki są generowane w miarę równo, czyli niewielki rozstrzał pomiędzy klatkami, na poziomie 3-5[ms], to wstawienie "predyktowanej" klatki nie spowoduje widocznej czkawki.

 

Obecna metoda sprawia natomiast, że mając 120 FPS, gra działa z lagiem jak dla 40 FPS (podsumowanie Hardware Unboxed)

image.thumb.png.0d09f77760afec303a3a0d608845d854.png

Link to post
Share on other sites

Widzę że nawet wyszły im lepsze wyniki niż mi :)  Ale to dokładnie to o czym piszę - responsywność gry nie wzrasta (zostaje dokładnie taka sama), ale mamy znacznie płynniejszą animację. Lepiej mieć niż nie mieć taką opcję, a do tego zauważ, że opóźnienia masz 40% mniejsze (przy tych 112 FPS) niż na karcie, która w ogóle nie wspiera NVIDIA Reflex (i zapewnia 42 FPS).  

Dodam jednak, że z mojej obserwacji wynika, że DLSS 3.0 FG faktycznie daje dziwne wrażenia z gry, gdy bazowy FPS (przed aktywowanie tej funkcji) jest poniżej 45 FPS, zatem gdy finalny FPS jest poniżej 80-90 (z aktywnym FG).  Zresztą wydaje mi się, że chyba podobną opinię wygłaszał ktoś z DF. Dla RTX 4090 trudno obecnie o grę która tak kartę zdławi (tzn. w 4K nie ma żadnej :P), no ale należy to mieć na uwadze na przyszłość. 

Link to post
Share on other sites

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Odpowiedz w tym wątku...

×   Wklejono zawartość z formatowaniem.   Usuń formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...