NVIDIA GeForce RTX 3090 Ti

NVIDIA GeForce RTX 3090 Ti

NVIDIA GeForce RTX 3090 Ti im Jahr 2025: Alles, was Sie vor dem Kauf wissen müssen

Trotz der Veröffentlichung neuer Grafikkarten-Generationen bleibt die NVIDIA GeForce RTX 3090 Ti einer der leistungsstärksten Grafikbeschleuniger für Spiele und professionelle Anwendungen. Im Jahr 2025 ist der Preis auf 1200–1500 $ für neue Modelle gesenkt worden, was sie attraktiv für diejenigen macht, die ein Gleichgewicht zwischen Leistung und Preis suchen. Lassen Sie uns herausfinden, ob sie heute Ihre Aufmerksamkeit verdient.


1. Architektur und Schlüsselfunktionen

Die RTX 3090 Ti basiert auf der Ampere-Architektur, die 2020 veröffentlicht wurde. Trotz ihres Alters zeigt diese Architektur immer noch beeindruckende Effizienz dank:

- 8-nm Fertigungstechnologie von Samsung (nicht die modernste im Jahr 2025, aber optimiert).

- 10752 CUDA-Kernen – 10% mehr als bei der RTX 3090.

- Dritter Generation RT-Kerne für Raytracing und vierte Generation Tensor-Kerne für KI-Berechnungen.

Einzigartige Technologien:

- DLSS 3.0 (Deep Learning Super Sampling) – Künstliche Intelligenz erhöht die Auflösung des Bildes mit minimalen Qualitätsverlusten und steigert die FPS um 50–100% in unterstützten Spielen.

- Ray Tracing (RTX) – realistische Beleuchtung, Schatten und Reflexionen. Im Jahr 2025 unterstützen mehr als 90% der AAA-Spiele diese Technologie.

- NVIDIA Reflex – reduziert Verzögerungen in E-Sport-Projekten.


2. Speicher: Geschwindigkeit und Volumen

24 GB GDDR6X – das Hauptargument für die RTX 3090 Ti.

- 384-Bit-Speicherbus und eine Bandbreite von 1 TB/s sorgen für blitzschnelle Texturladung.

- Für 4K-Spiele reicht dieses Volumen selbst für Projekte mit hochauflösenden Mods (zum Beispiel Cyberpunk 2077 mit 8K-Texturen).

- In professionellen Anwendungen (Rendering, neuronale Netze) ermöglichen 24 GB das Arbeiten mit großen Modellen, ohne dass der Speicher überlastet wird.


3. Leistung in Spielen

Im Jahr 2025 bewältigt die RTX 3090 Ti immer noch die meisten Spiele bei Ultra-Einstellungen:

- 4K (3840×2160):

- Cyberpunk 2077 (mit RTX Ultra + DLSS 3.0): 65–75 FPS.

- Alan Wake 2 (mit Raytracing): 55–60 FPS.

- Call of Duty: Modern Warfare V (ohne RTX): 110–120 FPS.

- 1440p (2560×1440):

- Durchschnittliche FPS in den neuesten Projekten – 120–144 FPS, was perfekt für Monitore mit hoher Bildwiederholrate ist.

- 1080p:

- Übermäßige Leistung, aber relevant für Streamer, die NVENC-Codierung verwenden.

Raytracing reduziert die FPS um 30–40%, aber DLSS 3.0 kompensiert die Verluste. Zum Beispiel liefert die Aktivierung von RTX + DLSS in Metro Exodus Enhanced Edition stabile 60 FPS in 4K.


4. Professionelle Anwendungen

Die RTX 3090 Ti ist nicht nur für Gamer:

- 3D-Rendering (Blender, Maya): CUDA-Kerne beschleunigen das Rendering um 2–3 Mal im Vergleich zur RTX 3080.

- Videobearbeitung (DaVinci Resolve, Premiere Pro): 24 GB Speicher ermöglichen die Bearbeitung von 8K-Videos ohne Ruckler.

- Wissenschaftliche Berechnungen (PyTorch, TensorFlow): Unterstützung für CUDA und Optimierung für KI-Algorithmen.

Für spezialisierte Workstations sind jedoch Karten der NVIDIA RTX A6000 Serie aufgrund der zertifizierten Treiber besser geeignet.


5. Energieverbrauch und Wärmeentwicklung

- TDP 450 W – Dies erfordert ein durchdachtes Kühlsystem.

- Empfehlungen:

- Gehäuse mit 6–7 Lüftern oder Wasserkühlung.

- Mindestnetzteil: 850 W (besser 1000 W mit 80+ Platinum Zertifikat).

- Betriebstemperatur unter Last: 75–80°C mit Standardkühler, 65–70°C mit Flüssigkeitskühlung.

Vermeiden Sie kompakte Gehäuse – die RTX 3090 Ti nimmt 3 PCIe-Slots in Anspruch und hat eine Länge von 336 mm.


6. Vergleich mit Konkurrenten

Im Jahr 2025 sind die Hauptkonkurrenten die AMD Radeon RX 7900 XTX und NVIDIA RTX 4080:

- RX 7900 XTX ($1000–1300):

- Besser in Vulkan-Spielen (Red Dead Redemption 2), aber schwächer im Raytracing.

- 24 GB GDDR6 gegenüber GDDR6X – geringere Bandbreite.

- RTX 4080 ($1100–1400):

- Ada Lovelace-Architektur, höhere Energieeffizienz, aber nur 16 GB Speicher.

Fazit: Die RTX 3090 Ti übertrifft die Konkurrenz in Anwendungen, die großen Speicher benötigen.


7. Praktische Tipps

- Netzteil: Corsair HX1000, Be Quiet! Dark Power 12 – mindestens 850 W.

- Kompatibilität:

- PCIe 4.0 x16 (abwärtskompatibel mit 3.0).

- Empfohlener Prozessor – Intel Core i7/i9 der 12. Generation oder AMD Ryzen 7/9 5000/7000.

- Treiber: Verwenden Sie den Studio Driver für professionelle Software und den Game Ready Driver für Spiele.


8. Vor- und Nachteile

Vorteile:

- 24 GB GDDR6X – ein Vorrat für die kommenden Jahre.

- Beste Leistung in der Klasse in 4K.

- Unterstützung für DLSS 3.0 und RTX.

Nachteile:

- Hoher Energieverbrauch.

- Abmessungen und Gewicht (die Grafikkarte benötigt eine Stütze).

- Geräuschentwicklung unter Last (bei Modellen mit Referenzkühlung).


9. Fazit: Für wen eignet sich die RTX 3090 Ti?

Diese Grafikkarte ist die Wahl für:

- Gamer, die in 4K mit maximalen Einstellungen spielen möchten.

- Profis, die mit 3D-Grafik, Video und KI arbeiten.

- Enthusiasten, die nicht bereit sind, für die neuesten Modelle (RTX 4090 ab 1800 $) zu überzahlen.

Wenn Sie eine vielseitige und bewährte Karte mit riesigem Speicherbedarf benötigen – die RTX 3090 Ti ist im Jahr 2025 immer noch relevant. Für diejenigen, die maximale Energieeffizienz anstreben, lohnt es sich jedoch, die RTX 4080 oder AMD RX 7900 XTX in Betracht zu ziehen.

Basic

Markenname
NVIDIA
Plattform
Desktop
Erscheinungsdatum
January 2022
Modellname
GeForce RTX 3090 Ti
Generation
GeForce 30
Basis-Takt
1560MHz
Boost-Takt
1860MHz
Bus-Schnittstelle
PCIe 4.0 x16
Transistoren
28,300 million
RT-Kerne
84
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
336
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
336
Foundry
Samsung
Prozessgröße
8 nm
Architektur
Ampere

Speicherspezifikationen

Speichergröße
24GB
Speichertyp
GDDR6X
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
384bit
Speichertakt
1313MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
1008 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
208.3 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
625.0 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
40.00 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
625.0 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
39.2 TFLOPS

Verschiedenes

SM-Anzahl
?
Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.
84
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
10752
L1-Cache
128 KB (per SM)
L2-Cache
6MB
TDP (Thermal Design Power)
450W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
8.6
Stromanschlüsse
1x 16-pin
Shader-Modell
6.6
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
112
Empfohlene PSU (Stromversorgung)
850W

Benchmarks

Shadow of the Tomb Raider 2160p
Punktzahl
103 fps
Shadow of the Tomb Raider 1440p
Punktzahl
170 fps
Shadow of the Tomb Raider 1080p
Punktzahl
214 fps
Cyberpunk 2077 2160p
Punktzahl
69 fps
Cyberpunk 2077 1440p
Punktzahl
85 fps
Cyberpunk 2077 1080p
Punktzahl
128 fps
Battlefield 5 2160p
Punktzahl
131 fps
Battlefield 5 1440p
Punktzahl
197 fps
Battlefield 5 1080p
Punktzahl
204 fps
GTA 5 2160p
Punktzahl
146 fps
GTA 5 1440p
Punktzahl
191 fps
GTA 5 1080p
Punktzahl
231 fps
FP32 (float)
Punktzahl
39.2 TFLOPS
3DMark Time Spy
Punktzahl
21388
Blender
Punktzahl
6412
OctaneBench
Punktzahl
664
Vulkan
Punktzahl
177997
OpenCL
Punktzahl
208546

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 2160p / fps
193 +87.4%
45 -56.3%
34 -67%
24 -76.7%
Shadow of the Tomb Raider 1440p / fps
292 +71.8%
67 -60.6%
49 -71.2%
Shadow of the Tomb Raider 1080p / fps
310 +44.9%
101 -52.8%
72 -66.4%
Cyberpunk 2077 2160p / fps
90 +30.4%
24 -65.2%
Cyberpunk 2077 1440p / fps
185 +117.6%
35 -58.8%
Cyberpunk 2077 1080p / fps
203 +58.6%
48 -62.5%
Battlefield 5 2160p / fps
194 +48.1%
56 -57.3%
Battlefield 5 1440p / fps
Battlefield 5 1080p / fps
213 +4.4%
169 -17.2%
139 -31.9%
122 -40.2%
GTA 5 2160p / fps
174 +19.2%
GTA 5 1440p / fps
116 -39.3%
73 -61.8%
GTA 5 1080p / fps
176 -23.8%
156 -32.5%
141 -39%
86 -62.8%
FP32 (float) / TFLOPS
46.913 +19.7%
44.257 +12.9%
34.868 -11.1%
31.615 -19.3%
3DMark Time Spy
36233 +69.4%
9097 -57.5%
Blender
15026.3 +134.3%
2020.49 -68.5%
1064 -83.4%
OctaneBench
1328 +100%
163 -75.5%
89 -86.6%
47 -92.9%
Vulkan
382809 +115.1%
91662 -48.5%
61331 -65.5%
34688 -80.5%
OpenCL
385013 +84.6%
109617 -47.4%
74179 -64.4%