Startseite / NVIDIA / NVIDIA GeForce RTX 4060 Ti: Leistung und Spezifikationen

NVIDIA GeForce RTX 4060 Ti

NVIDIA GeForce RTX 4060 Ti: Die ideale Wahl für Gamer und Profis?

April 2025

Seit der Veröffentlichung im Jahr 2023 bleibt die Grafikkarte NVIDIA GeForce RTX 4060 Ti bei Gamern und Enthusiasten beliebt. Wie relevant ist sie jedoch im Jahr 2025? Lassen Sie uns die Details genauer betrachten.

Architektur und Hauptmerkmale

Architektur Ada Lovelace: Leistung der neuen Generation

Die RTX 4060 Ti basiert auf der Architektur Ada Lovelace, die im 4-nm-Fertigungsprozess von TSMC gefertigt wird. Das sorgt für eine hohe Transistordichte (35,8 Milliarden) und Energieeffizienz.

RTX und DLSS 3.5: Eine Revolution in der Grafik

Die Karte unterstützt Raytracing der dritten Generation (RT-Kerne) und DLSS 3.5 mit Frame Generation-Technologie. DLSS 3.5 verbessert die Spielperformance mit KI-gestützter Unterstützung und steigert die FPS um 50-100% ohne Qualitätsverlust. Zum Beispiel erhöht das Aktivieren von DLSS 3.5 in Cyberpunk 2077: Phantom Liberty die FPS von 45 auf 90 Bilder bei 1440p.

FidelityFX Super Resolution: Kompatibilität mit AMD

Trotz der proprietären Technologien von NVIDIA unterstützt die RTX 4060 Ti auch FSR 3.0 von AMD, was nützlich für Spiele ist, die nicht auf DLSS optimiert sind.

Speicher: Geschwindigkeit und Volumen

GDDR6 vs GDDR6X: Was hat NVIDIA gewählt?

Das Modell verfügt über 8 GB oder 16 GB GDDR6 (je nach Version) mit einem 128-Bit-Bus. Die Bandbreite erreicht 504 GB/s (bei der 16-GB-Version 576 GB/s).

Einfluss auf die Leistung

Die 8-GB-Version ist ausreichend für 1080p und 1440p, jedoch können bei 4K oder bei Verwendung schwerer Texturen (zum Beispiel in Alan Wake 2) Rückstände auftreten. Die 16-GB-Variante löst dieses Problem, kostet jedoch mehr (449 $ gegenüber 399 $).

Leistung in Spielen: Zahlen und Realität

1080p: Maximale Einstellungen

- Call of Duty: Black Ops 6 — 140 FPS (ohne RT), 95 FPS mit RT + DLSS.

- The Elder Scrolls VI — 120 FPS (Ultra).

1440p: Ideales Gleichgewicht

- Starfield: Extended Edition — 75 FPS (Ultra, RT aktiviert).

- Horizon Forbidden West PC — 90 FPS (DLSS Qualität).

4K: Nur für die 16-GB-Version

- Cyberpunk 2077 — 45 FPS (RT Ultra, DLSS Balanced).

Raytracing: Schönheit verlangt Opfer

Die Aktivierung von RT senkt die FPS um 30-40%, jedoch kompensiert DLSS 3.5 die Verluste. In Portal: Revolution mit RT erreicht die Karte 80 FPS bei 1440p.

Professionelle Aufgaben: Nicht nur Spiele

Videobearbeitung und Rendering

Dank 34 CUDA-Kernen der 4. Generation und AV1-Unterstützung beschleunigt die RTX 4060 Ti das Rendering in DaVinci Resolve um 25% im Vergleich zur RTX 3060 Ti.

3D-Modellierung

In Blender (mit OptiX) benötigt das Rendering einer BMW-Szene 3,2 Minuten – ein Ergebnis, das nahe an der RTX 3080 liegt.

Wissenschaftliche Berechnungen

Die Unterstützung für CUDA und OpenCL macht die Karte nützlich für maschinelles Lernen (TensorFlow) und Simulationen. Für komplexe Aufgaben ist jedoch die RTX 4070 oder höher zu empfehlen.

Energieverbrauch und Wärmeentwicklung

TDP: Bescheidene Ansprüche

Die RTX 4060 Ti verbraucht 160 W (8 GB) und 180 W (16 GB). Das ist 20% effizienter als die vorherige Generation.

Kühlung: Stille oder Leistung?

- Referenzmodelle verwenden ein Dual-Fan-System und erreichen unter Last Temperaturen von bis zu 70 °C.

- Anpassungsversionen (ASUS TUF, MSI Gaming X) mit drei Lüftern halten die Temperatur unter 65 °C.

Gehäuseempfehlungen

- Mindestens 2 Erweiterungssteckplätze.

- Gehäuse mit guter Belüftung (zum Beispiel NZXT H5 Flow).

Vergleich mit Wettbewerbern

AMD Radeon RX 7700 XT: Budget-Alternative

- Preis: 369 $.

- Vorteile: 12 GB GDDR6, FSR 3.1.

- Nachteile: Schwächer im Raytracing (20-25% Rückstand in Avatar: Frontiers of Pandora).

Intel Arc A770: Risikobehaftete Wahl

- Preis: 299 $.

- Vorteile: 16 GB Speicher, Unterstützung für XeSS.

- Nachteile: Instabile Treiber, niedrige Leistung in älteren Spielen.

Fazit: Die RTX 4060 Ti übertrifft die Konkurrenz dank DLSS 3.5 und Optimierung für RT, hat jedoch einen Nachteil im Preis.

Praktische Tipps

Netzteil: Nicht sparen!

- Minimum 550 W (650 W für angepasste Modelle empfohlen).

- 80+ Bronze oder höher (zum Beispiel Corsair RM650x).

Kompatibilität

- PCIe 4.0 x8 (abwärtskompatibel mit PCIe 3.0).

- Unterstützung für Windows 11 und Linux (NVIDIA Treiber 555.x und neuer).

Treiber: Stabilität geht vor

- Vermeiden Sie Betaversionen: Verwenden Sie den Game Ready Driver für Spiele oder den Studio Driver für die Arbeit.

Vor- und Nachteile

Vorteile:

- Hohe Effizienz von DLSS 3.5.

- Niedriger Energieverbrauch.

- Ausgezeichnete Leistung bei 1440p.

Nachteile:

- 8 GB Speicher sind für 4K nicht ausreichend.

- Der Preis der 16-GB-Version ist nah an der RTX 4070.

Fazit: Für wen ist die RTX 4060 Ti geeignet?

Diese Grafikkarte ist die ideale Wahl für:

1. Gamer, die in 1440p mit hohen Einstellungen spielen.

2. Streamer, die Wert auf Balance zwischen Qualität und Leistung legen.

3. Profis, die mit Montage und 3D auf einem Budget-System arbeiten.

Wenn Sie bereit sind, 400-450 $ für die Technologie der Zukunft (DLSS 3.5, RT) zu bezahlen, wird die RTX 4060 Ti Ihre Erwartungen erfüllen. Für 4K oder anspruchsvolle Arbeitslasten sollten Sie jedoch ältere Modelle in Betracht ziehen.

Die Preise sind gültig im April 2025 für neue Geräte im Einzelhandel in den USA.

Basic

Markenname

NVIDIA

Plattform

Desktop

Erscheinungsdatum

May 2023

Modellname

GeForce RTX 4060 Ti

Generation

GeForce 40

Basis-Takt

2310MHz

Boost-Takt

2535MHz

Bus-Schnittstelle

PCIe 4.0 x8

Transistoren

Unknown

RT-Kerne

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

128

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

128

Foundry

TSMC

Prozessgröße

5 nm

Architektur

Ada Lovelace

Speicherspezifikationen

Speichergröße

8GB

Speichertyp

GDDR6

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

128bit

Speichertakt

2250MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

288.0 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

121.7 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

324.5 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

22.06 TFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

344.8 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

21.619 TFLOPS

Verschiedenes

SM-Anzahl

Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

4352

L1-Cache

128 KB (per SM)

L2-Cache

32MB

TDP (Thermal Design Power)

160W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

3.0

OpenGL

4.6

DirectX

12 Ultimate (12_2)

CUDA

8.9

Stromanschlüsse

1x 12-pin

Shader-Modell

6.7

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Empfohlene PSU (Stromversorgung)

450W

Benchmarks

Shadow of the Tomb Raider 1440p

Punktzahl

114 fps

Shadow of the Tomb Raider 1080p

Punktzahl

168 fps

FP32 (float)

Punktzahl

21.619 TFLOPS

3DMark Time Spy

Punktzahl

13503

Blender

Punktzahl

4223

OctaneBench

Punktzahl

418

Vulkan

Punktzahl

119880

OpenCL

Punktzahl

130656

Hashcat

Punktzahl

705069 H/s

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 1440p / fps

GeForce RTX 4090

292 +156.1%

GeForce RTX 3070 Ti

128 +12.3%

GeForce RTX 4060 Ti

114

Radeon RX 6700M

67 -41.2%

GeForce GTX 1070

49 -57%

Shadow of the Tomb Raider 1080p / fps

Radeon RX 7900 XTX

310 +84.5%

GeForce RTX 3080 12 GB

187 +11.3%

GeForce RTX 4060 Ti

168

Radeon RX 5600 XT

101 -39.9%

Radeon RX 5500 XT

72 -57.1%

FP32 (float) / TFLOPS

RTX 3500 Embedded Ada Generation

23.501 +8.7%

Instinct MI100

22.609 +4.6%

GeForce RTX 4060 Ti

21.619

Radeon RX 7700S

20.89 -3.4%

RTX A4000

19.553 -9.6%

3DMark Time Spy

GeForce RTX 4090

36233 +168.3%

Radeon RX 6800

16792 +24.4%

GeForce RTX 4060 Ti

13503

GeForce RTX 2070

9097 -32.6%

GeForce RTX 2070 SUPER Max Q

7333 -45.7%

Blender

GeForce RTX 5090

15026.3 +255.8%

GeForce RTX 4060 Ti

4223

GeForce RTX 2080 SUPER Max Q

2127 -49.6%

Radeon PRO W7600

1256 -70.3%

Radeon Pro 5700

619 -85.3%

OctaneBench

GeForce RTX 4090

1328 +217.7%

GeForce RTX 4060 Ti

418

Tesla P40

163 -61%

Quadro P3200 Max Q

87 -79.2%

GeForce GTX 960

47 -88.8%

Vulkan

GeForce RTX 5090 D

382809 +219.3%

GeForce RTX 3080

152166 +26.9%

GeForce RTX 4060 Ti

119880

Radeon RX 6600M

73814 -38.4%

Radeon Pro 5600M

46669 -61.1%

OpenCL

RTX 6000D

388405 +197.3%

GeForce RTX 5070

186397 +42.7%

GeForce RTX 4060 Ti

130656

Radeon RX 6700

89509 -31.5%

P102 100

65116 -50.2%

Hashcat / H/s

Arc A770

883336 +25.3%

GeForce RTX 3080

881523 +25%

GeForce RTX 4060 Ti

705069

GeForce RTX 2080 SUPER

649725 -7.8%

Radeon RX 6700 XT

617807 -12.4%

NVIDIA GeForce RTX 4060 Ti