Startseite / NVIDIA / NVIDIA GeForce RTX 4060 AD106: Leistung und Spezifikationen

NVIDIA GeForce RTX 4060 AD106

NVIDIA GeForce RTX 4060 AD106: Vollständige Analyse der Grafikkarte für Gamer und Profis

April 2025

Einführung

Die NVIDIA GeForce RTX 4060 AD106 ist eine Grafikkarte, die die Tradition des „Budget-Flaggschiffs“ in der RTX 40-Serie fortsetzt. Sie vereint moderne Technologien, Energieeffizienz und einen erschwinglichen Preis, und bleibt auch zwei Jahre nach ihrer Veröffentlichung relevant. In diesem Artikel werden wir untersuchen, was dieses Modell besonders macht, wie es sich in Spielen und Arbeitsanwendungen schlägt und für wen es sich 2025 lohnt, es zu kaufen.

1. Architektur und wichtige Merkmale

Architektur Ada Lovelace

Die RTX 4060 basiert auf der Ada Lovelace Architektur, die den 5-nm-Fertigungsprozess von TSMC nutzt. Dies ermöglichte eine Erhöhung der Transistordichte um 30 % im Vergleich zur vorherigen Ampere-Generation, was sich positiv auf die Leistung und Energieeffizienz auswirkt.

RTX und DLSS 3.5

Die Hauptmerkmale der Karte sind die Unterstützung von Raytracing der dritten Generation und DLSS 3.5. Die DLSS-Technologie (Deep Learning Super Sampling) nutzt neuronale Netzwerke zur Erhöhung der FPS, ohne die Bildqualität zu beeinträchtigen. In Version 3.5 wurden verbesserte Bildrekonstruktionen und eine Verringerung von Artefakten in Bewegung hinzugefügt, was besonders in Spielen mit intensivem RTX-Einsatz wie Cyberpunk 2077: Phantom Liberty oder Alan Wake 2 nützlich ist.

Reflex und Broadcast

Zu den zusätzlichen Funktionen gehören NVIDIA Reflex (Verringerung der Latenz in E-Sport-Spielen) und Broadcast (Künstliche Intelligenz für Streaming). Die Unterstützung von AMDs FidelityFX Super Resolution (FSR) bleibt jedoch auf Kompatibilität über Treiber beschränkt, wobei DLSS der „eigene“ Upscaler für die RTX 4060 bleibt.

2. Speicher: Typ, Größe und Geschwindigkeit

GDDR6 und 12 GB - die optimale Wahl?

Die RTX 4060 ist mit 12 GB GDDR6-Speicher und einer 192-Bit-Speicherbus ausgestattet. Die Bandbreite erreicht 384 GB/s (Speicherfrequenz - 16 Gbit/s). Dies ist ausreichend für die meisten Spiele in einer Auflösung von 1440p, jedoch kann es in 4K zu Einschränkungen kommen, insbesondere in Projekten mit Ultra-Texturen wie Horizon Forbidden West.

Warum kein GDDR6X?

Der Einsatz von GDDR6 anstelle von GDDR6X wird durch den Wunsch von NVIDIA erklärt, die Kosten und die Wärmeentwicklung zu senken. Allerdings erscheinen 12 GB im Jahr 2025 nicht mehr übermäßig: Zum Beispiel benötigt Starfield mit hochauflösenden Mods 10-11 GB VRAM.

3. Leistung in Spielen: FPS, Auflösungen und RTX

1080p: Maximeller Komfort

In Full HD zeigt die RTX 4060 stabile 90-120 FPS in AAA-Spielen ohne Raytracing (Elden Ring, Call of Duty: Modern Warfare IV). Mit aktivem RTX und DLSS 3.5 bleiben die Werte bei 60-80 FPS (Cyberpunk 2077, Metro Exodus Enhanced Edition).

1440p: Die goldene Mitte

In Quad HD meistert die Karte die meisten Projekte mit hohen Einstellungen (70-90 FPS), aber für ein stabiles Gameplay mit Raytracing ist die Aktivierung von DLSS erforderlich. Zum Beispiel beträgt bei Avatar: Frontiers of Pandora mit RTX Medium und DLSS Quality der durchschnittliche FPS 55-60.

4K: Nur für anspruchslose Projekte

In 4K ist die RTX 4060 für E-Sport-Spiele (Valorant, CS2) oder ältere AAA-Titel (Red Dead Redemption 2) geeignet. Bei Neuveröffentlichungen wie GTA VI müssen die Einstellungen jedoch auf Medium gesenkt und DLSS Performance aktiviert werden.

4. Professionelle Aufgaben: Videobearbeitung, Rendering und Berechnungen

Videobearbeitung und 3D-Rendering

Dank von 3072 CUDA-Kernen und Unterstützung für NVENC beschleunigt die RTX 4060 das Rendering in DaVinci Resolve und Premiere Pro. Zum Beispiel verkürzt sich der Export eines 4K-Videos in H.265 um 25 % im Vergleich zur RTX 3060. In Blender werden die Renderzyklen mit OptiX 30 % schneller ausgeführt als auf der AMD Radeon RX 7600 XT.

Wissenschaftliche Berechnungen

Für maschinelles Lernen und Berechnungen unterstützt die Karte CUDA und OpenCL. Ihre 12 GB Speicher beschränken jedoch die Arbeit mit großen neuronalen Netzwerkmodellen – hier sind die RTX 4070 oder professionelle Lösungen die bessere Wahl.

5. Energieverbrauch und Kühlung

TDP 160 W: Einsparungen beim Netzteil

Die RTX 4060 hat eine TDP von 160 W, was 20 % weniger als die RTX 3060 Ti ist. Dies ermöglicht die Nutzung eines Netzteils ab 500 W (empfohlene 550 W für zusätzlichen Spielraum).

Kühlsysteme

Referenzmodelle von NVIDIA verfügen über einen Dual-Fan-Kühler, während Partnerversionen (ASUS Dual, MSI Ventus) Lösungen mit drei Lüftern anbieten. Für Gehäuse mit schlechter Belüftung sollte man ein Modell mit einem Kühler wählen, der über die Platine hinausgeht (zum Beispiel Gigabyte Windforce).

6. Vergleich mit Konkurrenten

AMD Radeon RX 7600 XT

Der Hauptkonkurrent ist die Radeon RX 7600 XT (16 GB GDDR6, 349 $). In Spielen ohne Raytracing gewinnt AMD 5-10 % dank der Optimierung von FSR 3.0, aber in RTX-Szenarien liegt die RTX 4060 um 15-20 % vorne.

Intel Arc A770

Intel Arc A770 (16 GB, 299 $) holt in DirectX 12 zu NVIDIA auf, leidet jedoch unter Treiberproblemen in älteren Projekten. Für plattformübergreifende Studios ist es keine beste Wahl.

Innerhalb der Marke: RTX 4060 vs RTX 4060 Ti

Die RTX 4060 Ti (14 GB GDDR6X, 399 $) ist in 4K 25 % schneller, aber der Unterschied in 1440p ist kaum spürbar. Wenn das Budget begrenzt ist, ist die Basis-4060 optimal.

7. Praktische Tipps

Netzteil und Kompatibilität

- Minimales Netzteil: 550 W mit 8-Pin-Kabel.

- Kompatibilität: PCIe 4.0 x8 (vergessen Sie nicht, das BIOS des Motherboards für ältere Chipsätze zu aktualisieren).

Treiber und Optimierung

- Verwenden Sie immer den Game Ready Driver von NVIDIA.

- Aktivieren Sie NVENC in OBS für das Streaming — das reduziert die CPU-Belastung.

8. Vor- und Nachteile

Vorteile:

- Hervorragende Leistung in 1080p/1440p.

- Unterstützung für DLSS 3.5 und Raytracing.

- Niedriger Energieverbrauch.

- Preis: ab 299 $ (neue Modelle).

Nachteile:

- 12 GB VRAM könnten 2025 für 4K nicht ausreichen.

- Das Fehlen von GDDR6X schränkt die Bandbreite ein.

9. Fazit

Die NVIDIA GeForce RTX 4060 AD106 ist die ideale Wahl für:

- Gamer, die in Full HD/Quad HD mit maximalen Einstellungen spielen möchten.

- Streamer, die Wert auf Technologien zur Reduzierung der Latenz und qualitatives Upscaling legen.

- Hobby-Videobearbeiter, die mit 4K-Videos und 3D-Grafiken arbeiten.

Wenn Sie nach einem ausgewogenen Verhältnis von Preis, Leistung und Energieeffizienz suchen, bleibt diese Karte eines der besten Angebote auf dem Markt im Jahr 2025.

Basic

Markenname

NVIDIA

Plattform

Desktop

Erscheinungsdatum

January 2023

Modellname

GeForce RTX 4060 AD106

Generation

GeForce 40

Basis-Takt

1830MHz

Boost-Takt

2535MHz

Bus-Schnittstelle

PCIe 4.0 x8

Transistoren

22,900 million

RT-Kerne

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

120

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

120

Foundry

TSMC

Prozessgröße

5 nm

Architektur

Ada Lovelace

Speicherspezifikationen

Speichergröße

8GB

Speichertyp

GDDR6

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

128bit

Speichertakt

2250MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

288.0 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

121.7 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

304.2 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

19.47 TFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

304.2 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

19.859 TFLOPS

Verschiedenes

SM-Anzahl

Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

3840

L1-Cache

128 KB (per SM)

L2-Cache

24MB

TDP (Thermal Design Power)

200W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

3.0

OpenGL

4.6

DirectX

12 Ultimate (12_2)

CUDA

8.9

Stromanschlüsse

1x 12-pin

Shader-Modell

6.7

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Empfohlene PSU (Stromversorgung)

550W

Benchmarks

FP32 (float)

Punktzahl

19.859 TFLOPS

3DMark Time Spy

Punktzahl

10621

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS

GeForce RTX 3070 Ti GA102

22.185 +11.7%

Radeon RX 7600 XT

20.992 +5.7%

GeForce RTX 4060 AD106

19.859

GeForce RTX 3080 Ti Mobile

19.084 -3.9%

RTX A4000 Mobile

17.544 -11.7%

3DMark Time Spy

GeForce RTX 4070 Ti SUPER AD102

24279 +128.6%

RTX A5000

14182 +33.5%

GeForce RTX 4060 AD106

10621

GeForce RTX 3060 Mobile

8534 -19.6%

GeForce RTX 3050 8 GB

6327 -40.4%