NVIDIA GeForce RTX 4060

NVIDIA GeForce RTX 4060

NVIDIA GeForce RTX 4060: Power für Gamer und Kreative im kompakten Format

Architektur und wichtige Eigenschaften

Die Grafikkarte NVIDIA GeForce RTX 4060 basiert auf der Ada Lovelace-Architektur, die einen evolutionären Schritt nach Ampere darstellt. Der Fertigungsprozess TSMC 4N (5-nm-Klasse) sorgt für eine erhöhte Transistordichte und Energieeffizienz. Zu den wichtigsten Neuerungen gehören:

- RT-Kerne der dritten Generation: Optimieren das Raytracing und machen Licht, Schatten und Reflexionen in Spielen realistischer.

- Tensor-Kerne der vierten Generation: Verantwortlich für den Betrieb von DLSS 3, der nicht nur die Auflösung erhöht, sondern auch ganze Bilder generiert, um die FPS zu steigern.

- Shader Execution Reordering (SER): Optimiert die Ausführung von Aufgaben, verringert Latenzen und verbessert die Leistung in Szenen mit RT.

Die Unterstützung von DLSS 3.5 (mit verbessertem Raytracing durch Ray Reconstruction) und FidelityFX Super Resolution von AMD (über offenen Standard) macht die Karte vielseitig einsetzbar für verschiedene Spiele.


Speicher: Geschwindigkeit und Volumen

Die RTX 4060 ist mit 8 GB GDDR6 und einem 128-Bit-Speicherinterface ausgestattet. Die Bandbreite erreicht 272 GB/s, was niedriger ist als bei der RTX 4060 Ti (288 GB/s), aber dennoch ausreichend für 1080p und 1440p. In Spielen mit Ultra-Texturen oder 4K kann es jedoch an VRAM mangeln – beispielsweise in Hogwarts Legacy oder The Last of Us Part I bei maximalen Einstellungen.

Für die meisten modernen Projekte sind 8 GB ausreichend, aber Enthusiasten sollten über die RTX 4070 mit 12 GB nachdenken, wenn das Budget es zulässt.


Leistung in Spielen: FPS und Auflösungen

In 1080p zeigt die RTX 4060 überzeugende Ergebnisse:

- Cyberpunk 2077 (Ultra, ohne RT/DLSS): 65-70 FPS;

- Elden Ring (Max): 80-85 FPS;

- Call of Duty: Warzone (Ultra): 110-120 FPS.

Mit aktivem DLSS 3 in unterstützten Spielen (z. B. Alan Wake 2) steigen die FPS um 40-60 %, und in Cyberpunk 2077 mit Raytracing und DLSS liefert die Karte stabile 90 FPS.

Für 1440p (2560x1440) ist die RTX 4060 bedingt geeignet: in Horizon Forbidden West (High) — 55-60 FPS, aber im DLSS Quality-Modus — bis zu 75 FPS. In 4K (3840x2160) ohne DLSS ist die Karte nicht komfortabel: Red Dead Redemption 2 erreicht kaum 30 FPS auf Ultra.

Fazit: Ideal für 1080p-Gaming mit RT und DLSS, für 1440p jedoch mit Vorbehalten.


Professionelle Aufgaben: Nicht nur Spiele

Dank der CUDA-Kerne (3072 Stück) und Unterstützung für OpenCL meistert die RTX 4060:

- Videobearbeitung: In DaVinci Resolve dauert das Rendern eines 4K-Projekts 20 % weniger Zeit als bei der RTX 3060.

- 3D-Rendering: In Blender (Cycles) verarbeitet die Karte die BMW-Szene in ~4 Minuten im Vergleich zu ~5,5 Minuten bei der RTX 3060.

- Wissenschaftliche Berechnungen: Bioinformatik- und ML-Aufgaben werden durch CUDA und optimierte Bibliotheken beschleunigt.

NVENC (Encoder der siebten Generation) sorgt für ein flüssiges Streaming in OBS, ohne die CPU zu belasten.


Energieverbrauch und Wärmeabgabe

Der TDP der RTX 4060 beträgt 115 W, was 35 % weniger ist als bei der RTX 3060 (170 W). Dies ermöglicht die Verwendung der Karte selbst in kompakten Builds.

- Kühlung: Referenzmodelle sind mit zwei Lüftern ausgestattet (Temperatur unter Last — ~65°C). Für Gehäuse mit schlechter Belüftung sind Modelle mit dreifachem Kühlsystem (z. B. von ASUS Dual oder MSI Ventus) besser geeignet.

- Gehäuse: Ein Gehäuse mit 2-3 Lüftern ist minimal ausreichend. Mesh-Designs (z. B. Fractal Design Pop Air) werden empfohlen.


Vergleich mit Wettbewerbern

Der Hauptkonkurrent ist die AMD Radeon RX 7600 (8 GB GDDR6):

- In DX12-Spielen (Shadow of the Tomb Raider) ist die RTX 4060 15-20 % schneller;

- Bei aktiviertem RT vergrößert sich der Abstand auf 30-40 % zugunsten von NVIDIA dank DLSS 3;

- Allerdings kann die RX 7600 in DX11-Projekten (Assassin’s Creed Valhalla) manchmal aufgrund der AMD-Optimierung gewinne.

Für diejenigen, die auf den Preis achten, ist die RX 7600 etwa 10 % günstiger, aber die RTX 4060 bietet eine bessere Unterstützung für Raytracing und KI-Technologien.


Praktische Tipps

- Netzteil: 450-500 W sind ausreichend (Bronze 80+ empfohlen). Für Systeme mit Ryzen 7/i5 und RTX 4060 reicht das Corsair CX550.

- Kompatibilität: PCIe 4.0 x8 (abwärtskompatibel mit PCIe 3.0, aber mit einem Leistungsverlust von 1-3 %).

- Treiber: Verwenden Sie Studio Driver für professionelle Anwendungen und Game Ready für Spiele. Aktualisieren Sie die Software regelmäßig über GeForce Experience.


Vor- und Nachteile

Vorteile:

- Hohe Energieeffizienz;

- DLSS 3 und überlegene Leistung in RT-Szenen;

- Unterstützung von AV1 für Streamer;

- Niedrige Temperaturen und Geräuschpegel.

Nachteile:

- Nur 8 GB VRAM (beschränkt in 4K und einigen 1440p-Szenarien);

- Enges 128-Bit-Speicherinterface;

- Höherer Preis im Vergleich zu direkten AMD-Konkurrenten.


Fazit: Für wen ist die RTX 4060 geeignet?

Diese Grafikkarte ist eine hervorragende Wahl für:

- Gamer, die in 1080p mit Ultra-Einstellungen und RT spielen;

- Streamer, die NVENC und geringen Energieverbrauch schätzen;

- Videoredakteure und Designer, die mit moderaten Rendering-Anforderungen arbeiten.

Wenn Sie nicht auf 4K setzen und moderne Technologien ohne Aufpreis für Spitzenmodelle wünschen, wird die RTX 4060 eine ausgewogene Lösung sein. Für zukünftige Anwendungen (insbesondere angesichts der wachsenden Anforderungen an VRAM) ist es jedoch ratsam, die RTX 4070 oder RX 7700 XT in Betracht zu ziehen.

Basic

Markenname
NVIDIA
Plattform
Desktop
Erscheinungsdatum
May 2023
Modellname
GeForce RTX 4060
Generation
GeForce 40
Basis-Takt
1830MHz
Boost-Takt
2460MHz
Bus-Schnittstelle
PCIe 4.0 x8
Transistoren
Unknown
RT-Kerne
24
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
96
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
96
Foundry
TSMC
Prozessgröße
5 nm
Architektur
Ada Lovelace

Speicherspezifikationen

Speichergröße
8GB
Speichertyp
GDDR6
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
128bit
Speichertakt
2125MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
272.0 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
118.1 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
236.2 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
15.11 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
236.2 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
14.808 TFLOPS

Verschiedenes

SM-Anzahl
?
Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.
24
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
3072
L1-Cache
128 KB (per SM)
L2-Cache
24MB
TDP (Thermal Design Power)
115W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
8.9
Stromanschlüsse
1x 12-pin
Shader-Modell
6.7
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
48
Empfohlene PSU (Stromversorgung)
300W

Benchmarks

Shadow of the Tomb Raider 2160p
Punktzahl
45 fps
Shadow of the Tomb Raider 1440p
Punktzahl
96 fps
Shadow of the Tomb Raider 1080p
Punktzahl
163 fps
Cyberpunk 2077 2160p
Punktzahl
18 fps
Cyberpunk 2077 1440p
Punktzahl
53 fps
Cyberpunk 2077 1080p
Punktzahl
82 fps
GTA 5 2160p
Punktzahl
92 fps
GTA 5 1440p
Punktzahl
88 fps
GTA 5 1080p
Punktzahl
186 fps
FP32 (float)
Punktzahl
14.808 TFLOPS
3DMark Time Spy
Punktzahl
10778
Blender
Punktzahl
3410
OctaneBench
Punktzahl
348
Vulkan
Punktzahl
93644
OpenCL
Punktzahl
102044

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 2160p / fps
193 +328.9%
69 +53.3%
34 -24.4%
24 -46.7%
Shadow of the Tomb Raider 1440p / fps
292 +204.2%
128 +33.3%
67 -30.2%
Shadow of the Tomb Raider 1080p / fps
310 +90.2%
72 -55.8%
Cyberpunk 2077 2160p / fps
67 +272.2%
51 +183.3%
37 +105.6%
Cyberpunk 2077 1440p / fps
115 +117%
Cyberpunk 2077 1080p / fps
176 +114.6%
113 +37.8%
60 -26.8%
GTA 5 2160p / fps
174 +89.1%
100 +8.7%
GTA 5 1440p / fps
186 +111.4%
GTA 5 1080p / fps
231 +24.2%
156 -16.1%
141 -24.2%
86 -53.8%
FP32 (float) / TFLOPS
15.984 +7.9%
14.372 -2.9%
13.709 -7.4%
3DMark Time Spy
27571 +155.8%
14965 +38.8%
Blender
15026.3 +340.7%
3510.95 +3%
1055.6 -69%
552 -83.8%
OctaneBench
1328 +281.6%
89 -74.4%
47 -86.5%
Vulkan
382809 +308.8%
140875 +50.4%
60353 -35.6%
34633 -63%
OpenCL
321810 +215.4%
152485 +49.4%
71022 -30.4%
51251 -49.8%