Startseite / NVIDIA / NVIDIA GeForce RTX 4060: Leistung und Spezifikationen

NVIDIA GeForce RTX 4060

NVIDIA GeForce RTX 4060: Power für Gamer und Kreative im kompakten Format

Architektur und wichtige Eigenschaften

Die Grafikkarte NVIDIA GeForce RTX 4060 basiert auf der Ada Lovelace-Architektur, die einen evolutionären Schritt nach Ampere darstellt. Der Fertigungsprozess TSMC 4N (5-nm-Klasse) sorgt für eine erhöhte Transistordichte und Energieeffizienz. Zu den wichtigsten Neuerungen gehören:

- RT-Kerne der dritten Generation: Optimieren das Raytracing und machen Licht, Schatten und Reflexionen in Spielen realistischer.

- Tensor-Kerne der vierten Generation: Verantwortlich für den Betrieb von DLSS 3, der nicht nur die Auflösung erhöht, sondern auch ganze Bilder generiert, um die FPS zu steigern.

- Shader Execution Reordering (SER): Optimiert die Ausführung von Aufgaben, verringert Latenzen und verbessert die Leistung in Szenen mit RT.

Die Unterstützung von DLSS 3.5 (mit verbessertem Raytracing durch Ray Reconstruction) und FidelityFX Super Resolution von AMD (über offenen Standard) macht die Karte vielseitig einsetzbar für verschiedene Spiele.

Speicher: Geschwindigkeit und Volumen

Die RTX 4060 ist mit 8 GB GDDR6 und einem 128-Bit-Speicherinterface ausgestattet. Die Bandbreite erreicht 272 GB/s, was niedriger ist als bei der RTX 4060 Ti (288 GB/s), aber dennoch ausreichend für 1080p und 1440p. In Spielen mit Ultra-Texturen oder 4K kann es jedoch an VRAM mangeln – beispielsweise in Hogwarts Legacy oder The Last of Us Part I bei maximalen Einstellungen.

Für die meisten modernen Projekte sind 8 GB ausreichend, aber Enthusiasten sollten über die RTX 4070 mit 12 GB nachdenken, wenn das Budget es zulässt.

Leistung in Spielen: FPS und Auflösungen

In 1080p zeigt die RTX 4060 überzeugende Ergebnisse:

- Cyberpunk 2077 (Ultra, ohne RT/DLSS): 65-70 FPS;

- Elden Ring (Max): 80-85 FPS;

- Call of Duty: Warzone (Ultra): 110-120 FPS.

Mit aktivem DLSS 3 in unterstützten Spielen (z. B. Alan Wake 2) steigen die FPS um 40-60 %, und in Cyberpunk 2077 mit Raytracing und DLSS liefert die Karte stabile 90 FPS.

Für 1440p (2560x1440) ist die RTX 4060 bedingt geeignet: in Horizon Forbidden West (High) — 55-60 FPS, aber im DLSS Quality-Modus — bis zu 75 FPS. In 4K (3840x2160) ohne DLSS ist die Karte nicht komfortabel: Red Dead Redemption 2 erreicht kaum 30 FPS auf Ultra.

Fazit: Ideal für 1080p-Gaming mit RT und DLSS, für 1440p jedoch mit Vorbehalten.

Professionelle Aufgaben: Nicht nur Spiele

Dank der CUDA-Kerne (3072 Stück) und Unterstützung für OpenCL meistert die RTX 4060:

- Videobearbeitung: In DaVinci Resolve dauert das Rendern eines 4K-Projekts 20 % weniger Zeit als bei der RTX 3060.

- 3D-Rendering: In Blender (Cycles) verarbeitet die Karte die BMW-Szene in ~4 Minuten im Vergleich zu ~5,5 Minuten bei der RTX 3060.

- Wissenschaftliche Berechnungen: Bioinformatik- und ML-Aufgaben werden durch CUDA und optimierte Bibliotheken beschleunigt.

NVENC (Encoder der siebten Generation) sorgt für ein flüssiges Streaming in OBS, ohne die CPU zu belasten.

Energieverbrauch und Wärmeabgabe

Der TDP der RTX 4060 beträgt 115 W, was 35 % weniger ist als bei der RTX 3060 (170 W). Dies ermöglicht die Verwendung der Karte selbst in kompakten Builds.

- Kühlung: Referenzmodelle sind mit zwei Lüftern ausgestattet (Temperatur unter Last — ~65°C). Für Gehäuse mit schlechter Belüftung sind Modelle mit dreifachem Kühlsystem (z. B. von ASUS Dual oder MSI Ventus) besser geeignet.

- Gehäuse: Ein Gehäuse mit 2-3 Lüftern ist minimal ausreichend. Mesh-Designs (z. B. Fractal Design Pop Air) werden empfohlen.

Vergleich mit Wettbewerbern

Der Hauptkonkurrent ist die AMD Radeon RX 7600 (8 GB GDDR6):

- In DX12-Spielen (Shadow of the Tomb Raider) ist die RTX 4060 15-20 % schneller;

- Bei aktiviertem RT vergrößert sich der Abstand auf 30-40 % zugunsten von NVIDIA dank DLSS 3;

- Allerdings kann die RX 7600 in DX11-Projekten (Assassin’s Creed Valhalla) manchmal aufgrund der AMD-Optimierung gewinne.

Für diejenigen, die auf den Preis achten, ist die RX 7600 etwa 10 % günstiger, aber die RTX 4060 bietet eine bessere Unterstützung für Raytracing und KI-Technologien.

Praktische Tipps

- Netzteil: 450-500 W sind ausreichend (Bronze 80+ empfohlen). Für Systeme mit Ryzen 7/i5 und RTX 4060 reicht das Corsair CX550.

- Kompatibilität: PCIe 4.0 x8 (abwärtskompatibel mit PCIe 3.0, aber mit einem Leistungsverlust von 1-3 %).

- Treiber: Verwenden Sie Studio Driver für professionelle Anwendungen und Game Ready für Spiele. Aktualisieren Sie die Software regelmäßig über GeForce Experience.

Vor- und Nachteile

Vorteile:

- Hohe Energieeffizienz;

- DLSS 3 und überlegene Leistung in RT-Szenen;

- Unterstützung von AV1 für Streamer;

- Niedrige Temperaturen und Geräuschpegel.

Nachteile:

- Nur 8 GB VRAM (beschränkt in 4K und einigen 1440p-Szenarien);

- Enges 128-Bit-Speicherinterface;

- Höherer Preis im Vergleich zu direkten AMD-Konkurrenten.

Fazit: Für wen ist die RTX 4060 geeignet?

Diese Grafikkarte ist eine hervorragende Wahl für:

- Gamer, die in 1080p mit Ultra-Einstellungen und RT spielen;

- Streamer, die NVENC und geringen Energieverbrauch schätzen;

- Videoredakteure und Designer, die mit moderaten Rendering-Anforderungen arbeiten.

Wenn Sie nicht auf 4K setzen und moderne Technologien ohne Aufpreis für Spitzenmodelle wünschen, wird die RTX 4060 eine ausgewogene Lösung sein. Für zukünftige Anwendungen (insbesondere angesichts der wachsenden Anforderungen an VRAM) ist es jedoch ratsam, die RTX 4070 oder RX 7700 XT in Betracht zu ziehen.

Basic

Markenname

NVIDIA

Plattform

Desktop

Erscheinungsdatum

May 2023

Modellname

GeForce RTX 4060

Generation

GeForce 40

Basis-Takt

1830MHz

Boost-Takt

2460MHz

Bus-Schnittstelle

PCIe 4.0 x8

Transistoren

Unknown

RT-Kerne

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

Foundry

TSMC

Prozessgröße

5 nm

Architektur

Ada Lovelace

Speicherspezifikationen

Speichergröße

8GB

Speichertyp

GDDR6

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

128bit

Speichertakt

2125MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

272.0 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

118.1 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

236.2 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

15.11 TFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

236.2 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

14.808 TFLOPS

Verschiedenes

SM-Anzahl

Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

3072

L1-Cache

128 KB (per SM)

L2-Cache

24MB

TDP (Thermal Design Power)

115W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

3.0

OpenGL

4.6

DirectX

12 Ultimate (12_2)

CUDA

8.9

Stromanschlüsse

1x 12-pin

Shader-Modell

6.7

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Empfohlene PSU (Stromversorgung)

300W

Benchmarks

Shadow of the Tomb Raider 2160p

Punktzahl

45 fps

Shadow of the Tomb Raider 1440p

Punktzahl

96 fps

Shadow of the Tomb Raider 1080p

Punktzahl

163 fps

Cyberpunk 2077 2160p

Punktzahl

18 fps

Cyberpunk 2077 1440p

Punktzahl

53 fps

Cyberpunk 2077 1080p

Punktzahl

82 fps

GTA 5 2160p

Punktzahl

92 fps

GTA 5 1440p

Punktzahl

88 fps

GTA 5 1080p

Punktzahl

186 fps

FP32 (float)

Punktzahl

14.808 TFLOPS

3DMark Time Spy

Punktzahl

10778

Blender

Punktzahl

3410

OctaneBench

Punktzahl

348

Vulkan

Punktzahl

93644

OpenCL

Punktzahl

102044

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 2160p / fps

GeForce RTX 4090

193 +328.9%

TITAN RTX

69 +53.3%

GeForce RTX 4060

Radeon RX 6700M

34 -24.4%

GeForce RTX 2060

24 -46.7%

Shadow of the Tomb Raider 1440p / fps

GeForce RTX 4090

292 +204.2%

GeForce RTX 3070 Ti

128 +33.3%

GeForce RTX 4060

Radeon RX 6700M

67 -30.2%

GeForce GTX 1070

49 -49%

Shadow of the Tomb Raider 1080p / fps

Radeon RX 7900 XTX

310 +90.2%

GeForce RTX 3080 12 GB

187 +14.7%

GeForce RTX 4060

163

Radeon RX 5600 XT

101 -38%

Radeon RX 5500 XT

72 -55.8%

Cyberpunk 2077 2160p / fps

GeForce RTX 3080 Ti

67 +272.2%

GeForce RTX 2080 Ti

51 +183.3%

Radeon RX 7700 XT

37 +105.6%

GeForce RTX 3050 4 GB

27 +50%

GeForce RTX 4060

Cyberpunk 2077 1440p / fps

Radeon RX 7800 XT

115 +117%

GeForce RTX 3080 12 GB

73 +37.7%

GeForce RTX 4060

GeForce RTX 3050 4 GB

40 -24.5%

GeForce RTX 2060 12 GB

33 -37.7%

Cyberpunk 2077 1080p / fps

GeForce RTX 4080

176 +114.6%

Radeon RX 6950 XT

113 +37.8%

GeForce RTX 4060

Radeon RX 6700

60 -26.8%

GeForce RTX 2060 12 GB

47 -42.7%

GTA 5 2160p / fps

Radeon RX 7900 XTX

174 +89.1%

Radeon RX 6800

100 +8.7%

GeForce RTX 4060

GeForce GTX 1660 SUPER

59 -35.9%

GeForce RTX 2050 Mobile

39 -57.6%

GTA 5 1440p / fps

GeForce RTX 3090

186 +111.4%

GeForce RTX 2080 SUPER

116 +31.8%

GeForce RTX 4060

GeForce RTX 3050 4 GB

73 -17%

GeForce GTX 1650 SUPER

47 -46.6%

GTA 5 1080p / fps

GeForce RTX 3090 Ti

231 +24.2%

GeForce RTX 4060

186

GeForce RTX 3070

156 -16.1%

Radeon R9 FURY

141 -24.2%

Radeon RX 550

86 -53.8%

FP32 (float) / TFLOPS

Quadro RTX 6000

15.984 +7.9%

GeForce RTX 3070 Mobile

15.651 +5.7%

GeForce RTX 4060

14.808

Radeon Pro Vega II

14.372 -2.9%

Radeon VII

13.709 -7.4%

3DMark Time Spy

GeForce RTX 4080

27571 +155.8%

GeForce RTX 2080 Ti

14965 +38.8%

GeForce RTX 4060

10778

GeForce RTX 3060 GA104

8719 -19.1%

GeForce RTX 2070 Max Q Refresh

6879 -36.2%

Blender

GeForce RTX 5090

15026.3 +340.7%

Radeon PRO W7900

3547 +4%

GeForce RTX 4060

3410

Radeon RX 6700M

1222 -64.2%

Tesla M40 24 GB

589 -82.7%

OctaneBench

GeForce RTX 4090

1328 +281.6%

GeForce RTX 4070 Mobile

349 +0.3%

GeForce RTX 4060

348

Quadro P3200 Max Q

87 -75%

GeForce GTX 960

47 -86.5%

Vulkan

GeForce RTX 5090 D

382809 +308.8%

RTX A5000

140875 +50.4%

GeForce RTX 4060

93644

Radeon Pro W5700X

64049 -31.6%

GeForce MX570 A

38904 -58.5%

OpenCL

GeForce RTX 5080

260803 +155.6%

GeForce RTX 2080 Ti

147055 +44.1%

GeForce RTX 4060

102044

RTX A2000

72786 -28.7%

RTX A1000

53439 -47.6%