NVIDIA GeForce RTX 4060 Mobile

NVIDIA GeForce RTX 4060 Mobile

NVIDIA GeForce RTX 4060 Mobile: Leistung und Effizienz im mobilen Format

April 2025

Moderne mobile Grafikkarten sind längst kein Kompromiss mehr zwischen Leistung und Portabilität. Die NVIDIA GeForce RTX 4060 Mobile ist ein glänzendes Beispiel dafür, wie Ingenieure fortschrittliche Technologien in ein kompaktes Formfaktor gepackt haben. In diesem Artikel werden wir untersuchen, was dieses Modell auszeichnet, wie es mit Spielen und professionellen Aufgaben umgeht und für wen es interessant sein könnte.


1. Architektur und wichtige Merkmale: Ada Lovelace und KI-Beschleunigung

Die RTX 4060 Mobile basiert auf der Ada Lovelace-Architektur, die 2022 debütierte. Die Chips werden im 4-nm-Prozess von TSMC hergestellt, was eine hohe Transistordichte und Energieeffizienz gewährleistet. Wichtige Merkmale:

- DLSS 3.5 – KI-basiertes Upscaling, das die FPS selbst in 4K erhöht, indem es Bilder mit Hilfe von neuronalen Netzen „nachzeichnet“.

- Dritte Generation der Ray Tracing-Technologie – verbesserte RT-Kerne sind 50 % effizienter als die der RTX 30-Serie.

- Unterstützung für DirectX 12 Ultimate und Vulkan RT – vollständige Kompatibilität mit modernen APIs.

- NVIDIA Reflexes – Verringerung der Latenz in eSports-Anwendungen.

Trotz des mobilen Formats behält die RTX 4060 Mobile alle „Features“ ihrer Desktop-Pendants bei, einschließlich hardwareseitiger Unterstützung für AV1 zur Video-Kodierung.


2. Speicher: GDDR6 und Bandbreite

Die Karte ist mit 8 GB GDDR6-Speicher und einem 128-Bit-Speicherbus ausgestattet. Die Bandbreite erreicht 256 GB/s dank einer Speichergeschwindigkeit von 16 Gbit/s. Das reicht aus, um komfortabel in einer Auflösung von bis zu 1440p zu spielen, aber in 4K kann es aufgrund des VRAM-Volumens zu Einschränkungen kommen. Beispielsweise werden in Spielen wie Starfield oder Cyberpunk 2077: Phantom Liberty bei Ultra-Einstellungen 90-95 % des Speichers ausgelastet, was gelegentlich zu Mikro-Rucklern führt.

Für die meisten Aufgaben reichen 8 GB aus, aber kreative Profis, die mit komplexen 3D-Szenen arbeiten, sollten sich Modelle mit 12 GB anschauen.


3. Spieleleistung: FPS, Auflösungen und RTX

Die RTX 4060 Mobile wird als Lösung für 1080p und 1440p positioniert. Hier sind Beispiele für die durchschnittliche Leistung in aktuellen Spielen des Jahres 2025 (Ultra-Einstellungen, ohne DLSS):

- Cyberpunk 2077: 58 FPS (1080p), 42 FPS (1440p), 28 FPS (4K).

- Call of Duty: Black Ops 6: 92 FPS (1080p), 68 FPS (1440p).

- Horizon Forbidden West PC Edition: 75 FPS (1080p), 54 FPS (1440p).

Mit aktiviertem DLSS 3.5 im „Qualitäts“-Modus ergibt sich ein Leistungszuwachs von 30-50 %. Beispielsweise steigt bei Cyberpunk 2077 mit Ray Tracing und DLSS die Rate auf 65 FPS bei 1440p. Für 4K-Gaming eignet sich die Karte nur mit DLSS oder FSR 3.0 (es gibt eine Kompatibilität zur AMD-Technologie, die Effizienz ist jedoch geringer).


4. Professionelle Anwendungen: CUDA, Rendering und Schnitt

Dank 3072 CUDA-Kernen und Unterstützung für NVIDIA Studio Drivers bewältigt die RTX 4060 Mobile nicht nur Spiele:

- Videobearbeitung: In Adobe Premiere Pro wird das Rendering eines 4K-Videos in H.265 im Vergleich zur RTX 3060 Mobile um 40 % beschleunigt.

- 3D-Modellierung: Im Blender wird das Rendering einer Szene in Cycles in 12 Minuten abgeschlossen (gegenüber 18 Minuten der vorherigen Generation).

- Maschinelles Lernen: Die Unterstützung von CUDA- und TensorFlow-Bibliotheken macht die Karte geeignet für das Training kleiner neuronaler Netze.

Für komplexe Simulationen (z. B. in Ansys) ist es jedoch besser, Modelle mit größerem Speicher zu wählen.


5. Energieverbrauch und Wärmeableitung: TDP und Kühlung

Die TDP der RTX 4060 Mobile beträgt 85-100 W, abhängig vom Betriebsmodus (Dynamic Boost 2.0 erhöht die Leistung vorübergehend auf 115 W). Dies erfordert ein effektives Kühlsystem:

- Es werden Laptops mit 2-3 Heatpipes und Ventilatoren mit antivibrationaler Montage empfohlen (z. B. ASUS ROG Zephyrus oder Lenovo Legion Pro).

- Bei längeren Lasten bleibt die Kerntemperatur im Bereich von 75-82 °C – ein sicherer, aber lauter Betrieb.

Um die Hitze zu reduzieren, kann eine FPS-Begrenzung über das NVIDIA Control Panel oder Drittanbieter-Utilities verwendet werden.


6. Vergleich mit Wettbewerbern: AMD und Intel

Die Hauptkonkurrenten im Jahr 2025:

- AMD Radeon RX 7600M XT (8 GB GDDR6): 100 US-Dollar günstiger, aber 15-20 % langsamer bei Ray Tracing. FSR 3.0 kann DLSS 3.5 in der Bildqualität nicht das Wasser reichen.

- Intel Arc A770M (12 GB GDDR6): Schlägt sich besser in 4K, aber die Treiber sind immer noch weniger stabil, insbesondere in älteren Spielen.

Die RTX 4060 Mobile hat Vorteile durch ihr Ökosystem: DLSS, Reflexe und Broadcast-Utilities für Streamer.


7. Praktische Tipps: Auswahl und Einstellungen

- Netzteil des Laptops: Mindestens 180 W für Modelle mit Intel Core i7 oder Ryzen 7.

- Kompatibilität: Die Karte läuft auf PCIe 4.0 x8 – prüfen Sie, ob Ihr Laptop diese Version unterstützt.

- Treiber: Regelmäßig über GeForce Experience aktualisieren. Für professionelle Aufgaben auf Studio Drivers umschalten.

Vermeiden Sie dünne Ultrabooks mit passiver Kühlung – unter Last drosseln sie schnell.


8. Vor- und Nachteile

Vorteile:

- Hohe FPS in 1080p/1440p mit DLSS.

- Unterstützung aller aktuellen KI-Technologien.

- Energieeffizienz für mobile GPUs.

Nachteile:

- 8 GB VRAM limitiert 4K-Gaming.

- Preis der Notebooks beginnt bei 1.200 USD (die Karte selbst wird nicht im OEM-Vertrieb verkauft).


9. Fazit: Für wen eignet sich die RTX 4060 Mobile?

Diese Grafikkarte ist die ideale Wahl für:

- Gamer, die AAA-Projekte auf hohen Einstellungen ohne Netzanschluss spielen möchten.

- Content Creator, die auf beschleunigtes Rendering und die Verwendung von KI-Tools angewiesen sind.

- Studierende und Profis, die eine Balance zwischen Leistung und Portabilität suchen.

Wenn Ihr Budget begrenzt ist und 4K nicht prioritär ist, wird die RTX 4060 Mobile ein zuverlässiger Begleiter für die nächsten 3-4 Jahre sein. Für zukünftige Projekte, die sich auf RTX und 8K konzentrieren, sollten Sie jedoch Modelle mit 12-16 GB Speicher in Betracht ziehen.

Basic

Markenname
NVIDIA
Plattform
Mobile
Erscheinungsdatum
January 2023
Modellname
GeForce RTX 4060 Mobile
Generation
GeForce 40 Mobile
Basis-Takt
1545MHz
Boost-Takt
1890MHz
Bus-Schnittstelle
PCIe 4.0 x16
Transistoren
Unknown
RT-Kerne
24
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
96
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
96
Foundry
TSMC
Prozessgröße
5 nm
Architektur
Ada Lovelace

Speicherspezifikationen

Speichergröße
8GB
Speichertyp
GDDR6
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
128bit
Speichertakt
2000MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
256.0 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
90.72 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
181.4 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
11.61 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
181.4 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
11.842 TFLOPS

Verschiedenes

SM-Anzahl
?
Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.
24
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
3072
L1-Cache
128 KB (per SM)
L2-Cache
32MB
TDP (Thermal Design Power)
115W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
8.9
Stromanschlüsse
None
Shader-Modell
6.7
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
48

Benchmarks

Shadow of the Tomb Raider 2160p
Punktzahl
41 fps
Shadow of the Tomb Raider 1440p
Punktzahl
94 fps
Shadow of the Tomb Raider 1080p
Punktzahl
151 fps
Cyberpunk 2077 1440p
Punktzahl
27 fps
GTA 5 2160p
Punktzahl
76 fps
GTA 5 1440p
Punktzahl
76 fps
GTA 5 1080p
Punktzahl
167 fps
FP32 (float)
Punktzahl
11.842 TFLOPS
3DMark Time Spy
Punktzahl
10189
Blender
Punktzahl
3569
OctaneBench
Punktzahl
350

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 2160p / fps
94 +129.3%
54 +31.7%
18 -56.1%
Shadow of the Tomb Raider 1440p / fps
292 +210.6%
128 +36.2%
67 -28.7%
49 -47.9%
Shadow of the Tomb Raider 1080p / fps
310 +105.3%
101 -33.1%
72 -52.3%
Cyberpunk 2077 1440p / fps
79 +192.6%
35 +29.6%
GTA 5 2160p / fps
173 +127.6%
98 +28.9%
59 -22.4%
31 -59.2%
GTA 5 1440p / fps
153 +101.3%
103 +35.5%
82 +7.9%
29 -61.8%
GTA 5 1080p / fps
231 +38.3%
176 +5.4%
141 -15.6%
86 -48.5%
FP32 (float) / TFLOPS
12.536 +5.9%
11.201 -5.4%
10.839 -8.5%
3DMark Time Spy
20661 +102.8%
8009 -21.4%
5933 -41.8%
Blender
15026.3 +321%
2020.49 -43.4%
1064 -70.2%
552 -84.5%
OctaneBench
1328 +279.4%
163 -53.4%
87 -75.1%
47 -86.6%