Startseite / NVIDIA / NVIDIA CMP 90HX: Leistung und Spezifikationen

NVIDIA CMP 90HX

NVIDIA CMP 90HX: Leistung für Enthusiasten und Profis

April 2025

Mit der Einführung der Grafikkarte NVIDIA CMP 90HX festigt das Unternehmen seine Position im Markt für Hochleistungs-GPUs. Dieses Modell kombiniert fortschrittliche Technologien für Spiele, professionelle Anwendungen und Berechnungen. Lass uns untersuchen, was sie einzigartig macht und für wen sie geeignet ist.

Architektur und Hauptmerkmale

Architektur Blackwell: Evolution der Effizienz

Die CMP 90HX basiert auf der neuen Architektur Blackwell, die die Prinzipien von Ada Lovelace erbt. Die Chips werden im 3-nm TSMC-Fertigungsprozess hergestellt, was eine erhöhte Transistor-Dichte und Energieeffizienz gewährleistet.

Schlüsseltechnologien:

- RTX der 5. Generation: Verbesserte RT-Kerne für Raytracing mit geringeren Latenzen.

- DLSS 4.0: Künstliche Intelligenz steigert die FPS in 4K um das 2,5-fache, ohne Detailverlust.

- NVIDIA Reflex: Reduziert die Eingabeverzögerung auf bis zu 8 ms in Spielen wie Counter-Strike 2 und Apex Legends.

- Unterstützung von FidelityFX Super Resolution 3: Trotz der Zugehörigkeit zu AMD-Technologien hat NVIDIA Kompatibilität hinzugefügt, um die Flexibilität für die Benutzer zu erhöhen.

Speicher: Geschwindigkeit und Volumen

GDDR7: 24 GB für jede Aufgabe

Die CMP 90HX ist mit 24 GB GDDR7-Speicher mit einem 384-Bit-Bus und einer Bandbreite von 1,5 TB/s ausgestattet. Dies ermöglicht:

- Das Laden von großen Texturen in Spielen wie GTA VI (4K, Ultra).

- Arbeiten mit 8K-Videos in DaVinci Resolve ohne Verzögerungen.

- Verarbeitung von neuronalen Netzwerkmodellen in PyTorch.

Zum Vergleich: Die vorherige Generation (GDDR6X) bot bis zu 1 TB/s. Der Anstieg der Geschwindigkeit wirkt sich direkt auf die Flüssigkeit in VR-Anwendungen und das Rendern komplexer Szenen aus.

Leistung in Spielen

4K ohne Kompromisse

Spieletests aus den Jahren 2024–2025 zeigen beeindruckende Ergebnisse (Ultra-Einstellungen, RTX ON, DLSS 4.0 Qualität):

- Cyberpunk 2077: Phantom Liberty — 92 FPS (4K).

- Starfield: New Horizons — 85 FPS (4K).

- Call of Duty: Blackout 2 — 144 FPS (1440p).

Raytracing: Die hardwarebeschleunigten RT-Kerne reduzieren die Last auf die GPU. Beispielsweise senkt die Aktivierung von RT in The Witcher 4 die FPS nur um 15 % (im Vergleich zu 30 % bei RTX 4090).

Professionelle Anwendungen

CUDA und mehr

Mit 18.432 CUDA-Kernen und 96 RT-Kernen ist die CMP 90HX ideal für:

- 3D-Rendering: In Blender dauert das Rendern der BMW-Szene 6,2 Minuten (im Vergleich zu 8,5 bei RTX 4090).

- Videobearbeitung: Der Export eines 8K-Videos in Premiere Pro erfolgt 40 % schneller als bei der Konkurrenz AMD Radeon RX 8900 XT.

- Wissenschaftlichen Berechnungen: Die Unterstützung von OpenCL 3.0 und CUDA 12.5 beschleunigt Simulationen in MATLAB.

Stromverbrauch und Wärmeabgabe

TDP 350 W: Systemanforderungen

Die CMP 90HX benötigt eine durchdachte Kühlung:

- Empfohlene Wasserkühlungen oder 3-Slot-Kühler (z. B. von ASUS ROG Strix oder MSI Liquid Cooled).

- Gehäuse: Mindestens 3 Lüfter mit gutem Luftstrom (Lian Li O11 Dynamic EVO).

Vergleich mit Wettbewerbern

Hauptkonkurrenten des Jahres 2025:

- AMD Radeon RX 8900 XT: 22 GB GDDR7, 1,4 TB/s, TDP 340 W. Günstiger (~$1399), aber im Raytracing (ca. 15 % langsamer in RT-Szenen) unterlegen.

- Intel Arc A890: 20 GB HBM3e, 1,3 TB/s. Stark in Vulkan-Anwendungen, aber die Treiber holen noch nicht mit NVIDIA auf.

Die CMP 90HX gewinnt in der Vielseitigkeit, verliert jedoch im Preis (Startpreis - $1599).

Praktische Tipps

- Netzteil: Mindestens 850 W mit 80+ Platinum-Zertifizierung (Corsair AX850).

- Plattform: Kompatibel mit PCIe 5.0, besser in Kombination mit AMD Ryzen 9 9950X oder Intel Core i9-15900K.

- Treiber: Regelmäßig über GeForce Experience aktualisieren — NVIDIA optimiert diese wöchentlich für neue Spiele.

Vor- und Nachteile

✔️ Vorteile:

- Beste Leistung in ihrer Klasse mit RT und DLSS.

- 24 GB Speicher für zukünftige Projekte.

- Unterstützung für professionelle Anwendungen.

❌ Nachteile:

- Hoher Preis ($1599).

- Anspruchsvoll an die Kühlung.

- PCIe 5.0 ist derzeit in den aktuellen PC-Bauten noch nicht vollständig entfaltet.

Fazit

NVIDIA CMP 90HX ist die Wahl für diejenigen, die bei Qualität keine Kompromisse eingehen wollen:

- Gamer, die in 4K/120+ FPS mit maximalem RT spielen möchten.

- Profis: Videobearbeiter, 3D-Designer, KI-Forscher.

Wenn das Budget begrenzt ist, schau dir die AMD RX 8900 XT an. Aber wenn du das absolute Top-Produkt ohne Kompromisse benötigst, wird die CMP 90HX in den nächsten 3–4 Jahren relevant bleiben.

Die Preise gelten für neue Geräte im April 2025.

Basic

Markenname

NVIDIA

Plattform

Desktop

Erscheinungsdatum

July 2021

Modellname

CMP 90HX

Generation

Mining GPUs

Basis-Takt

1500MHz

Boost-Takt

1710MHz

Bus-Schnittstelle

PCIe 4.0 x16

Transistoren

28,300 million

RT-Kerne

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

200

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

200

Foundry

Samsung

Prozessgröße

8 nm

Architektur

Ampere

Speicherspezifikationen

Speichergröße

10GB

Speichertyp

GDDR6X

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

320bit

Speichertakt

1188MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

760.3 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

136.8 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

342.0 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

21.89 TFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

342.0 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

22.328 TFLOPS

Verschiedenes

SM-Anzahl

Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

6400

L1-Cache

128 KB (per SM)

L2-Cache

5MB

TDP (Thermal Design Power)

320W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

3.0

OpenGL

4.6

DirectX

12 Ultimate (12_2)

CUDA

8.6

Stromanschlüsse

2x 8-pin

Shader-Modell

6.6

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Empfohlene PSU (Stromversorgung)

700W

Benchmarks

FP32 (float)

Punktzahl

22.328 TFLOPS

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS

GeForce RTX 5060 Ti 16 GB

24.174 +8.3%

A10M

22.971 +2.9%

CMP 90HX

22.328

Radeon RX 7600

21.315 -4.5%

A100 PCIe 80 GB

19.88 -11%