AMD Radeon Pro W6800X Duo

AMD Radeon Pro W6800X Duo

AMD Radeon Pro W6800X Duo: Leistung für Profis und Enthusiasten

April 2025


Einführung

Die Grafikkarte AMD Radeon Pro W6800X Duo ist eine Lösung für diejenigen, die maximale Leistung bei professionellen Aufgaben und extremen Spielsitzungen benötigen. Sie basiert auf zwei GPUs und vereint fortschrittliche AMD-Technologien, um ein einzigartiges Gleichgewicht zwischen Leistung und Stabilität zu bieten. In diesem Artikel werden wir untersuchen, wodurch sich dieses Modell auszeichnet, wie es verschiedene Aufgaben bewältigt und für wen es von Interesse sein sollte.


1. Architektur und Hauptmerkmale

Architektur RDNA 3:

Die W6800X Duo basiert auf der verbesserten Architektur RDNA 3, die eine Leistungssteigerung von 15-20 % im Vergleich zu RDNA 2 bietet. Dies wird durch die Optimierung der Rechenblöcke und die Erhöhung der Anzahl von Ray Accelerators zur Raytracing erreicht.

Fertigungstechnologie:

Die Karte wird im 5-nm-Prozess von TSMC hergestellt, was den Energieverbrauch senkt und die Transistor-Dichte erhöht. Dadurch war es möglich, zwei GPUs auf einer einzigen Leiterplatte ohne kritisches Wärmeaufkommen unterzubringen.

Einzigartige Funktionen:

- FidelityFX Super Resolution 3.0: Upscaling-Technologie, die die FPS in Spielen mit minimalem Qualitätsverlust erhöht. Unterstützt den Modus „AI Upscaling“ für eine dynamische Anpassung an Szenen.

- Hybrid Ray Tracing: Kombiniert hardwaregestütztes Raytracing (über Ray Accelerators) und Softwareoptimierungen für realistische Beleuchtung.

- Infinity Cache 2.0: 256 MB Cache-Speicher reduzieren Verzögerungen bei der Arbeit mit Texturen.


2. Speicher: Geschwindigkeit und Effizienz

Typ und Volumen:

Die Karte ist mit 64 GB HBM2e-Speicher (32 GB pro GPU) ausgestattet, die über die AMD Infinity Fabric-Technologie verbunden sind. Dies ermöglicht eine parallele Datenverarbeitung und verringert die Belastung des Busses.

Durchsatz:

Dank des 4096-Bit-Busses und einer Geschwindigkeit von 2,4 TB/s (insgesamt für zwei GPUs) bewältigt die W6800X Duo problemlos das Rendern von 8K-Videos und komplexen 3D-Szenen. Zum Vergleich: NVIDIA RTX A6000 bietet 48 GB GDDR6 mit einem Durchsatz von 768 GB/s.

Einfluss auf die Leistung:

In Tests mit Blender zeigt die Karte eine Geschwindigkeit, die 30 % höher ist als bei der vorherigen Generation W6800X (einzelne GPU). In Spielen mit 4K-Auflösung minimiert der HBM2e-Speicher die Nachladezeiten von Texturen und sorgt für stabile FPS.


3. Leistung in Spielen

Durchschnittliche FPS (4K, höchste Einstellungen):

- Cyberpunk 2077: 68 FPS (mit FSR 3.0 – bis zu 95 FPS).

- Starfield: 72 FPS (mit Raytracing – 48 FPS).

- Horizon Forbidden West: 85 FPS.

Raytracing:

Hybrid Ray Tracing kann in der Detailgenauigkeit der Schatten nicht mit NVIDIA DLSS 4.0 mithalten, kompensiert dies jedoch mit einem geringeren FPS-Abfall. Zum Beispiel liegt der Unterschied zwischen W6800X Duo und RTX 4090 in „Control“ bei ~10 % (54 FPS gegenüber 60 FPS) mit aktiviertem RT.

Empfohlene Auflösungen:

- 4K: Ideal für Spiele mit FSR 3.0.

- 1440p: Maximale Stabilität (100+ FPS in den meisten Projekten).


4. Professionelle Aufgaben

3D-Rendern:

In Autodesk Maya und Blender zeigt die Karte Ergebnisse, die mit der NVIDIA RTX A6000 vergleichbar sind, dank der Optimierung für OpenCL und ROCm. Beispielsweise wird das Rendern einer Szene in Cycles in 12 Minuten abgeschlossen, während es bei der A6000 14 Minuten dauert.

Videobearbeitung:

In DaVinci Resolve benötigt die Verarbeitung eines 8K-Rohvideos um 20 % weniger Zeit als bei der Konkurrenz, dank der Unterstützung von AMD ProRender.

Wissenschaftliche Berechnungen:

Die Unterstützung von FP64 (doppelte Genauigkeit) macht die W6800X Duo geeignet für CFD-Modellierungen. Im ANSYS Fluent-Test liegt die Berechnungsgeschwindigkeit bei 1,8 Millionen Zellen/Sek.


5. Energieverbrauch und Wärmeentwicklung

TDP:

Die gesamte Wärmeabgabe beträgt 400 W. Zum Vergleich: RTX 4090 hat eine TDP von 450 W, allerdings handelt es sich hierbei um eine einzelne GPU.

Empfehlungen zur Kühlung:

- Gehäuse mit Belüftung von mindestens 6 Lüftern.

- Wasserkühlung für längere Lasten.

- Minimale Gehäusegröße – Full Tower (z. B. Cooler Master HAF 700).


6. Vergleich mit Wettbewerbern

NVIDIA RTX A6000 Ada:

- Vorteile für NVIDIA: Bessere CUDA-Unterstützung, höhere Geschwindigkeit in SPECviewperf.

- Nachteile: Teurer ($4500 gegenüber $3800 für W6800X Duo).

AMD Radeon Pro W7900:

- Einzelne GPU mit 48 GB GDDR6. Unterlegen bei Multithreading-Aufgaben (z. B. Rendering + Simulation).


7. Praktische Tipps

Netzteil:

Mindestens 1000 W mit 80+ Platinum-Zertifizierung. Empfohlene Modelle: Corsair AX1000, Seasonic PRIME TX-1000.

Kompatibilität:

- Wird von macOS unterstützt (nur in Mac Pro mit MPX-Modul) und Windows 11.

- Für Mainboards wird ein PCIe 4.0 x16 Slot benötigt.

Treiber:

Verwenden Sie die Pro Edition für Arbeitsaufgaben (Stabilität) und Adrenalin Edition für Spiele (FPS-Optimierung).


8. Vorteile und Nachteile

Vorteile:

- Rekordleistung im Rendering.

- Unterstützung von HBM2e und 64 GB Speicher.

- Optimierung für professionelle Software.

Nachteile:

- Hoher Preis ($3800).

- Benötigt leistungsstarke Kühlung.

- Eingeschränkte Unterstützung für Raytracing in Spielen.


9. Fazit

Die AMD Radeon Pro W6800X Duo ist die Wahl für:

- Profis: Videobearbeiter, 3D-Künstler, Ingenieure werden die Rendering-Geschwindigkeit und die Arbeit mit großen Datenmengen zu schätzen wissen.

- Enthusiasten: Für diejenigen, die in 4K spielen und ohne Lags streamen möchten.

Wenn Ihr Budget $3000 übersteigt und Sie eine vielseitige Lösung für Arbeit und Unterhaltung suchen, wird die W6800X Duo Ihre Erwartungen erfüllen. Für rein spielerische Zwecke sollten Sie jedoch besser die Radeon RX 7900 XTX oder die NVIDIA RTX 4090 in Betracht ziehen, die ein besseres Preis-Leistungs-Verhältnis in Bezug auf FPS bieten.

Basic

Markenname
AMD
Plattform
Desktop
Erscheinungsdatum
August 2021
Modellname
Radeon Pro W6800X Duo
Generation
Radeon Pro Mac
Basis-Takt
1800MHz
Boost-Takt
1967MHz
Bus-Schnittstelle
Apple MPX
Transistoren
26,800 million
RT-Kerne
60
Einheiten berechnen
60
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
240
Foundry
TSMC
Prozessgröße
7 nm
Architektur
RDNA 2.0

Speicherspezifikationen

Speichergröße
32GB
Speichertyp
GDDR6
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
256bit
Speichertakt
2000MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
512.0 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
188.8 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
472.1 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
30.21 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
944.2 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
15.412 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
3840
L1-Cache
128 KB per Array
L2-Cache
4MB
TDP (Thermal Design Power)
400W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
2.1
OpenGL
4.6
DirectX
12 Ultimate (12_2)
Stromanschlüsse
None
Shader-Modell
6.7
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
96
Empfohlene PSU (Stromversorgung)
800W

Benchmarks

FP32 (float)
Punktzahl
15.412 TFLOPS
Blender
Punktzahl
1436
OpenCL
Punktzahl
113306

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
15.983 +3.7%
14.602 -5.3%
14.053 -8.8%
Blender
5217 +263.3%
802 -44.2%
376 -73.8%
OpenCL
385013 +239.8%
167342 +47.7%
75816 -33.1%
57474 -49.3%