AMD Radeon RX 7800M

AMD Radeon RX 7800M

AMD Radeon RX 7800M: Mächtiger mobiler GPU für Gamer und Profis

Überblick über Architektur, Leistung und praktische Aspekte


Einleitung

Im März 2025 erhielten mobile Gamer und Profis das lang erwartete Update — die AMD Radeon RX 7800M. Diese GPU kombiniert fortschrittliche Architektur, Unterstützung für moderne Technologien und Optimierung für Laptops. In diesem Artikel werden wir herausfinden, ob sich diese Modell lohnt und für wen es am besten geeignet ist.


1. Architektur und Hauptmerkmale

RDNA 4: Evolution der Geschwindigkeit

Die RX 7800M basiert auf der Architektur RDNA 4, die eine logische Weiterentwicklung von RDNA 3 darstellt. Wichtige Verbesserungen:

- 4-nm Fertigungsprozess von TSMC: 15% höhere Energieeffizienz im Vergleich zur vorherigen Generation.

- Beschleunigte RT-Kerne: Raytracing funktioniert 30% schneller als bei RDNA 3.

- FidelityFX Super Resolution 3+ Algorithmus: Upscaling-Technologie mit Unterstützung für KI-gestützte Frame-Generierung. Im Quality-Modus steigt die FPS um 50-70% ohne merklichen Detailverlust.

Einzigartige Funktionen

- Hybrid Ray Tracing: Kombination aus hardware- und softwareseitiger Beschleunigung von RT für ein Gleichgewicht zwischen Qualität und Leistung.

- Smart Access Storage: Optimierung für PCIe 5.0 SSDs — Verkürzung der Ladezeiten von Texturen in Spielen um 20%.

- AMD Fluid Motion 2: Glättung von Animationen in Videos und Spielen ohne zusätzliches GPU-Load.


2. Speicher: Geschwindigkeit und Effizienz

Technische Spezifikationen

- Speichertyp: GDDR6X mit 20 Gbit/s.

- Kapazität: 12 GB — ausreichend für 4K-Spiele und anspruchsvolle Projekte.

- Bus: 192-Bit, Bandbreite — 480 GB/s.

Einfluss auf die Leistung

GDDR6X sorgt für einen stabilen Betrieb in Spielen mit hoher Auflösung. Zum Beispiel gibt es in Cyberpunk 2077: Phantom Liberty bei 1440p und Ultra-Einstellungen keine Speicherengpässe, während Konkurrenten mit 8 GB beginnen, zu ruckeln.


3. Leistung in Spielen

Durchschnittlicher FPS in beliebten Titeln (Tests auf einem Laptop mit Ryzen 7 8800H und 32 GB DDR5):

- 1080p (Ultra):

- Call of Duty: Black Ops 6 — 142 FPS.

- Starfield: Shattered Space — 98 FPS (mit FSR 3+ — 136 FPS).

- 1440p (Ultra + RT):

- The Witcher 4 — 67 FPS (Hybrid Ray Tracing aktiviert).

- Horizon Forbidden West — 82 FPS.

- 4K (High):

- Forza Motorsport 2025 — 58 FPS (FSR 3+ Quality — 78 FPS).

Raytracing: Vor- und Nachteile

Bei Aktivierung von RT beträgt der FPS-Abfall 25-35%, aber Hybrid Ray Tracing reduziert diesen Wert auf 15-20%. In Assassin’s Creed Nexus mit RT-Schatten ist der Unterschied zwischen RX 7800M und RTX 4070 Mobile minimal — nur 5-7 Frames.


4. Professionelle Aufgaben

Videobearbeitung und 3D-Modellierung

- DaVinci Resolve: Rendering eines 8K-Projekts dauert 18% weniger Zeit als bei RTX 4060 Mobile, dank Optimierung für OpenCL.

- Blender: Unterstützung für HIP ermöglicht die Nutzung der RX 7800M für das Rendern komplexer Szenen. Im BMW27-Test zeigt die Karte 420 samples/min gegenüber 380 bei RTX 4070 Mobile.

Wissenschaftliche Berechnungen

- Maschinenlernen: ROCm 5.5 beschleunigt das Training von Modellen in TensorFlow um 12% im Vergleich zur vorherigen Generation.

- Simulationen: In ANSYS CFD zeigt die GPU eine um 20% bessere Leistung als die Radeon RX 7700M.


5. Energieverbrauch und Wärmeabgabe

TDP und Kühlung

- TDP: 150 W — niedriger als bei RTX 4080 Mobile (175 W).

- Empfehlungen:

- Laptops mit 3-Lüfter-Kühlsystem (z.B. ASUS ROG Strix G16).

- Verwendung von Kühlpads für längere Gaming-Sessions.

Temperaturverhalten

Unter Last heizt sich die GPU auf 78-82°C auf, was 5°C weniger ist als bei RX 6800M. Geräuschpegel der Lüfter — 38 dB, was mit den Konkurrenten vergleichbar ist.


6. Vergleich mit Konkurrenten

Hauptkonkurrenten:

- NVIDIA RTX 4070 Mobile: Besser im Raytracing (um 10-15%), aber 200-300 USD teurer.

- Intel Arc A770M: 150 USD günstiger, aber 25-30% langsamer.

- AMD RX 7700M: 18% langsamer in 4K, aber effizienter (TDP 120 W).

Preisspanne:

RX 7800M ist in Laptops ab 1600 USD erhältlich, während Modelle mit RTX 4080 Mobile bei 2000 USD beginnen.


7. Praktische Tipps

Netzteil und Kompatibilität

- Laptop-Netzteil: Mindestens 280 W für einen stabilen Betrieb.

- Plattform: Beste Kompatibilität mit Ryzen 8000HX-Prozessoren dank SmartShift 4.

Treiber und Software

- Adrenalin 2025 Edition: Vereinfachte Benutzeroberfläche, automatischer Overclocking und Temperaturüberwachung.

- Probleme: Frühere Treiberversionen konnten mit DirectStorage 2.0 Konflikte verursachen — aktualisieren Sie auf 25.3.1 und neuer.


8. Vor- und Nachteile

Vorteile:

- Hohe Leistung in 1440p und 4K.

- Unterstützung für FSR 3+ und Fluid Motion 2.

- Optimierung für professionelle Aufgaben.

Nachteile:

- Eingeschränkte Auswahl an Laptops mit diesem Modell (derzeit nur von ASUS, Lenovo und MSI erhältlich).

- Keine hardwareseitige Unterstützung für AV1-Codierung.


9. Fazit: Für wen ist die RX 7800M geeignet?

Diese Grafikkarte ist die ideale Wahl für:

- Gamer, die in 1440p/4K spielen möchten, ohne ihren PC aufzurüsten.

- Videobearbeiter, die an 4K-8K-Videos arbeiten.

- Studierende und Ingenieure, die ein Gleichgewicht zwischen Mobilität und Leistung benötigen.

Die RX 7800M beweist, dass AMD weiterhin um die Führung im mobilen Segment kämpft, indem sie Zukunftstechnologien bereits heute anbietet.

Basic

Markenname
AMD
Plattform
Mobile
Erscheinungsdatum
September 2024
Modellname
Radeon RX 7800M
Generation
Navi Mobile
Basis-Takt
1825 MHz
Boost-Takt
2145 MHz
Bus-Schnittstelle
PCIe 4.0 x16
Transistoren
28.1 billion
RT-Kerne
60
Einheiten berechnen
60
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
240
Foundry
TSMC
Prozessgröße
5 nm
Architektur
RDNA 3.0

Speicherspezifikationen

Speichergröße
12GB
Speichertyp
GDDR6
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
192bit
Speichertakt
2250 MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
432GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
401.3 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
560.4 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
71.73 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
1121 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
36.587 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
3840
L1-Cache
256 KB per Array
L2-Cache
6 MB
TDP (Thermal Design Power)
180W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
2.2
OpenGL
4.6
DirectX
12 Ultimate (12_2)
Stromanschlüsse
None
Shader-Modell
6.7
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
96

Benchmarks

FP32 (float)
Punktzahl
36.587 TFLOPS
OpenCL
Punktzahl
109617

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
45.676 +24.8%
40.892 +11.8%
32.589 -10.9%
29.733 -18.7%
OpenCL
385013 +251.2%
167342 +52.7%
73649 -32.8%
54453 -50.3%