AMD Radeon 8040S Graphics

AMD Radeon 8040S Graphics
Test der AMD Radeon 8040S Graphics Grafikkarte

Radeon 8040S Grafik: Ryzen AI Max ohne grafisches Max

Die AMD Radeon 8040S Grafik ist die seltsamste Grafikkonfiguration in der Familie Ryzen AI Max. Auf dem Papier gehört sie zur gleichen Plattform wie die leistungsstärkeren Radeon 8050S, 8060S und 8065S, aber in der Praxis ist es ein ganz anderes Produkt.

Die größeren Ryzen AI Max sind interessant, weil sie versuchen, die kleinere dedizierte Grafikkarte durch leistungsstarke integrierte Grafik zu ersetzen. Es gibt viele CU, einen breiten Speicher und einen gemeinsamen Pool von RAM, der für Grafik, Arbeitsaufgaben und lokale AI-Szenarien verwendet werden kann. Die Radeon 8040S bricht mit dieser Idee: Sie hat nur 16 RDNA 3.5 Grafikeinheiten und den 128-Bit LPDDR5X-Speicher der Plattform.

Daher ist es schwierig, die Radeon 8040S losgelöst vom Prozessor zu betrachten. Es handelt sich nicht um eine separate Grafikkarte und auch nicht um eine Massen-iGPU, die AMD in verschiedene Ryzen einbaut. Momentan ist sie tatsächlich an den Ryzen AI Max PRO 380 gebunden. In der normalen Ryzen AI Max 300-Serie ist sie nicht vorhanden, und in der neueren Ryzen AI Max PRO 400-Serie verwenden die kleineren Modelle bereits die Radeon 8050S.

Wäre die Radeon 8040S in einem hypothetischen Ryzen 7 verbaut, würde sie sehr gut passen: moderne RDNA 3.5-Grafik, 16 CU, eine Frequenz von bis zu 2800 MHz, ein gutes Niveau für eine integrierte Lösung. Aber innerhalb des Ryzen AI Max sieht sie umstritten aus, weil die Max-Reihe selbst verspricht, mehr in Bezug auf Grafik zu bieten.

Was offiziell bekannt ist

AMD gibt für die Radeon 8040S Grafik 16 Grafikeinheiten und eine Frequenz von bis zu 2800 MHz an. Diese Grafik wird im Ryzen AI Max PRO 380 verwendet - dem kleineren Chip der Ryzen AI Max PRO 300-Serie. Diese Konfiguration hat 6 CPU-Kerne, 12 Threads, 128-Bit LPDDR5X-Speicher und maximal 64 GB RAM.

Das ist wichtiger, als es scheint. Die Radeon 8040S hat nicht nur die Grafik selbst beschnitten, sondern auch das allgemeine Niveau der Plattform. Die größeren Ryzen AI Max verfügen über mehr Grafikeinheiten und einen breiteren Speicher, wodurch sie die Idee “kompakte Workstation ohne dedizierte GPU” besser umsetzen.

Die Radeon 8040S ist ein anderes Szenario. Hier ist das Hauptargument nicht mehr die Grafik, sondern der CPU, NPU, PRO-Funktionen, Kompaktheit und ausreichende integrierte Grafik. Das heißt, es handelt sich eher um eine Arbeitsplattform ohne dedizierte Grafikkarte, als um den Versuch, eine dedizierte Grafikkarte durch eine integrierte GPU zu ersetzen.

Wo sich die Radeon 8040S in der Grafik der Ryzen AI Max befindet

AMD betrachtet die 8040S / 8050S / 8060S / 8065S nicht als separate Grafikkartenfamilie, aber innerhalb der Ryzen AI Max lassen sie sich bequem vergleichen.

Grafik CU Frequenz Position
Radeon 8040S 16 bis zu 2800 MHz untere Konfiguration
Radeon 8050S 32 bis zu 2800 MHz mittlere Variante
Radeon 8060S 40 bis zu 2900 MHz obere Grafik Ryzen AI Max 300
Radeon 8065S 40 bis zu 3000 MHz obere Grafik Ryzen AI Max PRO 400

Der Unterschied zur Radeon 8050S ist sehr einfach: 16 CU gegen 32 CU. Das heißt, die Radeon 8040S hat halb so viele Grafikeinheiten. Der Abstand zur Radeon 8060S und 8065S ist noch größer: 16 CU gegen 40 CU.

Deshalb kann die 8040S nicht als “fast Ryzen AI Max, nur günstiger” betrachtet werden. Die Architektur mag dieselbe sein, aber der grafische Maßstab ist bereits ein anderer. Es handelt sich nicht um eine abgespeckte Version einer großen Grafik, sondern eher um eine starke reguläre integrierte Grafik innerhalb einer teureren professionellen Plattform.

In welchem Sinne ist die Radeon 8040S sinnvoll

Der Sinn der Radeon 8040S wird deutlich, wenn man sie als Teil eines CPU-first Systems betrachtet. Ein solcher Chip kann sinnvoll in einem kompakten Laptop oder Mini-PC sein, wo man keine dedizierte Grafikkarte installieren möchte, aber einen modernen AMD-Prozessor mit NPU, PRO-Funktionen und normaler integrierter Grafik benötigt.

In diesem Szenario muss die Radeon 8040S nicht die zweite 8050S sein. Ihre Aufgabe ist einfacher: ausreichendes Niveau für alltägliche Grafik, Fotobearbeitung, einfaches Editing, 3D-Ansicht, CAD-Viewport und nicht anspruchsvolle Spiele zu bieten. Für eine Arbeitsmaschine ohne dedizierte Grafikkarte kann das in Ordnung sein.

Aber die Wettbewerbsfähigkeit einer solchen Konfiguration hängt stark vom Preis ab. Wenn das Gerät mit der Radeon 8040S deutlich günstiger ist als die Modelle mit 8050S, macht es Sinn: Der Benutzer wählt die Ryzen AI Max Plattform wegen des CPUs, NPU, der Kompaktheit und der Unternehmensfunktionen. Wenn der Preis jedoch nah an den Versionen mit Radeon 8050S ist, verliert sich der Sinn schnell. In diesem Fall bezahlt der Käufer für Ryzen AI Max, erhält aber eine Grafik, die die Hauptidee von Max nicht erfüllt.

Mit was man die Radeon 8040S vergleichen kann

Die Radeon 8040S ist näher an starken regulären iGPUs als an den leistungsstärkeren Grafikeinheiten der Ryzen AI Max. In Bezug auf die CU-Zahl ähnelt sie der Radeon 880M/890M: Es handelt sich um denselben Maßstab an Grafikleistung, nicht um das Niveau der 8050S oder 8060S.

GPU Klasse Wie zu verstehen
Radeon 840M untere reguläre iGPU deutlich unter der Radeon 8040S
Radeon 880M / 890M starke reguläre iGPU nahes Vergleichsmaß in der Grafikklasse
Radeon 8040S 16 CU RDNA 3.5 untere Grafik Ryzen AI Max
Radeon 8050S 32 CU RDNA 3.5 viel schneller als 8040S
GeForce RTX 3050 Laptop untere dedizierte GPU bequemer für Spiele, CUDA und NVIDIA-Software

Die Hauptidee: Die Radeon 8040S kann nicht anhand des Rufs der größeren Ryzen AI Max bewertet werden. Während die 8050S und 8060S bereits als Alternative zur kleineren dedizierten Grafik diskutiert werden können, ist die 8040S eher eine gute integrierte Grafik für eine Arbeitsplattform, bei der die GPU nicht die Hauptrolle spielt.

Beispielbenchmarks für die Radeon 8040S

Es gibt bisher weniger Ergebnisse für die Radeon 8040S als für die Radeon 8050S, daher sind die Zahlen besser als Orientierung zu verstehen und nicht als garantierter Leistungslevel für jede Systemkonfiguration.

Test Radeon 8040S
Geekbench 6 OpenCL etwa 36-40 Tausend
PassMark G3D etwa 10400
Blender GPU etwa 376

Diese Ergebnisse zeigen keine rekordverdächtige Leistung, sondern den realen Platz der 8040S: über den Basiskonfigurationen integrierter GPUs, aber deutlich unter der Radeon 8050S. Bei Rechen- und Grafiktests liegt sie eher auf dem Niveau einer guten modernen iGPU, nicht auf dem Niveau einer großen Grafik der Ryzen AI Max.

Die praktische Schlussfolgerung ist einfach: Die Radeon 8040S eignet sich für Fotobearbeitung, leichtes Editing, 3D-Ansicht, grundlegende Grafik und nicht anspruchsvolle Spiele. Wenn die Aufgabe tatsächlich von der GPU abhängt, werden die leistungsstärkeren Radeon 8050S / 8060S viel interessanter sein.

Spiele: Spielen ist möglich, aber kaufen für Spiele ist nicht sinnvoll

In Spielen sollte die Radeon 8040S als starke integrierte Grafik betrachtet werden, nicht als Ersatz für eine dedizierte Grafikkarte. E-Sport- und nicht anspruchsvolle Projekte in 1080p sind ihr möglich, aber in modernen AAA-Spielen müssen oft die Einstellungen gesenkt werden.

Das Hauptszenario ist 1080p mit niedrigen oder mittleren Einstellungen, je nach Spiel. In gut optimierten Projekten kann die FPS angenehm sein, aber anspruchsvolle Spiele mit hohen Texturen, Ray Tracing und hohem VRAM-Bedarf zeigen schnell die Grenzen von 16 CU und dem gesamten Systemspeicher auf.

Im Vergleich zur Radeon 8050S wird der Unterschied deutlich sein. Die 8050S hat doppelt so viele CU und normalerweise eine leistungsstärkere Speicherplattform. Wenn also die Gaming-Performance wichtig ist, ist die Radeon 8040S nicht die beste Wahl innerhalb der Ryzen AI Max.

Arbeitsaufgaben und KI

Die Radeon 8040S eignet sich für Fotobearbeitung, einfaches Editing und 3D-Szenenansicht in Blender oder CAD-Anwendungen. Bei schweren Renderarbeiten, großen 3D-Szenen und längeren GPU-Belastungen sind 16 CU bereits zu wenig.

Im Bereich KI kann sie für lokales Inferenz und Experimente in Betracht gezogen werden: PyTorch über ROCm, wo die spezifische Build und Treiber dies unterstützen, ONNX Runtime mit DirectML unter Windows oder llama.cpp über Vulkan/HIP. Ein realistisches Szenario sind kleine oder quantisierte Modelle und kein Training oder keine schnelle Bildgenerierung.

Wenn Arbeitsaufgaben wirklich auf die GPU angewiesen sind, sollte man mindestens die Radeon 8050S / 8060S oder eine dedizierte NVIDIA in Betracht ziehen.

Was wichtig ist vor dem Kauf

Die Radeon 8040S sollte nicht nur deshalb gewählt werden, weil Ryzen AI Max daneben steht. Hier ist die konkrete Konfiguration wichtig: Es handelt sich um den kleineren Ryzen AI Max PRO 380, nicht um die größeren Max-Modelle mit starker Grafik.

Die Hauptbeschränkungen sind:

  • nur 16 CU gegenüber 32 CU der Radeon 8050S;
  • 128-Bit-Speicher der Plattform statt 256-Bit bei größeren Konfigurationen;
  • maximal 64 GB Speicher beim Ryzen AI Max PRO 380;
  • kein separater Videospeicher;
  • geringe Vorhersehbarkeit in CUDA-Software im Vergleich zu NVIDIA;
  • starke Abhängigkeit vom Preis des fertigen Geräts.

Die Radeon 8040S macht Sinn, wenn das Gerät als kompakte Arbeitslösung ohne dedizierte Grafikkarte gekauft wird, bei der der CPU, NPU, PRO-Funktionen und Energieeffizienz im Vordergrund stehen. Ist der Preis jedoch nah an den Modellen mit Radeon 8050S, sollte man gleich auf 8050S schauen: sie entspricht viel besser der eigentlichen Idee von Ryzen AI Max.

Fazit

Die Radeon 8040S Grafik ist Ryzen AI Max ohne vollwertiges grafisches Max. In einem normalen Ryzen würde eine solche integrierte Grafik gut aussehen: 16 CU RDNA 3.5, moderne Architektur, hohe Frequenz und ausreichendes Niveau für alltägliche Grafik. Aber innerhalb des Ryzen AI Max sind die Erwartungen höher.

Diese Konfiguration ist nicht nutzlos, aber ihr Sinn ist eng: eine kompakte Arbeitslösung ohne dedizierte Grafikkarte, bei der CPU, NPU, PRO-Funktionen, Stille und Energieeffizienz wichtiger sind als grafische Leistung.

Wenn jedoch von Ryzen AI Max eine starke GPU erwartet wird, ist die Radeon 8040S zu stark beschnitten. Für Spiele, anspruchsvolles 3D, GPU-Rendering und ernsthafte lokale KI-Aufgaben sollte man mindestens die Radeon 8050S in Betracht ziehen. Andernfalls erhält man eine teure Plattform, der genau der Teil fehlt, wegen dem Ryzen AI Max wirklich “Max” aussieht.

Basic

Markenname
AMD
Plattform
Integrated
Erscheinungsdatum
January 2025
Modellname
AMD Radeon 8040S Graphics
Generation
Radeon 8000S
Boost-Takt
2800 MHz
Bus-Schnittstelle
Integrated
RT-Kerne
16
Einheiten berechnen
16
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
No
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
64
Foundry
TSMC
Prozessgröße
4 nm
Architektur
RDNA 3.5

Speicherspezifikationen

Speichergröße
System Shared
Speichertyp
System Shared LPDDR5x
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
128-bit
Speichertakt
LPDDR5x-8000
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
128 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
90 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
179 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
11.47 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
179.2 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
5.734 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
1024
OpenCL-Version
2.1
OpenGL
4.6
CUDA
No
DirectX
12
Stromanschlüsse
None
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
32
Shader-Modell
6.8

Benchmarks

FP32 (float)
Punktzahl
5.734 TFLOPS
Blender
Punktzahl
376.14
Vulkan
Punktzahl
56877
OpenCL
Punktzahl
40471

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
6.232 +8.7%
5.951 +3.8%
5.59 -2.5%
5.432 -5.3%
Blender
1466 +289.7%
403 +7.1%
45.58 -87.9%
Vulkan
117697 +106.9%
84769 +49%
34145 -40%
13903 -75.6%
OpenCL
84493 +108.8%
63654 +57.3%
23294 -42.4%
11854 -70.7%