AMD Radeon 8060S Graphics

AMD Radeon 8060S Graphics
Test der AMD Radeon 8060S Graphics Grafikkarte

AMD Radeon 8060S Grafik: integrierte Grafik für die AI-Plattform von AMD

Die AMD Radeon 8060S Grafik ist nicht nur eine leistungsstarke integrierte Grafik für Spiele. Vielmehr ist sie als grafischer Teil der Ryzen AI Max-Plattform zu betrachten, mit der AMD versucht, im Segment der lokalen AI-Computer Fuß zu fassen.

Im Bereich AI bleibt AMD weiterhin ein Nachzügler. NVIDIA hat CUDA, ein ausgereiftes Ökosystem von Frameworks und breite Unterstützung in professioneller Software. Ryzen AI Max ändert an diesem Vorteil nichts und macht die Radeon 8060S nicht zu einem Allround-Ersatz für RTX. AMD setzt auf eine andere Strategie: einen großen gemeinsamen Speicherkreis, leistungsstarke RDNA-Grafik, einen starken CPU und NPU in einem Gehäuse.

Deshalb darf die Radeon 8060S nicht nur anhand von FPS bewertet werden. In Spielen wirkt sie für integrierte Grafik tatsächlich ungewöhnlich stark, aber der Hauptzweck von Ryzen AI Max ist lokales AI. Große Modelle werden auf einem solchen Gerät nicht von Grund auf trainiert, können aber lokal ausgeführt, zur Inferenz verwendet, Pipelines getestet und zur Bildgenerierung verwendet werden, wobei kleines Nachtraining dort möglich ist, wo genügend Speicher vorhanden ist und der benötigte Stack unterstützt wird.

Warum die Radeon 8060S für Ryzen AI Max wichtig ist

Übliche integrierte Grafik stößt oft nicht nur an die Anzahl der Rechenblöcke, sondern auch an die Speicherkapazität. Selbst starke iGPUs stoßen schnell auf Engpässe in der Bandbreite und im verfügbaren Volumen. Ryzen AI Max ist anders aufgebaut: Die Radeon 8060S arbeitet nicht mit separatem VRAM, sondern mit dem gemeinsamen Speicher der gesamten Plattform.

Das macht sie jedoch nicht automatisch schneller als eine diskrete Grafikkarte. Aber es verändert die Klasse der Aufgaben, in denen solche Grafik sinnvoll ist. Für Spiele ist FPS wichtig, während für AI oft der verfügbare Speicher entscheidend ist. Wenn ein Modell oder ein großer Kontext nicht in 8 GB VRAM passt, hilft die Rechenleistung nicht mehr. Ryzen AI Max versucht gerade, dem Client-Gerät einen großen gemeinsamen Speicherpool zur Verfügung zu stellen, um große Modelle und AI-Lasten ohne separate Grafikkarte auszuführen.

Im Ryzen AI Max+ 395 erhält die Radeon 8060S 40 Grafikkerne, eine Frequenz von bis zu 2900 MHz, 256-Bit LPDDR5x-8000-Speicher der Plattform und Konfigurationen mit bis zu 128 GB Gesamtspeicher. AMD gibt zudem bis zu 126 TOPS allgemeine AI-Leistung an, einschließlich NPU mit bis zu 50 TOPS. Für integrierte Grafik ist das schon ein ganz anderer Maßstab.

Die Radeon 8060S ist hier nicht „eine Einbaulösung der zweiten Wahl“, sondern ein Grund für die Existenz der gesamten Plattform. AMD versucht nicht, NVIDIA direkt in der CUDA-Software zu schlagen. Das Unternehmen geht einen anderen Weg: Es bietet eine kompakte AI-Maschine in Form eines Laptops, Mini-PCs oder einer Workstation an, bei der ein großer gemeinsamer Speicher genauso wichtig ist wie die grafische Leistung selbst.

Wo die Radeon 8060S in der Reihe steht

Die Radeon 8060S wird in den leistungsstärkeren Chips der Ryzen AI Max 300-Serie verwendet, darunter Ryzen AI Max+ 395, Ryzen AI Max+ PRO 395, Ryzen AI Max+ 392 und Ryzen AI Max+ 388. Dies stellt die vollständige grafische Variante von Strix Halo 300 dar.

Darunter stehen die Radeon 8050S und die Radeon 8040S. Bei der Radeon 8050S ist der grafische Teil erheblich reduziert, während die Radeon 8040S noch schwächer ist. Der Unterschied zwischen ihnen ist nicht kosmetisch: Es sind unterschiedliche Ebenen von iGPU innerhalb einer Plattformidee.

Nach der Einführung der Radeon 8065S muss der Status der 8060S genauer beschrieben werden. Die Radeon 8060S ist die prominente Grafik der Ryzen AI Max 300-Serie, jedoch nicht mehr das absolute Maximum der gesamten AMD-Reihe. Die Radeon 8065S in Ryzen AI Max PRO 400 verwendet denselben breiten Grafikblock, erhält jedoch eine höhere Frequenz und eine neuere Plattform mit einem erhöhten Grenzwert für den gemeinsamen Speicher.

Benchmarks: schon keine gewöhnliche iGPU mehr

In synthetischen Tests präsentiert sich die Radeon 8060S nicht als typische integrierte Grafik, sondern als Konkurrent der mobilen diskreten GPUs der Mittelklasse. Laut Notebookcheck liegt sie etwa zwischen der GeForce RTX 4060 Laptop und der RTX 4070 Laptop, abhängig vom Test und dem spezifischen Gerät.

Test Radeon 8060S RTX 4060 Laptop RTX 4070 Laptop
3DMark Time Spy ~10842 ~10250 ~11732
3DMark Time Spy Graphics ~10946 ~9943 ~11609

Diese Zahlen sind wichtig als Orientierung, aber sie sollten nicht als Versprechen eines RTX 4070-Niveaus in allen Laptops gelesen werden. Die Radeon 8060S bleibt eine integrierte Grafik mit gemeinsamem Speicher. Ihre Leistung hängt vom Leistungsgrenzwert, der Kühlung, dem Gehäuse und den Einstellungen des Herstellers ab. In einem gut gekühlten Gerät könnte die Radeon 8060S in der Nähe einer mobilen RTX 4060 liegen, aber in einem kompakten Gehäuse wird das Ergebnis niedriger sein.

Für Spiele ist das praktische Niveau klar: 1080p ist der Hauptmodus, oft mit mittleren oder hohen Einstellungen. 1440p ist in weniger anspruchsvollen Spielen oder mit FSR möglich. 4K und anspruchsvolles Raytracing sind nicht ihr Gebiet. Die Stärke der Radeon 8060S liegt nicht darin, dass sie diskrete Grafikkarten ersetzt, sondern darin, dass integrierte Grafik erstmals ein ernsthaftes Argument in einer teuren APU-Plattform darstellt.

AI: der Hauptzweck der Plattform

Der wichtigste Teil von Ryzen AI Max sind lokale AI-Aufgaben. AMD bewirbt den Ryzen AI Max+ 395 gerade als Plattform für generatives AI: mit großem gemeinsamem Speicher, Radeon 8060S, der Ausführung von LLM und Bildgenerierung auf dem Gerät.

In den Materialien von AMD werden Stable Diffusion 3.5 Large, Phi-4 14B, DeepSeek-R1-Distill-Llama-70B, ONNX-GenAI, Ollama und Amuse erwähnt. Es sind zudem 128 GB gemeinsamer Speicher und bis zu 112 GB verfügbarer Speicher für die GPU angegeben. Das ist nicht nur ein Marketing-Satz wie „AI“: ein großer gemeinsamer Speicherpool verändert tatsächlich, welche Modelle auf einem Client-Gerät ausgeführt werden können.

Dabei sollte die Radeon 8060S nicht überbewertet werden. Sie ist kein Beschleuniger für das Training großer Modelle von Grund auf, kein Ersatz für serverseitige GPUs, und keine magische Kompatibilität mit aller AI-Software. Der Sinn der Plattform liegt woanders: das lokale Ausführen großer Modelle, Inferenz, lokale Assistenten, Bildgenerierung, Pipeline-Tests, kleines Training oder Nachtraining dort, wo genügend Speicher verfügbar ist und wo ROCm, PyTorch oder ein anderer Backend bereits die benötigte Konfiguration unterstützt.

Für lokales AI könnte dieser Ansatz wichtiger sein als eine herkömmliche diskrete Grafikkarte mit begrenztem VRAM. In den unterstützten Aufgaben ist RTX oft schneller, aber wenn das Modell nicht in den Speicher passt, löst die Geschwindigkeit das Problem nicht. Ryzen AI Max versucht, in ein Client-Format zu bringen, was zuvor häufig eine separate Workstation erforderte: einen großen lokalen Speicherpool für Modelle und AI-Lasten.

ROCm, PyTorch und Einschränkungen

Hier hat AMD einen wichtigen Vorteil: ROCm für Ryzen AI Max wird allmählich zur Realität und nicht nur zu einem Versprechen. In der offiziellen Matrix ROCm 7.2.1 werden gfx1151 und Ryzen AI Max+ 395 angegeben, und für PyTorch 2.9.1 + ROCm 7.2.1 ist eine offizielle Produktionsunterstützungs-Konfiguration angekündigt. Dabei ist offiziell nur FP16 validiert, während andere Datentypen möglicherweise funktionieren, aber nicht garantiert werden.

Das ist eine wichtige Einschränkung. In einem Szenario kann ein Modell die Radeon 8060S über ROCm oder PyTorch normal nutzen, während in einem anderen Werkzeug Umgehungen erfordern kann, nur über die CPU funktionieren kann oder die iGPU überhaupt nicht als geeigneten Beschleuniger erkennt. Daher muss die Kompatibilität für jedes spezifische Betriebssystem, jede ROCm-Version, PyTorch, jedes Modell und jede Art von Berechnungen überprüft werden.

Die Radeon 8060S ist nicht als universeller AI-Beschleuniger für jede Software stark, sondern als Teil einer Plattform, in der AMD auf gemeinsamen Speicher, ROCm, ONNX, DirectML, Ollama, Amuse und lokale Modelle setzt. Die Hardware ist sehr interessant, aber der Software-Stack hinkt noch hinterher.

Was unterscheidet sie von der Radeon 8065S?

Die Radeon 8065S entwertet die Radeon 8060S nicht, sondern verschiebt ihre Positionierung. Die 8060S bleibt die leistungsstarke Grafik der Generation Ryzen AI Max 300, während die 8065S eine aktuellere Variante für Ryzen AI Max PRO 400 wird.

Der Hauptunterschied liegt nicht in der Idee des GPUs selbst, sondern in der Plattform. Für Ryzen AI Max+ PRO 495 werden Radeon 8065S Graphics angegeben, 40 Grafikkerne, eine Frequenz von bis zu 3000 MHz, LPDDR5x-8533 und bis zu 192 GB Speicher. Für Spiele wird das wahrscheinlich keinen dramatischen Unterschied machen, aber für lokales AI ist zusätzlicher Speicher wichtiger als ein geringer Frequenzgewinn.

Deshalb ist die Radeon 8060S nach dem Erscheinen der 8065S nicht schwächer geworden. Ihr Platz ist einfach klarer: Sie ist eine leistungsstarke iGPU der ersten Generation von Ryzen AI Max, nicht die Spitze der gesamten neuen Reihe.

Der größte Nachteil - Preis und Nischenmarkt

Die Radeon 8060S kann nicht separat gekauft werden. Sie ist Teil der teuren Ryzen AI Max-Plattform, daher hängt ihr Wert immer vom Preis des gesamten Geräts ab.

Wenn nur ein Gaming-Laptop benötigt wird, könnte ein Modell mit diskreter RTX 4060 oder RTX 4070 klarer sein: separater Grafikspeicher, DLSS, ein vertrauterer Gaming- und professioneller Stack. Aber wenn ein kompakter Computer mit starkem CPU, großem gemeinsamen Speicher und der Möglichkeit, lokale AI-Modelle auszuführen, benötigt wird, beginnt Ryzen AI Max, wesentlich interessanter auszusehen.

Es handelt sich nicht um eine massenmarkttaugliche Plattform „für alle“. Es ist ein teures und nischenspezifisches Unterfangen von AMD, um in den lokalen AI-Markt auf einen anderen Weg einzutreten: nicht über ein reifes CUDA-Ökosystem, sondern über einen großen gemeinsamen Speicherpool und die Integration von CPU, GPU und NPU in einem Chip. CUDA bleibt die Plattform von NVIDIA, weshalb CUDA-abhängige Software für die Radeon 8060S kein Ziel-Szenario ist.

Fazit

Die AMD Radeon 8060S Grafik demonstriert, warum AMD überhaupt Ryzen AI Max entwickelt hat: nicht für eine weitere iGPU für Spiele, sondern für eine Client-AI-Plattform, auf der große Modelle lokal ausgeführt, mit Bildgenerierung, ONNX, Ollama, ROCm und PyTorch-Szenarien ohne separate Grafikkarte gearbeitet werden kann.

Die Radeon 8060S ersetzt nicht diskrete GPUs in allen Aufgaben und verwandelt einen Laptop nicht in einen Server zum Trainieren großer Modelle. Sie macht jedoch Ryzen AI Max zu einer der ungewöhnlichsten APU-Plattformen der letzten Jahre: einem kompakten System, in dem ein großer gemeinsamer Speicher ebenso wichtig wird wie die grafische Leistung selbst.

Basic

Markenname
AMD
Plattform
Integrated
Erscheinungsdatum
January 2025
Modellname
AMD Radeon 8060S Graphics
Generation
Radeon 8000S
Boost-Takt
2900 MHz
Bus-Schnittstelle
Integrated
RT-Kerne
40
Einheiten berechnen
40
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
No
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
160
Foundry
TSMC
Prozessgröße
4 nm
Architektur
RDNA 3.5

Speicherspezifikationen

Speichergröße
System Shared
Speichertyp
System Shared LPDDR5x
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
256-bit
Speichertakt
LPDDR5x-8000
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
256 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
186 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
464 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
29.7 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
464 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
14.85 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
2560
OpenCL-Version
2.1
OpenGL
4.6
DirectX
12
CUDA
No
Stromanschlüsse
None
Shader-Modell
6.8
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
64

Benchmarks

Shadow of the Tomb Raider 2160p
Punktzahl
38 fps
Shadow of the Tomb Raider 1440p
Punktzahl
80 fps
Shadow of the Tomb Raider 1080p
Punktzahl
115 fps
Cyberpunk 2077 2160p
Punktzahl
16 fps
Cyberpunk 2077 1440p
Punktzahl
38 fps
Cyberpunk 2077 1080p
Punktzahl
65 fps
FP32 (float)
Punktzahl
14.85 TFLOPS
3DMark Steel Nomad
Punktzahl
2038
3DMark Time Spy
Punktzahl
10010
Blender
Punktzahl
1335.18
Vulkan
Punktzahl
87196
OpenCL
Punktzahl
94271

Im Vergleich zu anderen GPUs

Shadow of the Tomb Raider 2160p / fps
73 +92.1%
45 +18.4%
26 -31.6%
Shadow of the Tomb Raider 1440p / fps
157 +96.3%
103 +28.8%
63 -21.3%
Shadow of the Tomb Raider 1080p / fps
214 +86.1%
163 +41.7%
94 -18.3%
70 -39.1%
Cyberpunk 2077 2160p / fps
66 +312.5%
33 +106.3%
Cyberpunk 2077 1440p / fps
74 +94.7%
42 +10.5%
11 -71.1%
Cyberpunk 2077 1080p / fps
118 +81.5%
85 +30.8%
68 +4.6%
21 -67.7%
FP32 (float) / TFLOPS
15.983 +7.6%
15.562 +4.8%
14.413 -2.9%
3DMark Time Spy
19416 +94%
12617 +26%
5781 -42.2%
3DMark Steel Nomad
2093 +2.7%
2088 +2.5%
2003 -1.7%
Blender
2323 +74%
721.37 -46%
363.3 -72.8%
Vulkan
195059 +123.7%
120050 +37.7%
60353 -30.8%
34688 -60.2%
OpenCL
191319 +102.9%
134417 +42.6%
69319 -26.5%
48679 -48.4%