AMD Radeon 8065S Graphics

AMD Radeon 8065S Graphics
Test der AMD Radeon 8065S Graphics Grafikkarte

AMD Radeon 8065S Grafiken: die leistungsstärkere iGPU Ryzen AI Max PRO für lokales AI

AMD Radeon 8065S Grafiken - die leistungsstärkere integrierte Grafik für die Plattform Ryzen AI Max PRO 400. Bezüglich der GPU gibt es jedoch keinen signifikanten Sprung im Vergleich zur Radeon 8060S. Der Grafikblock bleibt ähnlich: 40 CU in der RDNA 3.5 Architektur, jedoch ist die Taktfrequenz auf 3000 MHz gestiegen. Der Hauptunterschied liegt nicht in diesen zusätzlichen 100 MHz, sondern in der Plattform, die sich um sie herum entwickelt hat.

Die Radeon 8065S erscheint in Ryzen AI Max+ PRO 495 - der aktualisierten Version des großen AMD APU für lokales AI, kompakte Workstations und professionelle Systeme. Hier verschiebt AMD den Fokus noch stärker von Spielen hin zu AI: bis zu 192 GB Unified Memory, bis zu 160 GB Shared Memory, die als GPU-Speicher genutzt werden können, und die NPU erreicht bis zu 55 TOPS, während die Gesamtkapazität der AI-Plattform 131 TOPS erreicht.

Es handelt sich hierbei nicht mehr nur um ein Gaming-Produkt. Die Radeon 8065S ist wichtig als Teil einer Plattform, auf der AMD versucht, sein Territorium im Bereich lokales AI zu erweitern: ein kompaktes Gerät mit einem großen gemeinsamen Speicherkontingent, einem starken CPU, leistungsstarker RDNA-Grafik und NPU ohne separate dedizierte Grafikkarte anzubieten.

Warum die Radeon 8065S wichtig ist

Die Radeon 8065S hat keinen eigenen GDDR6-Speicher wie eine dedizierte Grafikkarte. Sie arbeitet mit dem gemeinsamen Speicher der gesamten Plattform. Für einen normalen Gaming-GPU könnte das wie eine Einschränkung erscheinen, aber für lokales AI ist die Situation komplexer: Hier entscheidet häufig nicht nur die Geschwindigkeit, sondern auch das Volumen des verfügbaren Speichers.

Wenn ein Modell oder Kontext nicht in den verfügbaren Videospeicher passt, hilft eine hohe GPU-Geschwindigkeit nicht mehr: Die Aufgabe kann entweder nicht ordnungsgemäß gestartet werden oder erfordert erhebliche Kompromisse. Der Ryzen AI Max PRO 400 versucht genau diese Lücke zu schließen. Die Plattform bietet dem Client-Gerät einen großen lokalen Speicherpool für LLM, Bildgenerierung, langen Kontext und mehrere AI-Aufgaben gleichzeitig.

AMD gibt die Möglichkeit an, lokale Modelle mit mehr als 300 Milliarden Parametern bei 4-Bit-Quantisierung auszuführen. Das bedeutet nicht, dass ein solches Computer-Setup einen Server mit professionellen Beschleunigern ersetzt. Aber für ein Laptop, Mini-PC oder kompakte Workstation ist das eine ernsthafte Ansage: Große Modelle können nicht nur theoretisch diskutiert, sondern tatsächlich lokal mit dem passenden Software-Stack ausgeführt werden.

8065S gegen 8060S: der Hauptunterschied liegt in der Plattform

Die Radeon 8065S ist ein naher Verwandter der Radeon 8060S. Die Anzahl der CUs bleibt gleich, die Architektur ist die gleiche und der Taktanstieg ist gering. Daher verspricht der Wechsel von 8060S zu 8065S allein keinen signifikanten Anstieg der FPS.

Parameter Radeon 8060S Radeon 8065S
Architektur RDNA 3.5 RDNA 3.5
Grafikblöcke 40 CU 40 CU
GPU-Frequenz bis zu 2900 MHz bis zu 3000 MHz
Plattform Ryzen AI Max 300 Ryzen AI Max PRO 400
Maximales Unified Memory bis zu 128 GB bis zu 192 GB
Speicher verfügbar für GPU bis zu 112 GB bis zu 160 GB

Ein Vergleich nur anhand der Frequenz lässt das Hauptunterscheidungsmerkmal - das Plattform-Limits des Speichers - außer Acht. Für Spiele wird der Unterschied zwischen 8060S und 8065S wahrscheinlich moderat sein. Für lokales AI ist der Anstieg des Unified Memory von 128 auf 192 GB wichtiger als die geringe Steigerung der GPU-Frequenz.

Erwartetes Gaming-Niveau

Bislang gibt es nur wenige unabhängige Daten zur Radeon 8065S, weshalb es sinnvoll ist, das Gaming-Niveau über die Radeon 8060S und den kleinen Unterschied in der Frequenz zu bewerten. In der Konfiguration sind dies sehr ähnliche GPUs: Die 8065S hat den gleichen breiten 40-CU-Block, jedoch mit etwas höherer Frequenz. Daher wird der Gaming-Zuwachs im Vergleich zur 8060S wahrscheinlich gering sein: 100 MHz mehr verwandeln diese Grafik nicht in eine neue Klasse.

Das praktische Szenario bleibt folgendermassen:

  • 1080p - Hauptmodus, oft mit mittleren oder hohen Einstellungen;
  • 1440p - möglich in weniger anspruchsvollen Spielen oder mit FSR;
  • 4K - eher für ältere und leichtere Projekte;
  • Ray Tracing - wird unterstützt, ist aber nicht die Stärke dieser iGPU.

Die Radeon 8065S sollte nicht als direkte Alternative zu Mobilen RTX dargestellt werden. Es handelt sich um eine integrierte Grafik mit gemeinsamem Speicher, und ihr Ergebnis hängt von den Leistungsgrenzen, der Kühlung und dem spezifischen Gerät ab. In Spielen bleibt die Radeon 8065S eine ungewöhnlich starke iGPU, während im Bereich AI der Hauptgewinn nicht die Frequenz, sondern der Zugang zu einem großen Volumen an gemeinsamem Speicher ist.

AI: Das Hauptszenario Ryzen AI Max PRO 400

Der Ryzen AI Max PRO 400 ist deutlich stärker auf lokales AI ausgerichtet als auf die Rolle einer herkömmlichen Spielplattform. CPU, GPU, NPU und Unified Memory arbeiten als Teile einer einzigen APU-Plattform und nicht als separate Komponenten mit unterschiedlichen Speicher-Pools.

Die Radeon 8065S könnte für solche Aufgaben interessant sein:

  • Ausführung lokaler LLM, insbesondere wenn Modelle nicht in 8-12 GB VRAM passen;
  • Inferenz und Testen von AI-Pipelines;
  • Arbeiten mit langem Kontext;
  • Bildgenerierung und Diffusionsmodelle;
  • Lokale AI-Agenten und automatisierte Szenarien;
  • PyTorch/ROCm, ONNX, Ollama, llama.cpp, Amuse und andere Werkzeuge - vorausgesetzt, sie werden von der spezifischen Konfiguration unterstützt.

Das Training großer Modelle von Grund auf bleibt eine Aufgabe für Server-Beschleuniger. Aber Ausführung, Testen, lokale Entwicklung, leichtes Fine-Tuning und Arbeiten mit Modellen, die nicht in eine typische mobile Grafikkarte passen, ist genau dort, wo der Ryzen AI Max+ PRO 495 und die Radeon 8065S besonders interessant erscheinen.

ROCm, PyTorch und Einschränkungen

Die Stärke dieser Plattform liegt nicht in der Kompatibilität mit CUDA, sondern in dem großen Unified Memory-Pool und den von AMD unterstützten Szenarien. Hier ist es jedoch wichtig, nichts Überflüssiges hinzuzufügen. AMD holt immer noch gegenüber NVIDIA im Bereich der AI-Ökosysteme auf, und die Kompatibilität muss je nach spezifischem OS, Version von ROCm, PyTorch, Modell und Tool überprüft werden.

In einem Szenario kann die Radeon 8065S als Beschleuniger normal verwendet werden, während in einem anderen die Software sie möglicherweise nicht als GPU nutzen kann oder Umgehungsmaßnahmen erforderlich sind. Daher sollte die 8065S besser nicht als universeller AI-Beschleuniger für jede Software beschrieben werden, sondern als Teil einer neuen AMD-Plattform für lokales AI, bei der das Hauptargument der sehr große verfügbare Speicher ist.

CUDA-abhängige Software bleibt ein nicht zielgerichtetes Szenario für Radeon. Wenn die Software CUDA erfordert, ist eine NVIDIA-Grafikkarte erforderlich. Bei der Radeon 8065S liegt der Sinn woanders: die Ausführung lokaler Modelle über die von AMD unterstützten Tools und das Arbeiten an Aufgaben, bei denen der Speicher wichtiger ist als die reine Kompatibilität mit CUDA.

Wo die Radeon 8065S in der Reihe steht

Die Radeon 8065S ist derzeit das Spitzenmodell in der Familie der Radeon 8000S. Darunter bleiben die Radeon 8060S, Radeon 8050S und Radeon 8040S. Der Unterschied zwischen 8065S und 8060S ist gering im Grafikblock, aber deutlich im plattformbezogenen Kontext.

Die Radeon 8060S war die leistungsstärkste iGPU für Ryzen AI Max 300. Die Radeon 8065S ist das aktualisierte Topmodell für Ryzen AI Max PRO 400 geworden. Für Spiele sind dies so gut wie die gleiche Klasse, während die 8065S im AI-Bereich vor allem durch den Ryzen AI Max+ PRO 495 und dessen erweitertes Speicherkontingent gewinnt.

Hauptnachteil - Preis und Nische

Die Radeon 8065S kann nicht separat gekauft werden. Sie ist Teil einer teuren professionellen Plattform, dem Ryzen AI Max+ PRO 495. Daher hängt ihr Wert nicht von der Bezeichnung "8065S Grafiken" ab, sondern vom Preis des gesamten Geräts und davon, ob der Nutzer lokale AI-Szenarien benötigt.

Wenn man einfach nur ein Gaming-Laptop braucht, könnte ein Modell mit einer dedizierten RTX 4060 oder RTX 4070 die logischere Wahl sein: separate Videospeicher, DLSS, ein bekanntes Gaming-Ökosystem und CUDA für kompatible Software. Aber wenn man eine kompakte Workstation mit enorm großem Unified Memory, leistungsstarker CPU, integrierter Grafik und der Möglichkeit, große Modelle lokal auszuführen, benötigt, wird die Radeon 8065S deutlich interessanter.

Es ist keine Massenlösung für typische Gaming-Laptops. Es ist die leistungsstärkere iGPU einer Nischenplattform von AMD für lokales AI, Workstations und kompakte Systeme, wo großer Speicher nicht weniger wichtig ist als die Grafikleistung selbst.

Fazit

Die AMD Radeon 8065S Grafiken sind keine Revolution im Vergleich zur Radeon 8060S in Bezug auf den reinen GPU. Es ist eine frischere und erweiterte Version der gleichen Idee: 40-CU RDNA 3.5-Grafik innerhalb einer großen APU-Plattform, bei der der Hauptfokus auf lokalem AI und Unified Memory liegt.

Für Spiele bleibt die Radeon 8065S eine sehr starke integrierte Grafik, ersetzt jedoch nicht dedizierte Grafikkarten. Im AI-Bereich ist sie interessanter: nicht weil AMD mit NVIDIA im Software-Ökosystem gleichgezogen hat, sondern weil der Ryzen AI Max+ PRO 495 bietet, was in mobilen Systemen selten ist - bis zu 192 GB Unified Memory.

Die Radeon 8065S ist wichtig, nicht weil sie in Spielen signifikant schneller ist als die 8060S, sondern weil sie den neuen Sinn von Ryzen AI Max verstärkt: es handelt sich nicht mehr nur um eine leistungsstarke APU, sondern um eine Client-AI-Plattform, bei der der Speicher für lokale Modelle das Hauptargument wird.

Basic

Markenname
AMD
Plattform
Integrated
Erscheinungsdatum
May 2026
Modellname
AMD Radeon 8065S Graphics
Generation
Radeon 8000S
Boost-Takt
3000 MHz
Bus-Schnittstelle
Integrated
RT-Kerne
40
Einheiten berechnen
40
Tensor-Kerne
?
Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.
No
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
160
Foundry
TSMC
Prozessgröße
4 nm
Architektur
RDNA 3.5

Speicherspezifikationen

Speichergröße
System Shared
Speichertyp
System Shared LPDDR5x
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
256-bit
Speichertakt
LPDDR5x-8533
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
273 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
192 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
480 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
30.72 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
480 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
15.36 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
2560
OpenCL-Version
2.1
OpenGL
4.6
DirectX
12
CUDA
No
Stromanschlüsse
None
Shader-Modell
6.8
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
64

Benchmarks

FP32 (float)
Punktzahl
15.36 TFLOPS

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS