Startseite / AMD / AMD Radeon 8065S Graphics: Leistung und Spezifikationen

AMD Radeon 8065S Graphics

Name: AMD Radeon 8065S Graphics
Brand: AMD

Test der AMD Radeon 8065S Graphics Grafikkarte

AMD Radeon 8065S Grafiken: die leistungsstärkere iGPU Ryzen AI Max PRO für lokales AI

AMD Radeon 8065S Grafiken - die leistungsstärkere integrierte Grafik für die Plattform Ryzen AI Max PRO 400. Bezüglich der GPU gibt es jedoch keinen signifikanten Sprung im Vergleich zur Radeon 8060S. Der Grafikblock bleibt ähnlich: 40 CU in der RDNA 3.5 Architektur, jedoch ist die Taktfrequenz auf 3000 MHz gestiegen. Der Hauptunterschied liegt nicht in diesen zusätzlichen 100 MHz, sondern in der Plattform, die sich um sie herum entwickelt hat.

Die Radeon 8065S erscheint in Ryzen AI Max+ PRO 495 - der aktualisierten Version des großen AMD APU für lokales AI, kompakte Workstations und professionelle Systeme. Hier verschiebt AMD den Fokus noch stärker von Spielen hin zu AI: bis zu 192 GB Unified Memory, bis zu 160 GB Shared Memory, die als GPU-Speicher genutzt werden können, und die NPU erreicht bis zu 55 TOPS, während die Gesamtkapazität der AI-Plattform 131 TOPS erreicht.

Es handelt sich hierbei nicht mehr nur um ein Gaming-Produkt. Die Radeon 8065S ist wichtig als Teil einer Plattform, auf der AMD versucht, sein Territorium im Bereich lokales AI zu erweitern: ein kompaktes Gerät mit einem großen gemeinsamen Speicherkontingent, einem starken CPU, leistungsstarker RDNA-Grafik und NPU ohne separate dedizierte Grafikkarte anzubieten.

Warum die Radeon 8065S wichtig ist

Die Radeon 8065S hat keinen eigenen GDDR6-Speicher wie eine dedizierte Grafikkarte. Sie arbeitet mit dem gemeinsamen Speicher der gesamten Plattform. Für einen normalen Gaming-GPU könnte das wie eine Einschränkung erscheinen, aber für lokales AI ist die Situation komplexer: Hier entscheidet häufig nicht nur die Geschwindigkeit, sondern auch das Volumen des verfügbaren Speichers.

Wenn ein Modell oder Kontext nicht in den verfügbaren Videospeicher passt, hilft eine hohe GPU-Geschwindigkeit nicht mehr: Die Aufgabe kann entweder nicht ordnungsgemäß gestartet werden oder erfordert erhebliche Kompromisse. Der Ryzen AI Max PRO 400 versucht genau diese Lücke zu schließen. Die Plattform bietet dem Client-Gerät einen großen lokalen Speicherpool für LLM, Bildgenerierung, langen Kontext und mehrere AI-Aufgaben gleichzeitig.

AMD gibt die Möglichkeit an, lokale Modelle mit mehr als 300 Milliarden Parametern bei 4-Bit-Quantisierung auszuführen. Das bedeutet nicht, dass ein solches Computer-Setup einen Server mit professionellen Beschleunigern ersetzt. Aber für ein Laptop, Mini-PC oder kompakte Workstation ist das eine ernsthafte Ansage: Große Modelle können nicht nur theoretisch diskutiert, sondern tatsächlich lokal mit dem passenden Software-Stack ausgeführt werden.

8065S gegen 8060S: der Hauptunterschied liegt in der Plattform

Die Radeon 8065S ist ein naher Verwandter der Radeon 8060S. Die Anzahl der CUs bleibt gleich, die Architektur ist die gleiche und der Taktanstieg ist gering. Daher verspricht der Wechsel von 8060S zu 8065S allein keinen signifikanten Anstieg der FPS.

Parameter	Radeon 8060S	Radeon 8065S
Architektur	RDNA 3.5	RDNA 3.5
Grafikblöcke	40 CU	40 CU
GPU-Frequenz	bis zu 2900 MHz	bis zu 3000 MHz
Plattform	Ryzen AI Max 300	Ryzen AI Max PRO 400
Maximales Unified Memory	bis zu 128 GB	bis zu 192 GB
Speicher verfügbar für GPU	bis zu 112 GB	bis zu 160 GB

Ein Vergleich nur anhand der Frequenz lässt das Hauptunterscheidungsmerkmal - das Plattform-Limits des Speichers - außer Acht. Für Spiele wird der Unterschied zwischen 8060S und 8065S wahrscheinlich moderat sein. Für lokales AI ist der Anstieg des Unified Memory von 128 auf 192 GB wichtiger als die geringe Steigerung der GPU-Frequenz.

Erwartetes Gaming-Niveau

Bislang gibt es nur wenige unabhängige Daten zur Radeon 8065S, weshalb es sinnvoll ist, das Gaming-Niveau über die Radeon 8060S und den kleinen Unterschied in der Frequenz zu bewerten. In der Konfiguration sind dies sehr ähnliche GPUs: Die 8065S hat den gleichen breiten 40-CU-Block, jedoch mit etwas höherer Frequenz. Daher wird der Gaming-Zuwachs im Vergleich zur 8060S wahrscheinlich gering sein: 100 MHz mehr verwandeln diese Grafik nicht in eine neue Klasse.

Das praktische Szenario bleibt folgendermassen:

1080p - Hauptmodus, oft mit mittleren oder hohen Einstellungen;
1440p - möglich in weniger anspruchsvollen Spielen oder mit FSR;
4K - eher für ältere und leichtere Projekte;
Ray Tracing - wird unterstützt, ist aber nicht die Stärke dieser iGPU.

Die Radeon 8065S sollte nicht als direkte Alternative zu Mobilen RTX dargestellt werden. Es handelt sich um eine integrierte Grafik mit gemeinsamem Speicher, und ihr Ergebnis hängt von den Leistungsgrenzen, der Kühlung und dem spezifischen Gerät ab. In Spielen bleibt die Radeon 8065S eine ungewöhnlich starke iGPU, während im Bereich AI der Hauptgewinn nicht die Frequenz, sondern der Zugang zu einem großen Volumen an gemeinsamem Speicher ist.

AI: Das Hauptszenario Ryzen AI Max PRO 400

Der Ryzen AI Max PRO 400 ist deutlich stärker auf lokales AI ausgerichtet als auf die Rolle einer herkömmlichen Spielplattform. CPU, GPU, NPU und Unified Memory arbeiten als Teile einer einzigen APU-Plattform und nicht als separate Komponenten mit unterschiedlichen Speicher-Pools.

Die Radeon 8065S könnte für solche Aufgaben interessant sein:

Ausführung lokaler LLM, insbesondere wenn Modelle nicht in 8-12 GB VRAM passen;
Inferenz und Testen von AI-Pipelines;
Arbeiten mit langem Kontext;
Bildgenerierung und Diffusionsmodelle;
Lokale AI-Agenten und automatisierte Szenarien;
PyTorch/ROCm, ONNX, Ollama, llama.cpp, Amuse und andere Werkzeuge - vorausgesetzt, sie werden von der spezifischen Konfiguration unterstützt.

Das Training großer Modelle von Grund auf bleibt eine Aufgabe für Server-Beschleuniger. Aber Ausführung, Testen, lokale Entwicklung, leichtes Fine-Tuning und Arbeiten mit Modellen, die nicht in eine typische mobile Grafikkarte passen, ist genau dort, wo der Ryzen AI Max+ PRO 495 und die Radeon 8065S besonders interessant erscheinen.

ROCm, PyTorch und Einschränkungen

Die Stärke dieser Plattform liegt nicht in der Kompatibilität mit CUDA, sondern in dem großen Unified Memory-Pool und den von AMD unterstützten Szenarien. Hier ist es jedoch wichtig, nichts Überflüssiges hinzuzufügen. AMD holt immer noch gegenüber NVIDIA im Bereich der AI-Ökosysteme auf, und die Kompatibilität muss je nach spezifischem OS, Version von ROCm, PyTorch, Modell und Tool überprüft werden.

In einem Szenario kann die Radeon 8065S als Beschleuniger normal verwendet werden, während in einem anderen die Software sie möglicherweise nicht als GPU nutzen kann oder Umgehungsmaßnahmen erforderlich sind. Daher sollte die 8065S besser nicht als universeller AI-Beschleuniger für jede Software beschrieben werden, sondern als Teil einer neuen AMD-Plattform für lokales AI, bei der das Hauptargument der sehr große verfügbare Speicher ist.

CUDA-abhängige Software bleibt ein nicht zielgerichtetes Szenario für Radeon. Wenn die Software CUDA erfordert, ist eine NVIDIA-Grafikkarte erforderlich. Bei der Radeon 8065S liegt der Sinn woanders: die Ausführung lokaler Modelle über die von AMD unterstützten Tools und das Arbeiten an Aufgaben, bei denen der Speicher wichtiger ist als die reine Kompatibilität mit CUDA.

Wo die Radeon 8065S in der Reihe steht

Die Radeon 8065S ist derzeit das Spitzenmodell in der Familie der Radeon 8000S. Darunter bleiben die Radeon 8060S, Radeon 8050S und Radeon 8040S. Der Unterschied zwischen 8065S und 8060S ist gering im Grafikblock, aber deutlich im plattformbezogenen Kontext.

Die Radeon 8060S war die leistungsstärkste iGPU für Ryzen AI Max 300. Die Radeon 8065S ist das aktualisierte Topmodell für Ryzen AI Max PRO 400 geworden. Für Spiele sind dies so gut wie die gleiche Klasse, während die 8065S im AI-Bereich vor allem durch den Ryzen AI Max+ PRO 495 und dessen erweitertes Speicherkontingent gewinnt.

Hauptnachteil - Preis und Nische

Die Radeon 8065S kann nicht separat gekauft werden. Sie ist Teil einer teuren professionellen Plattform, dem Ryzen AI Max+ PRO 495. Daher hängt ihr Wert nicht von der Bezeichnung "8065S Grafiken" ab, sondern vom Preis des gesamten Geräts und davon, ob der Nutzer lokale AI-Szenarien benötigt.

Wenn man einfach nur ein Gaming-Laptop braucht, könnte ein Modell mit einer dedizierten RTX 4060 oder RTX 4070 die logischere Wahl sein: separate Videospeicher, DLSS, ein bekanntes Gaming-Ökosystem und CUDA für kompatible Software. Aber wenn man eine kompakte Workstation mit enorm großem Unified Memory, leistungsstarker CPU, integrierter Grafik und der Möglichkeit, große Modelle lokal auszuführen, benötigt, wird die Radeon 8065S deutlich interessanter.

Es ist keine Massenlösung für typische Gaming-Laptops. Es ist die leistungsstärkere iGPU einer Nischenplattform von AMD für lokales AI, Workstations und kompakte Systeme, wo großer Speicher nicht weniger wichtig ist als die Grafikleistung selbst.

Fazit

Die AMD Radeon 8065S Grafiken sind keine Revolution im Vergleich zur Radeon 8060S in Bezug auf den reinen GPU. Es ist eine frischere und erweiterte Version der gleichen Idee: 40-CU RDNA 3.5-Grafik innerhalb einer großen APU-Plattform, bei der der Hauptfokus auf lokalem AI und Unified Memory liegt.

Für Spiele bleibt die Radeon 8065S eine sehr starke integrierte Grafik, ersetzt jedoch nicht dedizierte Grafikkarten. Im AI-Bereich ist sie interessanter: nicht weil AMD mit NVIDIA im Software-Ökosystem gleichgezogen hat, sondern weil der Ryzen AI Max+ PRO 495 bietet, was in mobilen Systemen selten ist - bis zu 192 GB Unified Memory.

Die Radeon 8065S ist wichtig, nicht weil sie in Spielen signifikant schneller ist als die 8060S, sondern weil sie den neuen Sinn von Ryzen AI Max verstärkt: es handelt sich nicht mehr nur um eine leistungsstarke APU, sondern um eine Client-AI-Plattform, bei der der Speicher für lokale Modelle das Hauptargument wird.

Basic

Markenname

AMD

Plattform

Integrated

Erscheinungsdatum

May 2026

Modellname

AMD Radeon 8065S Graphics

Generation

Radeon 8000S

Boost-Takt

3000 MHz

Bus-Schnittstelle

Integrated

RT-Kerne

Einheiten berechnen

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

160

Foundry

TSMC

Prozessgröße

4 nm

Architektur

RDNA 3.5

Speicherspezifikationen

Speichergröße

System Shared

Speichertyp

System Shared LPDDR5x

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

256-bit

Speichertakt

LPDDR5x-8533

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

273 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

192 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

480 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

30.72 TFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

480 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

15.36 TFLOPS

Verschiedenes

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

2560

OpenCL-Version

2.1

OpenGL

4.6

CUDA

DirectX

Stromanschlüsse

None

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Shader-Modell

6.8

Benchmarks

FP32 (float)

Punktzahl

15.36 TFLOPS

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS

Radeon RX 7600S

16.085 +4.7%

GeForce RTX 3060 Ti GDDR6X

15.876 +3.4%

Radeon 8065S Graphics

15.36

Quadro RTX 8000 Passive

14.631 -4.7%

Tesla T40 24 GB

14.092 -8.3%

AMD Radeon 8065S Graphics

AMD Radeon 8065S Grafiken: die leistungsstärkere iGPU Ryzen AI Max PRO für lokales AI

Warum die Radeon 8065S wichtig ist

8065S gegen 8060S: der Hauptunterschied liegt in der Plattform

Erwartetes Gaming-Niveau

AI: Das Hauptszenario Ryzen AI Max PRO 400

ROCm, PyTorch und Einschränkungen

Wo die Radeon 8065S in der Reihe steht

Hauptnachteil - Preis und Nische

Fazit

Basic

Speicherspezifikationen

Theoretische Leistung

Verschiedenes

Benchmarks

Im Vergleich zu anderen GPUs

Verwandte GPU-Vergleiche

In sozialen Medien teilen