Startseite / AMD / AMD Radeon RX 9070 GRE: Leistung und Spezifikationen

AMD Radeon RX 9070 GRE

Name: AMD Radeon RX 9070 GRE
Brand: AMD

Test der AMD Radeon RX 9070 GRE Grafikkarte

AMD Radeon RX 9070 GRE: 12 GB beschränken Spiele und lokale KI

Die AMD Radeon RX 9070 GRE nimmt eine Zwischenstellung zwischen der RX 9060 XT und der RX 9070 ein, aber als einfache „Mittelklasse“-Grafikkarte lässt sie sich schwer bezeichnen. In Bezug auf die Rechenleistung ist sie der RX 9070 ähnlich, verbraucht ebenso viel Energie, und die Hauptreduzierung betrifft den Speicher: 12 GB GDDR6 und einen 192-Bit-Bus anstelle von 16 GB und 256 Bit.

In Spielen macht sich dieser Kompromiss bei 4K stärker bemerkbar als bei 1440p. In der lokalen KI ist die Beschränkung sofort spürbar: Die Menge des Videospeichers beeinflusst nicht nur die Geschwindigkeit, sondern auch die Möglichkeit, das Modell vollständig zu laden. Daher wird die Attraktivität der RX 9070 GRE vor allem durch den Preis im Vergleich zur regulären RX 9070 bestimmt.

Reduzierte RX 9070, nicht verbesserte RX 9060 XT

Die Radeon RX 9070 GRE verfügt über 48 Recheneinheiten, 3072 Streaming-Prozessoren, 48 Raytracing-Beschleuniger und 96 KI-Beschleuniger. Die Spieltaktfrequenz beträgt 2220 MHz, während der Boost 2790 MHz erreicht. Die Spitzenleistung FP32 wird mit 34,3 TFLOPS angegeben.

Zum Vergleich: Die RX 9070 hat 56 Rechenblöcke und 3584 Streaming-Prozessoren. Ihre Spitzenleistung FP32 beträgt 36,1 TFLOPS. Die Differenz in der theoretischen Leistung erscheint gering, da die GRE die deaktivierten Blöcke teilweise mit einer höheren Frequenz kompensiert.

Allerdings ersetzt ein hoher Boost nicht die fehlenden Rechenblöcke. In anspruchsvollen Spielszenen, Raytracing und langanhaltenden Rechenlasten wird die reguläre RX 9070 weiterhin den Vorteil bewahren.

Position der RX 9070 GRE in der Produktlinie

Merkmal	Radeon RX 9060 XT 16GB	Radeon RX 9070 GRE	Radeon RX 9070
Rechenblöcke	32	48	56
Streaming-Prozessoren	2048	3072	3584
Videospeicher	16 GB GDDR6	12 GB GDDR6	16 GB GDDR6
Speicherbus	128 Bit	192 Bit	256 Bit
Bandbreite	320 GB/s	432 GB/s	640 GB/s
Infinity Cache	32 MB	48 MB	64 MB
Typischer Stromverbrauch	160 W	220 W	220 W
Hauptanwendung	1080p und 1440p	1440p	1440p und 4K

In der Größe des GPUs ist die RX 9070 GRE der RX 9070 deutlich ähnlicher. Aber die Speicherkonfiguration erscheint seltsam: Die kleinere RX 9060 XT 16GB hat mehr VRAM, obwohl sie deutlich in der Rechenleistung unterlegen ist.

Speicher wurde zum Hauptkompromiss

Die RX 9070 GRE ist mit 12 GB GDDR6 mit einer Geschwindigkeit von 18 Gbit/s ausgestattet. Der Speicher ist über einen 192-Bit-Bus verbunden und bietet eine Bandbreite von 432 GB/s. Der Infinity Cache beträgt 48 MB.

Die RX 9070 hat 16 GB GDDR6 mit einer Geschwindigkeit von 20 Gbit/s, einen 256-Bit-Bus und 64 MB Infinity Cache. Die Bandbreite erreicht 640 GB/s - fast 50% mehr als bei der GRE.

Bei 1440p verwandeln zwölf Gigabyte die Karte noch nicht in einen problematischen Kauf. Die meisten Spiele passen in diesen Speicher, und die hohe Rechenleistung ermöglicht es, die maximalen oder nahezu maximalen Einstellungen zu verwenden.

Aber der Puffer ist für eine Grafikkarte dieser Klasse gering. Schwerer Texturen, Modifikationen, Raytracing und der Übergang zu 4K erhöhen den VRAM-Verbrauch schnell. Bei unzureichendem Speicher geht der Vorteil eines leistungsstarken GPUs teilweise durch das Nachladen aus dem Systemspeicher und die Notwendigkeit, einzelne Einstellungen zu reduzieren, verloren.

Schnelle Grafikkarte für 1440p

Die Hauptauflösung der RX 9070 GRE beträgt 2560 × 1440. Im von AMD veröffentlichten Testset zeigt die Karte zwischen 82 und 144 Bildern pro Sekunde in modernen Spielen bei hohen oder maximalen Einstellungen. Diese Ergebnisse stammen von AMD selbst und dienen als Richtwert, nicht als Ersatz für unabhängige Tests.

Für einen Monitor mit 120-165 Hz reicht die Leistung in vielen Projekten aus. Die anspruchsvollsten Raytracing-Modi erfordern eventuell Skalierung oder Reduzierung einzelner Parameter, aber in normaler Rastergrafik präsentiert sich die RX 9070 GRE souverän.

In 4K ist die Karte ebenfalls in der Lage, eine akzeptable Bildrate zu liefern, besonders mit FSR. Hier beginnen jedoch die 12 GB und der 192-Bit-Bus stärker, sie von der RX 9070 abzugrenzen. Für gelegentliches Spielen in 4K ist die GRE geeignet, aber als dauerhafte 4K-Karte sieht das ältere Modell deutlich überzeugender aus.

FSR, Raytracing und Medienencoder

Die RX 9070 GRE unterstützt Technologien der RDNA 4-Generation, einschließlich FSR Redstone, Frame-Generation, Radeon Anti-Lag, Radeon Super Resolution und HYPR-RX. Die Karte kann auch AV1, H.264 und H.265 hardwareseitig kodieren und dekodieren.

Die Raytracing-Beschleuniger in RDNA 4 sind leistungsfähiger als die Blöcke der vorherigen Radeon-Generationen, allerdings bleiben die schwersten RT-Modi dennoch eine große Belastung. FSR wird hier nicht als angenehmes Extra eingesetzt, sondern als praktisches Mittel, um die Bildrate hochzuhalten.

Der Stromverbrauch bleibt von der RX 9070

Der typische Stromverbrauch der RX 9070 GRE beträgt 220 W - genau so viel, wie AMD für die RX 9070 angibt. Für die Stromversorgung werden zwei 8-polige Anschlüsse benötigt, die empfohlene Leistung des Netzteils beträgt 650 W.

Die GRE spart Geld, aber nicht Strom. Die Karte benötigt ein Gehäuse mit ordentlicher Belüftung und ein vollständiges Kühlsystem. Es ist dabei nicht immer sinnvoll, für die massivsten Partner-Versionen zu überzahlen: Die teure RX 9070 GRE kann preislich fast mit der leistungsstärkeren RX 9070 konkurrieren.

Das Übertakten beseitigt auch nicht den Hauptnachteil. Zusätzliche Megahertz für den Chip machen 12 GB nicht zu 16 GB und einen 192-Bit-Bus nicht zu einem 256-Bit-Bus.

RX 9070 GRE in lokaler KI und maschinellem Lernen

Die RX 9070 GRE hat 96 KI-Beschleuniger der zweiten Generation und unterstützt Matrixoperationen mit geringer Genauigkeit. Aber die TOPS-Werte allein sagen wenig über die tatsächliche Leistung aus: Das Ergebnis hängt vom spezifischen Modell, dem verwendeten Framework, dem Datentyp und der Qualität der Software-Optimierung ab.

Viel wichtiger ist, dass die RX 9070 GRE offiziell von der ROCm-Plattform unterstützt wird. Auf Linux stehen für Radeon PyTorch, TensorFlow, JAX und ONNX Runtime sowie Tools für den Betrieb von LLM und generativen Modellen zur Verfügung. Die RX 9070 GRE ist in der aktuellen Matrix der kompatiblen Hardware vorhanden.

In der Praxis kann die Karte für folgende Aufgaben verwendet werden:

Bildgenerierung in Stable Diffusion und ComfyUI;
Ausführung quantisierter lokaler Sprachmodelle;
Inferenz von Modellen in PyTorch und ONNX;
Computer Vision und Bildbearbeitung;
Training kleiner Modelle und LoRA-Feinabstimmungen;
Experimente mit eigenen HIP-Anwendungen.

Für die Inferenz und das Kennenlernen von lokaler KI sind die Möglichkeiten ausreichend. Probleme treten mit dem Wachstum des Modells oder des Arbeitsprozesses auf. Ein Teil des VRAM wird durch Gewichte, Kontext, Intermediate Tensors und die Anwendung selbst belegt. In Bildgeneratoren verbrauchen zusätzlich hohe Auflösungen, Batch-Verarbeitung, ControlNet und andere Erweiterungen Speicher.

Deshalb sind 12 GB nicht einfach nur ein geringerer Puffer für die Zukunft. Einige Aufgaben, die in 16 GB der RX 9070 passen, müssen auf der GRE mit aggressiveren Quantisierungen, reduziertem Kontext, geringerer Auflösung oder teilweiser Auslagerung von Daten in den Arbeitsspeicher ausgeführt werden. Letzteres ermöglicht es, ein größeres Modell zu starten, verringert jedoch normalerweise die Geschwindigkeit.

Für das vollständige Training großer neuronaler Netze ist die RX 9070 GRE nicht geeignet. Ihre Stärken liegen in der lokalen Inferenz, der Generierung von Inhalten, Lernprojekten und kleinen Experimenten.

Windows wird bereits unterstützt, aber Linux bleibt breiter

Die Situation auf Windows hat sich verbessert. Die RX 9070 GRE unterstützt offiziell ROCm Runtime, HIP SDK und ROCm Debugger, und die aktuelle Version der Plattform bietet PyTorch für Radeon unter Windows.

Jedoch ist die Softwareunterstützung der beiden Systeme noch nicht identisch. Auf Windows ist PyTorch offiziell verfügbar, während Linux zusätzlich TensorFlow, JAX und ONNX Runtime sowie einen ausgereifteren Satz von Tools für das Training und die Inferenz bietet. Einige mathematische Bibliotheken von ROCm sind weiterhin nur auf Linux verfügbar.

Für die lokale Ausführung vorgefertigter Modelle kann Windows schon als funktionale Option betrachtet werden. Für Entwicklung, Training und Experimente mit verschiedenen Frameworks bleibt Linux jedoch eine flexiblere Umgebung.

Vor dem Kauf einer Radeon für ein bestimmtes professionelles Programm ist es trotzdem ratsam, die Anforderungen zu überprüfen. Die Unterstützung von ROCm garantiert nicht, dass jede Anwendung, die in erster Linie für CUDA geschrieben wurde, ohne Anpassungen oder alternativen Backend funktioniert.

Warum die RX 9070 für KI bevorzugt wird

In Spielen können vier zusätzliche Gigabyte lange keinen spürbaren Unterschied machen. Im maschinellen Lernen beeinflussen sie jedoch die Möglichkeit, die Aufgabe auszuführen.

Die RX 9070 bietet:

mehr Platz für Gewichte und Kontext des lokalen LLM;
geringere Abhängigkeit vom Auslagern von Schichten in den Arbeitsspeicher;
mehr Freiheit bei der Arbeit mit hohen Auflösungen;
die Möglichkeit, komplexere Ketten in ComfyUI zu verwenden;
zusätzlichen Puffer für Training und LoRA-Feinabstimmungen;
höhere Speicherbandbreite.

Bei gleichem Stromverbrauch hat die RX 9070 nicht nur einen leistungsstärkeren GPU erhalten, sondern auch ein deutlich besseres Speichersystem. Daher ist die Aufzahlung auf die ältere Karte für einen gemischten PC, der sowohl für Spiele als auch für KI gedacht ist, sinnvoller als für ein rein spielerisches System.

Wann es sinnvoll ist, die RX 9070 GRE zu kaufen

Die Radeon RX 9070 GRE erscheint sinnvoll, wenn:

sie deutlich günstiger als die RX 9070 ist;
die Hauptauflösung 1440p bleibt;
4K nur gelegentlich genutzt wird;
lokale KI auf Inferenz und moderate Modelle beschränkt ist;
die benötigten Anwendungen offiziell über ROCm arbeiten;
Ersparnisse wichtiger sind als zusätzlicher VRAM.

Bei geringem Preisunterschied verlieren diese Argumente an Gewicht. Die RX 9070 bietet mehr Rechenblöcke, 16 GB Speicher und einen 256-Bit-Bus bei denselben angegebenen 220 W.

Entscheidend ist der Preis

Der weltweite Verkauf der Radeon RX 9070 GRE begann am 2. Juni 2026 zu einem empfohlenen Preis von 549 Dollar. Genau so viel kostete zum Zeitpunkt ihres Verkaufsstart die reguläre RX 9070, wobei es jedoch nicht sinnvoll ist, empfohlene Preise, die in unterschiedlichen Zeiträumen festgelegt wurden, direkt zu vergleichen.

Dennoch bleibt die Positionierung der GRE umstritten. Sie unterliegt der RX 9070 in puncto GPU, Speichergröße und Bandbreite, spart jedoch keinen Strom. Daher macht der Kauf nur bei erheblichen Rabatten im Vergleich zum älteren Modell Sinn.

Fazit

Die AMD Radeon RX 9070 GRE ist eine leistungsstarke Grafikkarte für 1440p, die der RX 9060 XT in der Rechenleistung deutlich überlegen ist und den aktuellen ROCm-Stack unterstützt.

Ihr schwaches Glied ist nicht der GPU selbst, sondern die 12 GB Speicher und der 192-Bit-Bus. In Spielen beschränkt dies vor allem den Puffer für 4K und zukünftige Projekte. In der lokalen KI sind die Auswirkungen bereits jetzt spürbar: Der geringere VRAM verringert die Auswahl an Modellen und erschwert anspruchsvolle Arbeitsabläufe.

Bei einem deutlichen Rabatt erscheint die RX 9070 GRE als starke Gaming-Karte und geeignete Plattform für lokale KI. Bei geringem Preisunterschied zur RX 9070 ist es vernünftiger, für 16 GB mehr zu zahlen: Zusätzliches Gedächtnis ist sowohl in einem langfristigen Gaming-System als auch bei Arbeitsaufgaben nützlicher.

Basic

Markenname

AMD

Plattform

Desktop

Erscheinungsdatum

May 2025

Modellname

Radeon RX 9070 GRE

Generation

Navi 48

Basis-Takt

2220 MHz

Boost-Takt

2790 MHz

Bus-Schnittstelle

PCIe 5.0 x16

Transistoren

53.9 billion

RT-Kerne

Tensor-Kerne

Tensor-Kerne sind spezialisierte Verarbeitungseinheiten, die speziell für das Deep Learning entwickelt wurden und im Vergleich zum FP32-Training eine höhere Trainings- und Inferenzleistung bieten. Sie ermöglichen schnelle Berechnungen in Bereichen wie Computer Vision, Natural Language Processing, Spracherkennung, Text-zu-Sprache-Konvertierung und personalisierteEmpfehlungen. Die beiden bekanntesten Anwendungen von Tensor-Kernen sind DLSS (Deep Learning Super Sampling) und AI Denoiser zur Rauschreduzierung.

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

192

Foundry

TSMC

Prozessgröße

4 nm

Architektur

RDNA 4

Speicherspezifikationen

Speichergröße

12GB

Speichertyp

GDDR6

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

192bit

Speichertakt

2250 MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

432.0GB/s

Anzeige und Medien

Ausgänge

1x HDMI 2.1b3x DisplayPort 2.1a

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

267.8 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

535.7 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

34.3 TFLOPS Vector

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

1071 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

34.3 TFLOPS

Verschiedenes

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

3072

TDP (Thermal Design Power)

220W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

2.2

OpenGL

4.6

DirectX

12 Ultimate (12_2)

Stromanschlüsse

2x 8-pin

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Shader-Modell

6.8

Empfohlene PSU (Stromversorgung)

650 W

Benchmarks

FP32 (float)

Punktzahl

34.3 TFLOPS

3DMark Steel Nomad

Punktzahl

5174

OpenCL

Punktzahl

134417

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS

GeForce RTX 4070 Ti SUPER

43.166 +25.8%

RTX A6000

37.936 +10.6%

Radeon RX 9070 GRE

34.3

RTX 5000 Max-Q Ada Generation

32.036 -6.6%

GeForce RTX 4070 GDDR6

29.733 -13.3%

3DMark Steel Nomad

GeForce RTX 4070 Ti SUPER

5594 +8.1%

GeForce RTX 5070

5300 +2.4%

Radeon RX 9070 GRE

5174

GeForce RTX 5080 Mobile

5173 -0%

GeForce RTX 3090

5117 -1.1%

OpenCL

RTX 6000D

388405 +189%

GeForce RTX 5070

186397 +38.7%

Radeon RX 9070 GRE

134417

GeForce RTX 2060 SUPER

90580 -32.6%

Radeon RX 5700

66428 -50.6%

AMD Radeon RX 9070 GRE

AMD Radeon RX 9070 GRE: 12 GB beschränken Spiele und lokale KI

Reduzierte RX 9070, nicht verbesserte RX 9060 XT

Position der RX 9070 GRE in der Produktlinie

Speicher wurde zum Hauptkompromiss

Schnelle Grafikkarte für 1440p

FSR, Raytracing und Medienencoder

Der Stromverbrauch bleibt von der RX 9070

RX 9070 GRE in lokaler KI und maschinellem Lernen

Windows wird bereits unterstützt, aber Linux bleibt breiter

Warum die RX 9070 für KI bevorzugt wird

Wann es sinnvoll ist, die RX 9070 GRE zu kaufen

Entscheidend ist der Preis

Fazit

Basic

Speicherspezifikationen

Anzeige und Medien

Theoretische Leistung

Verschiedenes

Benchmarks

Im Vergleich zu anderen GPUs

Verwandte GPU-Vergleiche

In sozialen Medien teilen