Startseite / NVIDIA / NVIDIA P106 090: Leistung und Spezifikationen

NVIDIA P106 090

NVIDIA P106 090: Budget-GPU für Gamer und mehr

April 2025

In der Welt der Grafikkarten überrascht NVIDIA weiterhin mit Lösungen für verschiedene Nutzerkategorien. Das Modell P106 090 zieht trotz seines bescheidenen Preises durch seine Vielseitigkeit Aufmerksamkeit auf sich. Schauen wir uns an, für wen diese Karte geeignet ist und was sie im Jahr 2025 leisten kann.

1. Architektur und wichtige Merkmale

Architektur: Die NVIDIA P106 090 basiert auf einer aktualisierten Version von Pascal (GP106), wurde jedoch für moderne 12-nm-Fertigungstechnologien optimiert. Dies hat den Energieverbrauch gesenkt und die Stabilität erhöht.

Besondere Funktionen:

- Keine RTX und DLSS: Die Karte unterstützt keine hardwarebeschleunigte Raytracing und die neuronalen Technologien von NVIDIA. Dank Treibern der Version 550+ ist sie jedoch mit FSR 3.1 von AMD und XeSS von Intel kompatibel, was einen FPS-Zuwachs in Spielen mit Unterstützung dieser Technologien ermöglicht.

- NVENC: Der 7. Generation Video-Encoding-Chip beschleunigt das Streaming und Rendering.

Hauptmerkmal: P106 090 wird als „Hybrid“-Lösung für Mining und grundlegendes Gaming positioniert, wird im Jahr 2025 jedoch häufiger in Büro- und Multimedia-Systemen verwendet.

2. Speicher

Art und Größe: 6 GB GDDR6 mit einem 192-Bit-Speicherbus. Zum Vergleich sind konkurrierende Modelle in diesem Segment (zum Beispiel AMD RX 6400) oft auf 4 GB GDDR6 beschränkt.

Bandbreite: 192 GB/s – das reicht für ein angenehmes Arbeiten in Full HD. In Spielen mit hohen Texturen (zum Beispiel Horizon Forbidden West) reicht der Speicher für mittlere Einstellungen aus.

Einfluss auf die Leistung: In einer Auflösung von 1080p wird der Speicher nicht zum „Flaschenhals“, jedoch können bei 1440p Textur-Nachladezeiten auftreten. Für professionelle Anwendungen sind 6 GB das minimal akzeptable Niveau für die Arbeit mit Blender oder DaVinci Resolve.

3. Spieleeistung

Durchschnittlicher FPS in beliebten Projekten (1080p, mittlere Einstellungen):

- Cyberpunk 2077: Phantom Liberty – 45-50 FPS (mit FSR 3.1 – bis zu 60 FPS).

- Fortnite (Performance-Modus) – 90-100 FPS.

- Apex Legends – 75-80 FPS.

- Assassin’s Creed Mirage – 55-60 FPS.

Unterstützung für Auflösungen:

- 1080p: Optimale Wahl.

- 1440p: Nur in wenig anspruchsvollen Spielen (CS2, Valorant) oder unter Verwendung von FSR/XeSS.

- 4K: Nicht empfohlen – FPS überschreiten selten 30 Bilder.

Raytracing: Das Fehlen spezialisierter RT-Kerne macht RTX-Modi unzugänglich. In Minecraft mit softwarebasierter Raytracing (benötigt leistungsstarke CPU) sind jedoch 25-30 FPS möglich.

4. Professionelle Anwendungen

Video-Editing: Durch NVENC wird das Rendering in Premiere Pro um 30 % im Vergleich zur integrierten Grafik beschleunigt. Der Export eines 10-minütigen Videos in 4K H.264 dauert etwa 8 Minuten.

3D-Modellierung: In Blender (unter Verwendung von CUDA) dauert das Rendern einer mittelkomplexen Szene etwa 25 Minuten. Zum Vergleich: Eine RTX 3050 schafft dies in 12 Minuten.

Wissenschaftliche Berechnungen: Die Unterstützung von CUDA und OpenCL ermöglicht die Verwendung der Karte im maschinellen Lernen auf grundlegender Ebene, jedoch macht die begrenzte Anzahl an Kernen (896 CUDA-Kerne) sie weniger effizient als spezialisierte Lösungen.

5. Energieverbrauch und Wärmeabstrahlung

TDP: 120 W – das ist 20 % weniger als bei der Original-P106.

Kühlungsempfehlungen:

- Der Standardkühler erfüllt die Anforderungen, aber unter Last erreicht der Geräuschpegel 38 dB.

- Für einen leisen Betrieb sind Gehäuse mit 2-3 Lüftern geeignet (zum Beispiel Zalman S2).

Temperaturen: Unter Last in Spielen – bis zu 72°C, beim Mining – bis zu 80°C (regelmäßige Staubreinigung erforderlich).

6. Vergleich mit Wettbewerbern

AMD Radeon RX 6500E (4 GB, 160 $):

- Vorteile: Unterstützung von FSR 3.1, niedrigerer Preis.

- Nachteile: Nur 4 GB Speicher, was für moderne Spiele kritisch ist.

Intel Arc A580 (8 GB, 180 $):

- Vorteile: Bessere Leistung in DX12, 8 GB Speicher.

- Nachteile: Höherer Energieverbrauch (130 W), Treiberprobleme bei älteren Spielen.

Fazit: Die P106 090 (170 $) ist ein gutes Mittelfeld in Bezug auf Speicherkapazität und Stabilität, verliert jedoch bei der Unterstützung neuer APIs.

7. Praktische Tipps

Netzteile: Ein 450 W-Modell mit 80+ Bronze-Zertifizierung reicht aus (zum Beispiel be quiet! System Power 10).

Kompatibilität:

- PCIe 3.0 x16 – volle Unterstützung.

- Motherboards: Kompatibel mit den meisten Modellen auf Intel-Chipsätzen 600+ und AMD B550+.

Treiber: Regelmäßige Updates bis Ende 2026. Für Windows 11 ist die Version 551.23+ erforderlich.

8. Vor- und Nachteile

Vorteile:

- Niedriger Preis (170 $).

- 6 GB GDDR6 – ausreichend für die meisten Aufgaben.

- Gute Energieeffizienz.

Nachteile:

- Keine Unterstützung für RTX und DLSS.

- Eingeschränkte Leistung bei 1440p.

- Lautere Kühllösung.

9. Fazit

Die NVIDIA P106 090 ist eine gute Wahl für:

- Budget-Gamer, die in Full HD spielen.

- Büro-PCs mit Upgrade-Möglichkeiten.

- Mining-Enthusiasten, die ein gutes Preis-Leistungs-Verhältnis suchen.

Wenn Sie bereit sind, in der Grafik Kompromisse einzugehen und kein Raytracing nutzen möchten, wird diese Karte in den nächsten 2-3 Jahren ein zuverlässiger Begleiter sein. Für professionelle Anwendungen oder 4K-Gaming sollten Sie jedoch die RTX 4050 oder die AMD RX 7600 in Betracht ziehen.

Die Preise sind aktuell für April 2025 für neue Geräte.

Basic

Markenname

NVIDIA

Plattform

Desktop

Erscheinungsdatum

July 2017

Modellname

P106 090

Generation

Mining GPUs

Basis-Takt

1354MHz

Boost-Takt

1531MHz

Bus-Schnittstelle

PCIe 3.0 x16

Transistoren

4,400 million

TMUs

Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.

Foundry

TSMC

Prozessgröße

16 nm

Architektur

Pascal

Speicherspezifikationen

Speichergröße

3GB

Speichertyp

GDDR5

Speicherbus

Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.

192bit

Speichertakt

2002MHz

Bandbreite

Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.

192.2 GB/s

Theoretische Leistung

Pixeltakt

Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.

73.49 GPixel/s

Texture-Takt

Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.

73.49 GTexel/s

FP16 (halbe Genauigkeit)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.

36.74 GFLOPS

FP64 (Doppelte Gleitkommazahl)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

73.49 GFLOPS

FP32 (float)

Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.

2.305 TFLOPS

Verschiedenes

SM-Anzahl

Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.

Shading-Einheiten

Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.

768

L1-Cache

48 KB (per SM)

L2-Cache

1536KB

TDP (Thermal Design Power)

75W

Vulkan-Version

Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.

1.3

OpenCL-Version

3.0

OpenGL

4.6

DirectX

12 (12_1)

CUDA

6.1

Stromanschlüsse

1x 6-pin

Shader-Modell

6.4

ROPs

Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.

Empfohlene PSU (Stromversorgung)

250W

Benchmarks

FP32 (float)

Punktzahl

2.305 TFLOPS

Vulkan

Punktzahl

18660

OpenCL

Punktzahl

20338

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS

Radeon RX 460 1024SP

2.409 +4.5%

Radeon R9 M290X

2.35 +2%

P106 090

2.305

GRID K520

2.243 -2.7%

GeForce GTX 1050 Ti

2.181 -5.4%

Vulkan

Radeon RX 6800M

97530 +422.7%

Radeon RX 6700S

69708 +273.6%

Radeon RX 580 2048SP

40716 +118.2%

P106 090

18660

GeForce 940M

5522 -70.4%

OpenCL

Radeon RX 6700S

62821 +208.9%

Radeon Pro 5300

38843 +91%

Radeon R9 M290X

21442 +5.4%

P106 090

20338

Radeon HD 5750

884 -95.7%