NVIDIA GeForce GTX 960A

NVIDIA GeForce GTX 960A

NVIDIA GeForce GTX 960A: Budget-GPU für moderne Aufgaben

April 2025


Einführung

Die NVIDIA GeForce GTX 960A ist eine aktualisierte Version der legendären GTX 960, die an die Anforderungen des Jahres 2025 angepasst wurde. Diese Grafikkarte wird als kostengünstige Lösung für Gamer und Benutzer positioniert, die eine stabile Leistung ohne übermäßigen Schnickschnack benötigen. In diesem Artikel werden wir die Besonderheiten der GTX 960A, ihre Zielgruppe und die zu erwartenden Kompromisse erörtern.


1. Architektur und wichtige Merkmale

Architektur: Die GTX 960A basiert auf einer verbesserten Architektur NVIDIA Turing (nicht zu verwechseln mit der RTX-Serie). Dies ermöglicht eine bessere Energieeffizienz im Vergleich zur Original-Maxwell, jedoch ohne Unterstützung für Raytracing (RTX) und DLSS.

Fertigungstechnologie: Die Karte wird im 8-nm-Fertigungsverfahren von Samsung hergestellt, was die Abwärme und die Produktionskosten senkt.

Einzigartige Funktionen:

- Adaptive Shading: Optimierung der Belastung der Shader-Einheiten zur Erhöhung der FPS in dynamischen Szenen.

- NVENC: Hardware-Videocodierung für Streamer (bis zu 4K 60 FPS in OBS).

- Unterstützung für DirectX 12 Ultimate: Teilweise Implementierung von Funktionen, jedoch ohne hardwarebeschleunigte RT-Kerne.

Fehlende RTX-Technologien: Die GTX 960A unterstützt kein Raytracing oder DLSS, was ihre Verwendung in modernen AAA-Spielen mit RT-Effekten einschränkt.


2. Speicher

- Speichertyp: GDDR6 (im Vergleich zu GDDR5 bei der Original GTX 960).

- Kapazität: 6 GB – ein komfortables Minimum für Spiele im Jahr 2025 bei mittleren Einstellungen.

- Bus und Bandbreite: Der 192-Bit-Bus ermöglicht 336 GB/s (im Vergleich zu 112 GB/s bei der GTX 960). Dies reduziert das „Flaschenhals“-Problem bei Auflösungen über 1080p.

Einfluss auf die Leistung:

- In Spielen mit hohem VRAM-Bedarf (zum Beispiel Cyberpunk 2077: Phantom Liberty) sind 6 GB ausreichend für Texturen mittlerer Qualität.

- Für die Bearbeitung von 4K-Videos in DaVinci Resolve ist der Speicher entscheidend – das Rendern komplexer Projekte ist möglich, jedoch mit Einschränkungen.


3. Spieleleistung

Auflösung 1080p (mittlere/hohe Einstellungen):

- Fortnite: 90-110 FPS (ohne DLSS).

- Apex Legends: 75-90 FPS.

- Elden Ring: 50-60 FPS (mittlere Einstellungen).

1440p: Es sind reduzierte Einstellungen erforderlich. Zum Beispiel erzielt Call of Duty: Warzone 3 45-55 FPS.

4K: Nicht empfohlen – Assassin’s Creed Nexus erreicht kaum 25 FPS bei niedrigen Einstellungen.

Raytracing: Wird nicht unterstützt. Bei Aktivierung der softwareseitigen Emulation (zum Beispiel über Proton) sinken die FPS um das 2-3-fache.


4. Professionelle Aufgaben

- Videobearbeitung: Dank NVENC und 6 GB VRAM meistert die Karte das Rendering von 4K-Videos in Premiere Pro, aber die Bearbeitungszeit ist 20-30% länger als bei der RTX 3050.

- 3D-Modellierung: In Blender und Maya bieten die CUDA-Kerne eine grundlegende Leistung, aber das Fehlen von RT-Beschleunigern verlangsamt das Rendering komplexer Szenen.

- Wissenschaftliche Berechnungen: Die Unterstützung von OpenCL 3.0 und CUDA 8.0 macht die GTX 960A geeignet für maschinelles Lernen auf Einstiegsniveau, jedoch wäre für ernsthafte Aufgaben eine RTX mit Tensor Core die bessere Wahl.


5. Energieverbrauch und Abwärme

- TDP: 95 W – 25% effizienter als die Original GTX 960.

- Kühlung: Das Referenzmodell verwendet ein Zweiventilatorensystem. Die Temperatur unter Last liegt bei 68-72 °C.

- Gehäuseempfehlungen: Ein Gehäuse mit 2-3 Lüftern ist ausreichend. Für kompakte Build-Optionen eignen sich Modelle mit einer Längenbeschränkung von bis zu 220 mm.


6. Vergleich mit Konkurrenten

AMD Radeon RX 6500 XT (4 GB GDDR6):

- Vorteile: Unterstützung für FSR 3.0, etwas höhere FPS in Vulkan-Spielen.

- Nachteile: Nur 4 GB Speicher, schwache Unterstützung für professionelle Software.

Intel Arc A580 (8 GB GDDR6):

- Vorteile: Mehr Speicher, besseres Handling von DX12.

- Nachteile: Höherer Energieverbrauch (130 W), Probleme mit Treibern unter Linux.

Fazit: Die GTX 960A gewinnt durch Stabilität und Unterstützung von CUDA, verliert jedoch in „schwierigen“ Szenarien.


7. Praktische Tipps

- Netzteil: 450 W sind ausreichend (zum Beispiel Corsair CX450).

- Kompatibilität: PCIe 4.0 x8 – funktioniert auch auf älteren Plattformen (PCIe 3.0) mit einem Leistungsverlust von bis zu 5%.

- Treiber: GeForce Experience regelmäßig aktualisieren. Für Linux wird der proprietäre Treiber der Version 550+ empfohlen.

Wichtig: Die Karte benötigt keine zusätzliche Stromversorgung – der PCIe-Slot reicht aus.


8. Vor- und Nachteile

Vorteile:

- Niedriger Preis: 199 $ für das neue Modell.

- Energieeffizienz.

- Unterstützung moderner APIs (DX12 Ultimate, Vulkan 1.3).

Nachteile:

- Keine Hardware Ray Tracing und DLSS.

- Nur 6 GB Speicher – Einschränkung für zukünftige Spiele.

- Geringes Übertaktungspotenzial.


9. Fazit: Für wen eignet sich die GTX 960A?

Diese Grafikkarte ist die Wahl für diejenigen, die nach einem Gleichgewicht von Preis und Leistung suchen:

- Gamer, die Projekte wie Apex Legends oder Fortnite in 1080p spielen.

- Streamer, denen Stabilität und NVENC wichtig sind.

- Angehende Video-Editoren und 3D-Designer mit begrenztem Budget.

Sollten Sie jedoch in die Welt des Ray-Tracings eintauchen oder mit 8K-Inhalten arbeiten wollen, wird Ihnen die GTX 960A als zu schwach erscheinen. Im Jahr 2025 ist dies die optimale Wahl für diejenigen, die nicht bereit sind, für zukünftige Technologien zu viel zu zahlen, aber trotzdem komfortabel arbeiten und spielen möchten.

Basic

Markenname
NVIDIA
Plattform
Mobile
Erscheinungsdatum
March 2015
Modellname
GeForce GTX 960A
Generation
GeForce 900A
Basis-Takt
1029MHz
Boost-Takt
1085MHz
Bus-Schnittstelle
MXM-B (3.0)
Transistoren
1,870 million
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
40
Foundry
TSMC
Prozessgröße
28 nm
Architektur
Maxwell

Speicherspezifikationen

Speichergröße
2GB
Speichertyp
GDDR5
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
128bit
Speichertakt
1253MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
80.19 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
17.36 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
43.40 GTexel/s
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
43.40 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
1.361 TFLOPS

Verschiedenes

Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
640
L1-Cache
64 KB (per SMM)
L2-Cache
2MB
TDP (Thermal Design Power)
75W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 (11_0)
CUDA
5.0
Shader-Modell
5.1
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
16

Benchmarks

FP32 (float)
Punktzahl
1.361 TFLOPS
OpenCL
Punktzahl
11820

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
1.417 +4.1%
1.387 +1.9%
1.333 -2.1%
OpenCL
62821 +431.5%
38843 +228.6%
21442 +81.4%
884 -92.5%