NVIDIA T400

NVIDIA T400

Über GPU

Die NVIDIA T400 GPU ist eine budgetfreundliche Option für Desktop-Benutzer, die auf der Suche nach einer zuverlässigen Grafikkarte sind. Mit einer Basistaktung von 420 MHz und einer Boost-Taktung von 1425 MHz bietet diese GPU eine anständige Leistung für Gelegenheitsspieler, Videostreaming und andere multimediale Aufgaben. Die 2 GB GDDR6 Speichergröße und eine Speichertaktung von 1250 MHz ermöglichen eine reibungslose und reaktionsfähige Grafikdarstellung, während die 384 Shading-Einheiten und der 1024 KB L2-Cache zur Gesamteffizienz der GPU beitragen. Der T400 hat eine niedrige thermische Designleistung (TDP) von 30 W, was ihn zu einer energieeffizienten Option für Benutzer macht, die auf den Stromverbrauch achten. Obwohl der T400 möglicherweise nicht die gleiche High-End-Leistung wie teurere GPUs bietet, ist seine theoretische Leistung von 1,094 TFLOPS respektabel für seine Preisklasse. Dies macht ihn zu einer geeigneten Option für Personen, die keine erstklassigen Grafikfunktionen benötigen, aber dennoch eine zuverlässige und leistungsfähige GPU für den täglichen Gebrauch möchten. Insgesamt ist die NVIDIA T400 GPU eine solide Wahl für preisbewusste Verbraucher, die eine zuverlässige Grafikkarte für ihre Desktop-Systeme suchen. Ihre Kombination aus Leistung, Energieeffizienz und Wert macht sie zu einer überzeugenden Option für diejenigen, die ein Gleichgewicht zwischen Kosten und Leistungsfähigkeit in ihrer Grafikhardware suchen.

Basic

Markenname
NVIDIA
Plattform
Desktop
Erscheinungsdatum
May 2021
Modellname
T400
Generation
Quadro
Basis-Takt
420MHz
Boost-Takt
1425MHz
Bus-Schnittstelle
PCIe 3.0 x16
Transistoren
4,700 million
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
24
Foundry
TSMC
Prozessgröße
12 nm
Architektur
Turing

Speicherspezifikationen

Speichergröße
2GB
Speichertyp
GDDR6
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
64bit
Speichertakt
1250MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
80.00 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
22.80 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
34.20 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
2.189 TFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
34.20 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
1.072 TFLOPS

Verschiedenes

SM-Anzahl
?
Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.
6
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
384
L1-Cache
64 KB (per SM)
L2-Cache
1024KB
TDP (Thermal Design Power)
30W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 (12_1)
CUDA
7.5
Stromanschlüsse
None
Shader-Modell
6.6
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
16
Empfohlene PSU (Stromversorgung)
200W

Benchmarks

FP32 (float)
Punktzahl
1.072 TFLOPS
3DMark Time Spy
Punktzahl
1420
Vulkan
Punktzahl
15891
OpenCL
Punktzahl
17024

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
1.142 +6.5%
1.106 +3.2%
1.072
1.037 -3.3%
1.007 -6.1%
3DMark Time Spy
5182 +264.9%
3906 +175.1%
2755 +94%
1769 +24.6%
1420
Vulkan
98446 +519.5%
69708 +338.7%
40716 +156.2%
18660 +17.4%
15891
OpenCL
62821 +269%
38843 +128.2%
21442 +26%
17024
884 -94.8%