NVIDIA P104 100

NVIDIA P104 100

Über GPU

Die NVIDIA P104 100 GPU ist eine leistungsstarke Grafikkarte, die für den Desktop-Einsatz konzipiert wurde. Mit einer Basistaktung von 1607MHz und einer Boost-Taktung von 1733MHz bietet diese GPU beeindruckende Geschwindigkeit und Leistung für Gaming, Grafikdesign und andere anspruchsvolle Anwendungen. Die 4GB GDDR5X-Speicher und eine Speichertaktung von 1251MHz gewährleisten eine reibungslose und schnelle Darstellung komplexer Grafiken und Texturen. Die 1920 Shader-Einheiten und 2MB L2-Cache tragen weiter dazu bei, dass die GPU in der Lage ist, auch bei schweren Arbeitslasten ohne Geschwindigkeitseinbußen oder Qualitätsverluste zu arbeiten. Eine herausragende Funktion der NVIDIA P104 100 GPU ist ihre vergleichsweise niedrige TDP von 130W, was bedeutet, dass sie hohe Leistung ohne übermäßigen Stromverbrauch oder Überhitzung liefert. Dies macht sie zu einer effizienten und kosteneffektiven Wahl für Benutzer, die eine leistungsstarke GPU benötigen, ohne signifikante Upgrades an ihrem Netzteil oder Kühlsystem vornehmen zu müssen. In Bezug auf die Leistung garantiert die theoretische 6,655 TFLOPS der NVIDIA P104 100 GPU, dass sie auch mit den anspruchsvollsten grafischen Aufgaben mühelos zurechtkommt. Egal, ob Sie bei hohen Auflösungen spielen oder komplexe 3D-Modelle rendnern, diese GPU liefert die Leistung und Geschwindigkeit, die zur Erzielung außergewöhnlicher Ergebnisse erforderlich sind. Insgesamt ist die NVIDIA P104 100 GPU eine solide Wahl für Desktop-Benutzer, die eine leistungsstarke, effiziente und zuverlässige Grafikkarte für ihre Gaming-, Design- oder beruflichen Anforderungen benötigen. Ihre beeindruckenden Spezifikationen und Leistung machen sie zu einer lohnenden Investition für jeden, der eine leistungsstarke GPU benötigt.

Basic

Markenname
NVIDIA
Plattform
Desktop
Erscheinungsdatum
December 2017
Modellname
P104 100
Generation
Mining GPUs
Basis-Takt
1607MHz
Boost-Takt
1733MHz
Bus-Schnittstelle
PCIe 3.0 x16
Transistoren
7,200 million
TMUs
?
Textur-Mapping-Einheiten (TMUs) sind Komponenten der GPU, die in der Lage sind, Binärbilder zu drehen, zu skalieren und zu verzerren und sie dann als Texturen auf jede Ebene eines gegebenen 3D-Modells zu platzieren. Dieser Prozess wird als Textur-Mapping bezeichnet.
120
Foundry
TSMC
Prozessgröße
16 nm
Architektur
Pascal

Speicherspezifikationen

Speichergröße
4GB
Speichertyp
GDDR5X
Speicherbus
?
Der Speicherbus bezieht sich auf die Anzahl der Bits, die das Videomemory innerhalb eines einzelnen Taktzyklus übertragen kann. Je größer die Busbreite, desto mehr Daten können gleichzeitig übertragen werden, was sie zu einem der entscheidenden Parameter des Videomemory macht. Die Speicherbandbreite wird wie folgt berechnet: Speicherbandbreite = Speicherfrequenz x Speicherbusbreite / 8. Wenn also die Speicherfrequenzen ähnlich sind, bestimmt die Speicherbusbreite die Größe der Speicherbandbreite.
256bit
Speichertakt
1251MHz
Bandbreite
?
Die Speicherbandbreite bezieht sich auf die Datenübertragungsrate zwischen dem Grafikchip und dem Videomemory. Sie wird in Bytes pro Sekunde gemessen, und die Formel zur Berechnung lautet: Speicherbandbreite = Arbeitsfrequenz × Speicherbusbreite / 8 Bit.
320.3 GB/s

Theoretische Leistung

Pixeltakt
?
Die Pixel-Füllrate bezieht sich auf die Anzahl der Pixel, die eine Grafikverarbeitungseinheit (GPU) pro Sekunde rendern kann, gemessen in MPixel/s (Millionen Pixel pro Sekunde) oder GPixel/s (Milliarden Pixel pro Sekunde). Es handelt sich dabei um die am häufigsten verwendete Kennzahl zur Bewertung der Pixelverarbeitungsleistung einer Grafikkarte.
110.9 GPixel/s
Texture-Takt
?
Die Textur-Füllrate bezieht sich auf die Anzahl der Textur-Map-Elemente (Texel), die eine GPU in einer Sekunde auf Pixel abbilden kann.
208.0 GTexel/s
FP16 (halbe Genauigkeit)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist. Einfach genaue Gleitkommazahlen (32 Bit) werden für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet, während doppelt genaue Gleitkommazahlen (64 Bit) für wissenschaftliches Rechnen erforderlich sind, das einen großen Zahlenbereich und hohe Genauigkeit erfordert.
104.0 GFLOPS
FP64 (Doppelte Gleitkommazahl)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenleistung. Doppelt genaue Gleitkommazahlen (64 Bit) sind für wissenschaftliches Rechnen erforderlich, das einen großen Zahlenbereich und hohe Genauigkeit erfordert, während einfach genaue Gleitkommazahlen (32 Bit) für übliche Multimedia- und Grafikverarbeitungsaufgaben verwendet werden. Halbgenaue Gleitkommazahlen (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
208.0 GFLOPS
FP32 (float)
?
Eine wichtige Kennzahl zur Messung der GPU-Leistung ist die Gleitkomma-Rechenfähigkeit. Gleitkommazahlen mit einfacher Genauigkeit (32 Bit) werden für allgemeine Multimedia- und Grafikverarbeitungsaufgaben verwendet, während Gleitkommazahlen mit doppelter Genauigkeit (64 Bit) für wissenschaftliche Berechnungen erforderlich sind, die einen großen Zahlenbereich und hohe Genauigkeit erfordern. Gleitkommazahlen mit halber Genauigkeit (16 Bit) werden für Anwendungen wie maschinelles Lernen verwendet, bei denen eine geringere Genauigkeit akzeptabel ist.
6.522 TFLOPS

Verschiedenes

SM-Anzahl
?
Mehrere Streaming-Prozessoren (SPs) bilden zusammen mit anderen Ressourcen einen Streaming-Multiprozessor (SM), der auch als Hauptkern einer GPU bezeichnet wird. Zu diesen zusätzlichen Ressourcen gehören Komponenten wie Warp-Scheduler, Register und gemeinsamer Speicher. Der SM kann als Herz der GPU betrachtet werden, ähnlich wie ein CPU-Kern, wobei Register und gemeinsamer Speicher knappe Ressourcen innerhalb des SM sind.
15
Shading-Einheiten
?
Die grundlegendste Verarbeitungseinheit ist der Streaming-Prozessor (SP), in dem spezifische Anweisungen und Aufgaben ausgeführt werden. GPUs führen paralleles Rechnen durch, was bedeutet, dass mehrere SPs gleichzeitig arbeiten, um Aufgaben zu verarbeiten.
1920
L1-Cache
48 KB (per SM)
L2-Cache
2MB
TDP (Thermal Design Power)
130W
Vulkan-Version
?
Vulkan ist eine plattformübergreifende Grafik- und Rechen-API der Khronos Group, die hohe Leistung und geringen CPU-Overhead bietet. Es ermöglicht Entwicklern die direkte Steuerung der GPU, reduziert den Rendering-Overhead und unterstützt Multi-Threading und Multi-Core-Prozessoren.
1.3
OpenCL-Version
3.0
OpenGL
4.6
DirectX
12 (12_1)
CUDA
6.1
Stromanschlüsse
1x 8-pin
Shader-Modell
6.4
ROPs
?
Die Raster-Operations-Pipeline (ROPs) ist hauptsächlich für die Handhabung von Licht- und Reflexionsberechnungen in Spielen verantwortlich, sowie für die Verwaltung von Effekten wie Kantenglättung (AA), hoher Auflösung, Rauch und Feuer. Je anspruchsvoller die Kantenglättung und Lichteffekte in einem Spiel sind, desto höher sind die Leistungsanforderungen für die ROPs. Andernfalls kann es zu einem starken Einbruch der Bildrate kommen.
64
Empfohlene PSU (Stromversorgung)
200W

Benchmarks

FP32 (float)
Punktzahl
6.522 TFLOPS
Blender
Punktzahl
612
OctaneBench
Punktzahl
122
Vulkan
Punktzahl
45859
OpenCL
Punktzahl
52079

Im Vergleich zu anderen GPUs

FP32 (float) / TFLOPS
6.977 +7%
6.61 +1.3%
6.522
6.181 -5.2%
Blender
1452 +137.3%
612
269 -56%
81 -86.8%
OctaneBench
515 +322.1%
122
67 -45.1%
35 -71.3%
Vulkan
104842 +128.6%
72046 +57.1%
45859
20775 -54.7%
8986 -80.4%
OpenCL
103572 +98.9%
72374 +39%
52079
30631 -41.2%
15023 -71.2%