NVIDIA GeForce GTX 660 vs NVIDIA GeForce GTX 1070

Risultato del confronto GPU

Di seguito sono riportati i risultati di un confronto tra le schede video NVIDIA GeForce GTX 660 e NVIDIA GeForce GTX 1070 in base alle caratteristiche prestazionali chiave, nonché al consumo energetico e molto altro.

Vantaggi

  • Più alto Boost Clock: 1683MHz (1032MHz vs 1683MHz)
  • Più grandi Dimensione memoria: 8GB (2GB vs 8GB)
  • Più alto Larghezza di banda: 256.3 GB/s (144.2 GB/s vs 256.3 GB/s)
  • Più Unità di ombreggiatura: 1920 (960 vs 1920)
  • Più nuovo Data di rilascio: June 2016 (September 2012 vs June 2016)

Di base

NVIDIA
Nome dell'etichetta
NVIDIA
September 2012
Data di rilascio
June 2016
Desktop
Piattaforma
Desktop
GeForce GTX 660
Nome del modello
GeForce GTX 1070
GeForce 600
Generazione
GeForce 10
980MHz
Clock base
1506MHz
1032MHz
Boost Clock
1683MHz
PCIe 3.0 x16
Interfaccia bus
PCIe 3.0 x16
2,540 million
Transistor
7,200 million
80
TMUs
?
Le unità di mappatura texture (TMUs) servono come componenti della GPU, in grado di ruotare, scalare, distorcere immagini binarie e poi posizionarle come texture su qualsiasi piano di un dato modello 3D. Questo processo è chiamato mappatura texture.
120
TSMC
Fonderia
TSMC
28 nm
Dimensione del processo
16 nm
Kepler
Architettura
Pascal

Specifiche della memoria

2GB
Dimensione memoria
8GB
GDDR5
Tipo di memoria
GDDR5
192bit
Bus memoria
?
La larghezza del bus di memoria si riferisce al numero di bit di dati che la memoria video può trasferire in un singolo ciclo di clock. Maggiore è la larghezza del bus, maggiore è la quantità di dati che può essere trasmessa istantaneamente. La larghezza del bus di memoria è un parametro cruciale della memoria video. La larghezza di banda della memoria si calcola così: Larghezza di banda della memoria = Frequenza della memoria x Larghezza del bus di memoria / 8.
256bit
1502MHz
Clock memoria
2002MHz
144.2 GB/s
Larghezza di banda
?
La larghezza di banda della memoria si riferisce alla velocità di trasferimento dati tra il chip grafico e la memoria video. Si misura in byte al secondo e la formula per calcolarla è: larghezza di banda della memoria = frequenza di lavoro × larghezza del bus di memoria / 8 bit.
256.3 GB/s

Prestazioni teoriche

20.64 GPixel/s
Tasso di pixel
?
Il tasso di riempimento dei pixel si riferisce al numero di pixel che una unità di elaborazione grafica (GPU) può renderizzare al secondo, misurato in MPixel/s o GPixel/s. È la metrica più comunemente usata per valutare le prestazioni di elaborazione dei pixel di una scheda grafica.
107.7 GPixel/s
82.56 GTexel/s
Tasso di texture
?
Il tasso di riempimento della texture si riferisce al numero di elementi di mappa texture (texel) che una GPU può mappare su pixel in un secondo.
202.0 GTexel/s
-
FP16 (metà)
?
Una metrica importante per misurare le prestazioni della GPU è la capacità di calcolo in virgola mobile. I numeri in virgola mobile a metà precisione (16 bit) vengono utilizzati per applicazioni come l'apprendimento automatico, dove è accettabile una precisione inferiore.
101.0 GFLOPS
82.56 GFLOPS
FP64 (doppio)
?
Una metrica importante per misurare le prestazioni della GPU è la capacità di calcolo in virgola mobile. I numeri in virgola mobile a doppia precisione (64 bit) sono richiesti per il calcolo scientifico che richiede un'ampia gamma numerica e un'alta precisione.
202.0 GFLOPS
2.021 TFLOPS
FP32 (virgola mobile)
?
Una metrica importante per misurare le prestazioni della GPU è la capacità di calcolo in virgola mobile. I numeri a virgola mobile a precisione singola (32 bit) vengono utilizzati per attività comuni di elaborazione grafica e multimediale, mentre i numeri a virgola mobile a precisione doppia (64 bit) sono necessari per il calcolo scientifico che richiede un'ampia gamma numerica e un'elevata precisione. I numeri a virgola mobile a mezza precisione (16 bit) vengono utilizzati per applicazioni come l'apprendimento automatico, dove è accettabile una precisione inferiore.
6.592 TFLOPS

Varie

-
Conteggio SM
?
Più processori di streaming (SP), insieme ad altre risorse, formano un multiprocessore di streaming (SM), che è anche considerato come il nucleo principale di una GPU. Queste risorse aggiuntive includono componenti come i programmi di schedulazione warp, i registri e la memoria condivisa.
15
960
Unità di ombreggiatura
?
L'unità di elaborazione più fondamentale è il processore di streaming (SP), dove vengono eseguite istruzioni e compiti specifici. Le GPU eseguono il calcolo parallelo, il che significa che più SP lavorano contemporaneamente per elaborare i compiti.
1920
16 KB (per SMX)
Cache L1
48 KB (per SM)
384KB
Cache L2
2MB
140W
TDP
150W
1.1
Versione Vulkan
?
Vulkan è un'API di grafica e calcolo multipiattaforma di Khronos Group, che offre prestazioni elevate e un basso sovraccarico della CPU. Consente agli sviluppatori di controllare direttamente la GPU, riduce il sovraccarico del rendering e supporta processori multi-threading e multi-core.
1.3
3.0
Versione OpenCL
3.0
4.6
OpenGL
4.6
3.0
CUDA
6.1
12 (11_0)
DirectX
12 (12_1)
1x 6-pin
Connettori di alimentazione
1x 8-pin
5.1
Modello Shader
6.4
24
ROPs
?
Il raster operations pipeline (ROPs) si occupa principalmente di gestire i calcoli di illuminazione e riflessione nei giochi, così come gestire effetti come l'anti-aliasing (AA), l'alta risoluzione, il fumo e il fuoco. Più esigenti sono gli effetti di anti-aliasing e illuminazione in un gioco, più alte sono le prestazioni richieste per i ROPs.
64
300W
PSU suggerito
450W

Classifiche

FP32 (virgola mobile) / TFLOPS
GeForce GTX 660
2.021
GeForce GTX 1070
6.592 +226%
3DMark Time Spy
GeForce GTX 660
1285
GeForce GTX 1070
5933 +362%
Blender
GeForce GTX 660
126
GeForce GTX 1070
514.06 +308%
Vulkan
GeForce GTX 660
11719
GeForce GTX 1070
49235 +320%
OpenCL
GeForce GTX 660
11135
GeForce GTX 1070
46137 +314%
Hashcat / H/s
GeForce GTX 660
25551
GeForce GTX 1070
330579 +1194%