NVIDIA L40S
vs
NVIDIA GeForce GTX TITAN X

vs

Resultado de comparação de GPU

Abaixo estão os resultados de uma comparação de placas de vídeo NVIDIA L40S e NVIDIA GeForce GTX TITAN X com base nas principais características de desempenho, bem como consumo de energia e muito mais.

Vantagens

  • Mais alto Relógio Boost: 2520MHz (2520MHz vs 1089MHz)
  • Maior Tamanho da Memória: 48GB (48GB vs 12GB)
  • Mais alto Largura de Banda: 864.0 GB/s (864.0 GB/s vs 336.6 GB/s)
  • Mais Unidades de Sombreamento: 18176 (18176 vs 3072)
  • Mais recente Data de lançamento: October 2022 (October 2022 vs March 2015)

Básico

NVIDIA
Nome do rótulo
NVIDIA
October 2022
Data de lançamento
March 2015
Desktop
Plataforma
Desktop
L40S
Nome do modelo
GeForce GTX TITAN X
Tesla Ada
Geração
GeForce 900
1110MHz
Relógio Base
1000MHz
2520MHz
Relógio Boost
1089MHz
PCIe 4.0 x16
Interface de ônibus
PCIe 3.0 x16
76,300 million
Transistores
8,000 million
142
Núcleos RT
-
568
Núcleos Tensor
?
Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.
-
568
TMUs
?
As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.
192
TSMC
Fundição
TSMC
5 nm
Tamanho do Processo
28 nm
Ada Lovelace
Arquitetura
Maxwell 2.0

Especificações de memória

48GB
Tamanho da Memória
12GB
GDDR6
Tipo de Memória
GDDR5
384bit
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
384bit
2250MHz
Relógio de Memória
1753MHz
864.0 GB/s
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
336.6 GB/s

Desempenho Teórico

483.8 GPixel/s
Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
104.5 GPixel/s
1431 GTexel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
209.1 GTexel/s
91.61 TFLOPS
FP16 (metade)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.
-
1431 GFLOPS
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
209.1 GFLOPS
89.778 TFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
6.557 TFLOPS

Diversos

142
Contagem de SM
?
Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.
-
18176
Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
3072
128 KB (per SM)
Cache L1
48 KB (per SMM)
48MB
Cache L2
3MB
300W
TDP
250W
1.3
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.3
3.0
Versão OpenCL
3.0
4.6
OpenGL
4.6
12 Ultimate (12_2)
DirectX
12 (12_1)
8.9
CUDA
5.2
1x 16-pin
Conectores de Energia
1x 6-pin + 1x 8-pin
192
ROPs
?
O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.
96
6.7
Modelo de Shader
6.4
700W
PSU Sugerido
600W

Classificações

FP32 (flutuante) / TFLOPS
L40S
89.778 +1269%
GeForce GTX TITAN X
6.557
Blender
L40S
7254.03 +1898%
GeForce GTX TITAN X
363
OpenCL
L40S
362331 +864%
GeForce GTX TITAN X
37596

Comparações de GPU relacionadas