NVIDIA Tesla K40st

NVIDIA Tesla K40st

Sobre GPU

A GPU NVIDIA Tesla K40st é uma potência no mundo da computação profissional. Com um tamanho de memória de 12GB e um tipo de memória GDDR5, esta GPU é projetada para lidar com cargas de trabalho complexas e exigentes com facilidade. O clock de memória de 1502MHz permite um processamento e manipulação rápida de dados, tornando-a ideal para tarefas como aprendizado profundo, simulações científicas e análise de dados. As 2880 unidades de sombreamento garantem que a GPU possa lidar com um alto nível de processamento paralelo, permitindo cálculos eficientes e rápidos. Além disso, o cache L2 de 1536KB ajuda a acelerar ainda mais o acesso e manipulação de dados, contribuindo para o desempenho geral da GPU. Com um TDP de 245W, o Tesla K40st é uma GPU que consome muita energia, mas o desempenho teórico de 3.312 TFLOPS justifica mais do que o consumo de energia. Esse nível de desempenho torna a GPU adequada para tarefas exigentes, como aprendizado de máquina, física computacional e exploração geofísica. No geral, a GPU NVIDIA Tesla K40st é uma plataforma profissional de ponta que oferece desempenho e confiabilidade excepcionais. Seu grande tamanho de memória, impressionantes unidades de sombreamento e tipo de memória eficiente a tornam um ativo valioso para qualquer ambiente de computação profissional. Se você está trabalhando em simulações complexas, análise de dados em grande escala ou algoritmos de aprendizado de máquina, o Tesla K40st é mais do que capaz de lidar com o trabalho.

Básico

Nome do rótulo
NVIDIA
Plataforma
Professional
Data de lançamento
November 2013
Nome do modelo
Tesla K40st
Geração
Tesla
Interface de ônibus
PCIe 3.0 x16

Especificações de memória

Tamanho da Memória
12GB
Tipo de Memória
GDDR5
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
384bit
Relógio de Memória
1502MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
288.4 GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
34.50 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
138.0 GTexel/s
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
1104 GFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
3.246 TFLOPS

Diversos

Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
2880
Cache L1
16 KB (per SMX)
Cache L2
1536KB
TDP
245W
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.1
Versão OpenCL
3.0

Classificações

FP32 (flutuante)
Pontuação
3.246 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
3.264 +0.6%
3.249 +0.1%
3.246
3.237 -0.3%
3.231 -0.5%