NVIDIA Tesla K40st

NVIDIA Tesla K40st

Sobre GPU

A GPU NVIDIA Tesla K40st é uma potência no mundo da computação profissional. Com um tamanho de memória de 12GB e um tipo de memória GDDR5, esta GPU é projetada para lidar com cargas de trabalho complexas e exigentes com facilidade. O clock de memória de 1502MHz permite um processamento e manipulação rápida de dados, tornando-a ideal para tarefas como aprendizado profundo, simulações científicas e análise de dados. As 2880 unidades de sombreamento garantem que a GPU possa lidar com um alto nível de processamento paralelo, permitindo cálculos eficientes e rápidos. Além disso, o cache L2 de 1536KB ajuda a acelerar ainda mais o acesso e manipulação de dados, contribuindo para o desempenho geral da GPU. Com um TDP de 245W, o Tesla K40st é uma GPU que consome muita energia, mas o desempenho teórico de 3.312 TFLOPS justifica mais do que o consumo de energia. Esse nível de desempenho torna a GPU adequada para tarefas exigentes, como aprendizado de máquina, física computacional e exploração geofísica. No geral, a GPU NVIDIA Tesla K40st é uma plataforma profissional de ponta que oferece desempenho e confiabilidade excepcionais. Seu grande tamanho de memória, impressionantes unidades de sombreamento e tipo de memória eficiente a tornam um ativo valioso para qualquer ambiente de computação profissional. Se você está trabalhando em simulações complexas, análise de dados em grande escala ou algoritmos de aprendizado de máquina, o Tesla K40st é mais do que capaz de lidar com o trabalho.

Básico

Nome do rótulo
NVIDIA
Plataforma
Professional
Data de lançamento
November 2013
Nome do modelo
Tesla K40st
Geração
Tesla
Interface de ônibus
PCIe 3.0 x16
Transistores
7,080 million
TMUs
?
As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.
240
Fundição
TSMC
Tamanho do Processo
28 nm
Arquitetura
Kepler

Especificações de memória

Tamanho da Memória
12GB
Tipo de Memória
GDDR5
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
384bit
Relógio de Memória
1502MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
288.4 GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
34.50 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
138.0 GTexel/s
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
1104 GFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
3.246 TFLOPS

Diversos

Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
2880
Cache L1
16 KB (per SMX)
Cache L2
1536KB
TDP
245W
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.1
Versão OpenCL
3.0
OpenGL
4.6
DirectX
12 (11_1)
CUDA
3.5
Modelo de Shader
5.1
ROPs
?
O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.
48
PSU Sugerido
550W

Classificações

FP32 (flutuante)
Pontuação
3.246 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
3.393 +4.5%
3.337 +2.8%
3.246
3.098 -4.6%
3.02 -7%