Início / NVIDIA / NVIDIA Tesla T4: Desempenho e especificações

NVIDIA Tesla T4

Name: NVIDIA Tesla T4
Brand: NVIDIA

A GPU NVIDIA Tesla T4 é uma unidade de processamento gráfico de qualidade profissional que oferece desempenho excepcional e eficiência para uma ampla gama de cargas de trabalho intensivas em computação. Com uma velocidade de clock base de 585MHz e uma velocidade de clock de impulso de 1590MHz, o T4 é capaz de oferecer altos níveis de potência de processamento para aplicações exigentes. Uma das características marcantes do Tesla T4 é sua memória de 16GB de GDDR6, que oferece capacidade ampla para armazenar e manipular grandes conjuntos de dados. A velocidade de clock da memória de 1250MHz garante acesso rápido e responsivo aos dados, enquanto as 2560 unidades de sombreamento permitem processamento em paralelo para desempenho acelerado. Apesar de suas impressionantes capacidades de desempenho, o Tesla T4 também é notavelmente eficiente em termos de energia, com um TDP de apenas 70W. Isso significa que o T4 pode oferecer altos níveis de potência de computação, mantendo o consumo de energia e a geração de calor a um mínimo, tornando-o uma opção atraente para implantações em data centers e servidores. Com um desempenho teórico de 8.141 TFLOPS, o Tesla T4 é adequado para uma variedade de aplicações, incluindo aprendizado profundo, aprendizado de máquina e computação de alto desempenho. Seus 4MB de cache L2 melhoram ainda mais sua capacidade de lidar eficientemente com cargas de trabalho grandes e complexas. No geral, a GPU NVIDIA Tesla T4 oferece uma combinação excepcional de desempenho, eficiência e versatilidade, tornando-a uma escolha convincente para usuários profissionais que buscam capacidades de computação poderosas e confiáveis.

Básico

Nome do rótulo

NVIDIA

Plataforma

Professional

Data de lançamento

September 2018

Nome do modelo

Tesla T4

Geração

Tesla

Relógio Base

585MHz

Relógio Boost

1590MHz

Interface de ônibus

PCIe 3.0 x16

Transistores

13,600 million

Núcleos RT

Núcleos Tensor

Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.

320

TMUs

As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.

160

Fundição

TSMC

Tamanho do Processo

12 nm

Arquitetura

Turing

Especificações de memória

Tamanho da Memória

16GB

Tipo de Memória

GDDR6

Barramento de Memória

A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.

256bit

Relógio de Memória

1250MHz

Largura de Banda

A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.

320.0 GB/s

Tela e multimídia

Saídas

No outputs

Desempenho Teórico

Taxa de Pixel

A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.

101.8 GPixel/s

Taxa de Textura

A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.

254.4 GTexel/s

FP16 (metade)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.

65.13 TFLOPS

FP64 (duplo)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.

254.4 GFLOPS

FP32 (flutuante)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.

8.304 TFLOPS

Diversos

Contagem de SM

Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.

Unidades de Sombreamento

A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.

2560

Cache L1

64 KB (per SM)

Cache L2

4MB

TDP

70W

Versão Vulkan

Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.

1.3

Versão OpenCL

3.0

OpenGL

4.6

CUDA

7.5

DirectX

12 Ultimate (12_2)

Conectores de Energia

None

ROPs

O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.

Modelo de Shader

6.6

PSU Sugerido

250W

Classificações

FP32 (flutuante)

Pontuação

8.304 TFLOPS

Blender

Pontuação

1693

OctaneBench

Pontuação

159

OpenCL

Pontuação

61276

Comparado com outra GPU

FP32 (flutuante) / TFLOPS

GeForce RTX 3050 8 GB GA107

8.916 +7.4%

GeForce GTX 1080 11Gbps

8.696 +4.7%

Tesla T4

8.304

Radeon R9 Nano

8.028 -3.3%

Radeon Pro Vega 48

7.52 -9.4%

Blender

GeForce RTX 5070

6225.46 +267.7%

RTX A5000

2981 +76.1%

Tesla T4

1693

TITAN Xp

973 -42.5%

GeForce GTX 1070

514.06 -69.6%

OctaneBench

GeForce RTX 4080 12 GB

914 +474.8%

GeForce RTX 4060

348 +118.9%

Tesla T4

159

Tesla M60

79 -50.3%

GeForce GTX 950 Low Power

45 -71.7%

OpenCL

Radeon RX 7800M

109617 +78.9%

Radeon RX 7700S

77320 +26.2%

Tesla T4

61276

Radeon Pro 5300

38843 -36.6%

GeForce GTX 980M

23366 -61.9%

Comparações de GPU relacionadas

NVIDIA Tesla T4

NVIDIA GeForce RTX 4060

NVIDIA A2

NVIDIA Tesla T4

NVIDIA Tesla T4

Básico

Especificações de memória

Tela e multimídia

Desempenho Teórico

Diversos

Classificações

Comparado com outra GPU

Comparações de GPU relacionadas

Compartilhar nas redes sociais