NVIDIA RTX PRO 4000 Blackwell

NVIDIA RTX PRO 4000 Blackwell

Sobre o processador

RTX PRO 4000 Blackwell é uma GPU Desktop fabricada por NVIDIA. Foi lançado em March 2025. A GPU possui 24GB de memória GDDR7. Os principais feachers da GPU são: Unidades de Sombreamento - 8960, Cache L2 - 48 MB, TDP - 140W, Desempenho Teórico - 45.962 TFLOPS.

Básico

Nome do rótulo
NVIDIA
Plataforma
Desktop
Data de lançamento
March 2025
Nome do modelo
RTX PRO 4000 Blackwell
Geração
Blackwell PRO W
Relógio Base
1590 MHz
Relógio Boost
2617 MHz
Interface de ônibus
PCIe 5.0 x16
Transistores
45.6 billion
Núcleos RT
70
Núcleos Tensor
?
Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.
280
TMUs
?
As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.
280
Fundição
TSMC
Tamanho do Processo
5 nm
Arquitetura
Blackwell 2.0

Especificações de memória

Tamanho da Memória
24GB
Tipo de Memória
GDDR7
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
192bit
Relógio de Memória
1750 MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
672.0GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
251.2 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
732.8 GTexel/s
FP16 (metade)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.
46.90 TFLOPS
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
732.8 GFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
45.962 TFLOPS

Diversos

Contagem de SM
?
Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.
70
Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
8960
Cache L1
128 KB (per SM)
Cache L2
48 MB
TDP
140W
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.4
Versão OpenCL
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
10.1
Conectores de Energia
1x 16-pin
Modelo de Shader
6.8
ROPs
?
O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.
96
PSU Sugerido
300 W

Classificações

FP32 (flutuante)
Pontuação
45.962 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
L20
59.35 +29.1%
50.45 +9.8%
36.672 -20.2%