NVIDIA RTX PRO 4000 Blackwell Mobile

NVIDIA RTX PRO 4000 Blackwell Mobile

Sobre o processador

RTX PRO 4000 Blackwell Mobile é uma GPU Mobile fabricada por NVIDIA. A GPU possui 16GB de memória GDDR7. Os principais feachers da GPU são: Unidades de Sombreamento - 7680, Cache L2 - 64 MB, TDP - 80W, Desempenho Teórico - 22.579 TFLOPS.

Básico

Nome do rótulo
NVIDIA
Plataforma
Mobile
Nome do modelo
RTX PRO 4000 Blackwell Mobile
Geração
Blackwell-MW
Relógio Base
975 MHz
Relógio Boost
1500 MHz
Interface de ônibus
PCIe 5.0 x16
Transistores
45.6 billion
Núcleos RT
60
Núcleos Tensor
?
Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.
240
TMUs
?
As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.
240
Fundição
TSMC
Tamanho do Processo
5 nm
Arquitetura
Blackwell 2.0

Especificações de memória

Tamanho da Memória
16GB
Tipo de Memória
GDDR7
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
256bit
Relógio de Memória
1750 MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
896.0GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
144.0 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
360.0 GTexel/s
FP16 (metade)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.
23.04 TFLOPS
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
360.0 GFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
22.579 TFLOPS

Diversos

Contagem de SM
?
Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.
60
Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
7680
Cache L1
128 KB (per SM)
Cache L2
64 MB
TDP
80W
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.4
Versão OpenCL
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
10.1
Conectores de Energia
None
Modelo de Shader
6.8
ROPs
?
O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.
96

Classificações

FP32 (flutuante)
Pontuação
22.579 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
27.097 +20%
23.177 +2.6%
21.58 -4.4%
20.325 -10%