NVIDIA RTX PRO 3000 Blackwell Mobile

NVIDIA RTX PRO 3000 Blackwell Mobile

Sobre o processador

RTX PRO 3000 Blackwell Mobile é uma GPU Mobile fabricada por NVIDIA. A GPU possui 12GB de memória GDDR7. Os principais feachers da GPU são: Unidades de Sombreamento - 5888, Cache L2 - 48 MB, TDP - 60W, Desempenho Teórico - 16.699 TFLOPS.

Básico

Nome do rótulo
NVIDIA
Plataforma
Mobile
Nome do modelo
RTX PRO 3000 Blackwell Mobile
Geração
Blackwell-MW
Relógio Base
847 MHz
Relógio Boost
1447 MHz
Interface de ônibus
PCIe 5.0 x16
Transistores
31.1 billion
Núcleos RT
46
Núcleos Tensor
?
Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.
184
TMUs
?
As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.
184
Fundição
TSMC
Tamanho do Processo
5 nm
Arquitetura
Blackwell 2.0

Especificações de memória

Tamanho da Memória
12GB
Tipo de Memória
GDDR7
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
192bit
Relógio de Memória
1750 MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
672.0GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
92.61 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
266.2 GTexel/s
FP16 (metade)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.
17.04 TFLOPS
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
266.2 GFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
16.699 TFLOPS

Diversos

Contagem de SM
?
Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.
46
Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
5888
Cache L1
128 KB (per SM)
Cache L2
48 MB
TDP
60W
Versão Vulkan
?
Vulkan é uma API gráfica e de computação multiplataforma do Khronos Group, que oferece alto desempenho e baixa sobrecarga de CPU. Ele permite que os desenvolvedores controlem a GPU diretamente, reduz a sobrecarga de renderização e oferece suporte a processadores multi-threading e multi-core.
1.4
Versão OpenCL
3.0
OpenGL
4.6
DirectX
12 Ultimate (12_2)
CUDA
10.1
Conectores de Energia
None
Modelo de Shader
6.8
ROPs
?
O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.
64

Classificações

FP32 (flutuante)
Pontuação
16.699 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
19.1 +14.4%
18.38 +10.1%
15.984 -4.3%
15.606 -6.5%