Início / NVIDIA / NVIDIA B200 SXM 192 GB: Desempenho e especificações

NVIDIA B200 SXM 192 GB

Name: NVIDIA B200 SXM 192 GB
Brand: NVIDIA

A GPU NVIDIA B200 SXM é um gigante no mundo do processamento gráfico. Com um clock base de 1665MHz e um clock boost de 1837MHz, esta GPU oferece velocidades extremamente rápidas para as aplicações mais exigentes. Seus impressionantes 96GB de memória HBM3e e um clock de memória de 2000MHz garantem que você possa lidar até mesmo com as tarefas mais complexas com facilidade. Com 16896 unidades de sombreamento e 50MB de cache L2, a GPU B200 SXM é capaz de lidar com cargas de trabalho intensas sem problemas. O TDP de 1000W pode ser considerado alto, mas é necessário para alimentar as imensas capacidades desta GPU. O desempenho teórico de 60.838 TFLOPS demonstra o poder desta GPU e sua capacidade de lidar até mesmo com as tarefas mais exigentes com facilidade. Se você é um profissional que trabalha em renderização 3D, IA ou simulações científicas, a GPU B200 SXM tem as capacidades para atender às suas necessidades. Embora o consumo de energia desta GPU possa ser uma consideração para alguns, o desempenho que ela oferece mais do que compensa. No geral, a GPU NVIDIA B200 SXM 192GB é uma opção de ponta para aqueles que precisam de desempenho e poder intransigentes em seu processamento gráfico.

Básico

Nome do rótulo

NVIDIA

Plataforma

Desktop

Data de lançamento

January 2024

Nome do modelo

B200 SXM 192 GB

Geração

Tesla Blackwell

Relógio Base

1665MHz

Relógio Boost

1837MHz

Interface de ônibus

PCIe 5.0 x16

Transistores

208,000 million

Núcleos Tensor

Os Tensor Cores são unidades de processamento especializadas projetadas especificamente para aprendizado profundo, oferecendo maior desempenho de treinamento e inferência em comparação ao treinamento FP32.

528

TMUs

As Unidades de Mapeamento de Textura (TMUs) servem como componentes da GPU, capazes de girar, dimensionar e distorcer imagens binárias.

528

Fundição

TSMC

Tamanho do Processo

5 nm

Arquitetura

Blackwell

Especificações de memória

Tamanho da Memória

96GB

Tipo de Memória

HBM3e

Barramento de Memória

A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.

4096bit

Relógio de Memória

2000MHz

Largura de Banda

A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.

4.10 TB/s

Tela e multimídia

Saídas

No outputs

Desempenho Teórico

Taxa de Pixel

A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.

44.09 GPixel/s

Taxa de Textura

A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.

969.9 GTexel/s

FP16 (metade)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.

248.3 TFLOPS

FP64 (duplo)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.

31.04 TFLOPS

FP32 (flutuante)

Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.

60.838 TFLOPS

Diversos

Contagem de SM

Vários Processadores de Streaming (SPs), juntamente com outros recursos, formam um Multiprocessador de Streaming (SM), que também é referido como um núcleo principal da GPU.

132

Unidades de Sombreamento

A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.

16896

Cache L1

256 KB (per SM)

Cache L2

50MB

TDP

1000W

Versão OpenCL

3.0

CUDA

9.0

ROPs

O Raster Operations Pipeline (ROPs) é responsável por lidar com cálculos de iluminação e reflexão em jogos, além de gerenciar efeitos como anti-aliasing (AA), alta resolução, fumaça e fogo.

PSU Sugerido

1400W

Classificações

FP32 (flutuante)

Pontuação

60.838 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS

Radeon RX 7950 XTX

79.478 +30.6%

H200 SXM 141 GB

65.572 +7.8%

B200 SXM 192 GB

60.838

H100 PCIe

52.244 -14.1%

Radeon AI PRO R9700

48.797 -19.8%

Comparações de GPU relacionadas

NVIDIA B200 SXM 192 GB

NVIDIA Quadro RTX 6000

NVIDIA B200 SXM 192 GB

Básico

Especificações de memória

Tela e multimídia

Desempenho Teórico

Diversos

Classificações

Comparado com outra GPU

Comparações de GPU relacionadas

Compartilhar nas redes sociais