AMD Instinct MI100

AMD Instinct MI100

Sobre GPU

A GPU AMD Instinct MI100 é uma unidade de processamento gráfico de grau profissional projetada para computação de alta performance e cargas de trabalho intensivas em dados. Com uma velocidade de clock base de 1000MHz e um clock de boost de 1502MHz, esta GPU oferece excepcional poder de processamento para uma ampla gama de aplicações. Uma das características mais impressionantes do Instinct MI100 é sua enorme memória de 32GB de HBM2, que permite lidar com grandes conjuntos de dados e cálculos complexos com facilidade. O clock de memória de 1200MHz ainda melhora as velocidades de transferência de dados, garantindo um desempenho suave e eficiente. Com 7680 unidades de sombreamento e 8MB de cache L2, a GPU MI100 é capaz de lidar com cargas de trabalho altamente paralelas e tarefas computacionais complexas. Isso a torna uma escolha ideal para aprendizado profundo, simulações científicas e outras aplicações exigentes. Apesar de seu poderoso desempenho, a GPU AMD Instinct MI100 também é eficiente em termos energéticos, com um TDP de 300W. Isso garante que ela possa oferecer alto desempenho sem consumir quantidades excessivas de energia. O desempenho teórico de 23,07 TFLOPS demonstra o imenso poder computacional desta GPU, tornando-a adequada para tarefas críticas que exigem processamento e análise rápidos de dados. No geral, a GPU AMD Instinct MI100 é uma solução altamente capaz e versátil para profissionais e organizações que requerem desempenho intransigente para suas cargas de trabalho baseadas em dados. Seja usada para pesquisa em IA, biologia computacional ou simulações complexas, a GPU MI100 oferece desempenho e confiabilidade excepcionais.

Básico

Nome do rótulo
AMD
Plataforma
Professional
Data de lançamento
November 2020
Nome do modelo
Radeon Instinct MI100
Geração
Radeon Instinct
Relógio Base
1000MHz
Relógio Boost
1502MHz
Interface de ônibus
PCIe 4.0 x16

Especificações de memória

Tamanho da Memória
32GB
Tipo de Memória
HBM2
Barramento de Memória
?
A largura do barramento de memória se refere ao número de bits de dados que a memória de vídeo pode transferir em um ciclo de clock. Quanto maior a largura do barramento, maior a quantidade de dados que pode ser transmitida instantaneamente.
4096bit
Relógio de Memória
1200MHz
Largura de Banda
?
A largura de banda da memória se refere à taxa de transferência de dados entre o chip gráfico e a memória de vídeo. É medida em bytes por segundo.
1229 GB/s

Desempenho Teórico

Taxa de Pixel
?
A taxa de preenchimento de pixels refere-se ao número de pixels que uma unidade de processamento gráfico (GPU) pode renderizar por segundo, medida em MPixels/s ou GPixels/s.
96.13 GPixel/s
Taxa de Textura
?
A taxa de preenchimento de textura se refere ao número de elementos do mapa de textura (texels) que uma GPU pode mapear para pixels em um único segundo.
721.0 GTexel/s
FP16 (metade)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de meia precisão (16 bits) são usados em aplicações como aprendizado de máquina.
184.6 TFLOPS
FP64 (duplo)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica.
11.54 TFLOPS
FP32 (flutuante)
?
Uma métrica importante para medir o desempenho da GPU é a capacidade de computação de ponto flutuante. Números de ponto flutuante de precisão simples (32 bits) são usados para tarefas comuns de processamento multimídia e gráfico, enquanto números de ponto flutuante de precisão dupla (64 bits) são necessários para computação científica que exige uma ampla faixa numérica e alta precisão. Números de ponto flutuante de meia precisão (16 bits) são usados para aplicações como aprendizado de máquina, onde uma precisão menor é aceitável.
22.609 TFLOPS

Diversos

Unidades de Sombreamento
?
A unidade de processamento mais fundamental é o Processador de Streaming (SP), onde instruções e tarefas específicas são executadas. GPUs realizam computação paralela.
7680
Cache L1
16 KB (per CU)
Cache L2
8MB
TDP
300W

Classificações

FP32 (flutuante)
Pontuação
22.609 TFLOPS

Comparado com outra GPU

FP32 (flutuante) / TFLOPS
28.325 +25.3%
23.531 +4.1%
20.053 -11.3%