ホーム / NVIDIA / NVIDIA RTX A4000: 性能とスペック

NVIDIA RTX A4000

Name: NVIDIA RTX A4000
Brand: NVIDIA

NVIDIAのRTX A4000は、印象的なパフォーマンスと幅広い機能を提供するプロフェッショナル向けのGPUであり、プロの使用に最適な選択肢となっています。ベースクロックは735MHz、ブーストクロックは1560MHzであり、最も要求の厳しいタスクにも対応できるパワフルなパフォーマンスを提供しています。 RTX A4000の特筆すべき点の1つは、16GBのGDDR6メモリであり、大規模なデータセットや複雑な可視化作業時のスムーズで反応性のあるパフォーマンスを可能にします。1750MHzのメモリクロックとあわせて、GPUはデータ集約型のタスクを簡単に処理できます。140WのTDPも意味において、GPUは効率的に動作し、過剰な電力を消費しません。 GPUの6144のシェーディングユニットと4MBのL2キャッシュは、19.17 TFLOPSという高い理論パフォーマンスに貢献し、複雑なシミュレーションやレンダリングタスクに信頼性のある選択肢となります。テストでは、RTX A4000は3DMark Time Spyで11176のスコアを獲得し、Shadow of the Tomb Raiderでは1080pの解像度で150fpsという印象的なパフォーマンスを達成しています。全体として、NVIDIA RTX A4000は、幅広いプロフェッショナル向けアプリケーションに適した優れたパフォーマンスと機能を提供する強力で多目的なGPUです。複雑なシミュレーション、大規模な可視化、高精細なレンダリングといった作業に取り組んでいる場合でも、RTX A4000はパフォーマンスと効率の両方で期待通りの結果を提供します。

基本

レーベル名

NVIDIA

プラットホーム

Professional

発売日

April 2021

モデル名

RTX A4000

世代

Quadro

ベースクロック

735MHz

ブーストクロック

1560MHz

バスインターフェース

PCIe 4.0 x16

トランジスタ

17,400 million

RTコア

テンソルコア

テンソルコアは深層学習専用に設計された特化型プロセッサで、FP32トレーニングと比較して高いトレーニングと推論性能を提供します。コンピュータビジョン、自然言語処理、音声認識、テキストから音声への変換、個別の推奨などの領域で迅速な計算を可能にします。テンソルコアの最も注目すべき応用は、DLSS（Deep Learning Super Sampling）とAI Denoiserのノイズリダクションです。

192

TMU

テクスチャマッピングユニット（TMUs）は、二進画像を回転、スケーリング、歪曲して、それを3Dモデルの任意の平面にテクスチャとして配置することができるGPUのコンポーネントです。このプロセスはテクスチャマッピングと呼ばれます。

192

ファウンドリ

Samsung

プロセスサイズ

8 nm

アーキテクチャ

Ampere

メモリ仕様

メモリサイズ

16GB

メモリタイプ

GDDR6

メモリバス

メモリバス幅とは、1クロックサイクル内にビデオメモリが転送できるデータのビット数を指します。バス幅が大きいほど、一度に転送できるデータ量が多くなります。メモリバンド幅の計算式は次の通りです：メモリバンド幅 = メモリ周波数 x メモリバス幅 / 8。

256bit

メモリクロック

1750MHz

帯域幅

メモリバンド幅は、グラフィックチップとビデオメモリ間のデータ転送速度を指します。単位はバイト/秒で、計算式は次の通りです：メモリバンド幅 = 動作周波数 × メモリバス幅 / 8ビット。

448.0 GB/s

ディスプレイとメディア

出力

4x DisplayPort 1.4a

理論上の性能

ピクセルレート

ピクセル塗りつぶし率は、グラフィックスプロセッシングユニット（GPU）が1秒あたりにレンダリングできるピクセル数を指します。これは、MPixels/s（百万ピクセル/秒）またはGPixels/s（十億ピクセル/秒）で測定されます。これはグラフィックスカードのピクセル処理性能を評価するために最も一般的に使用される指標です。

149.8 GPixel/s

テクスチャレート

テクスチャ塗りつぶし率は、GPUが1秒間にピクセルにマッピングできるテクスチャマップ要素（テクセル）の数を指します。

299.5 GTexel/s

FP16 (半精度)

GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。半精度浮動小数点数（16ビット）は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。単精度浮動小数点数（32ビット）は、一般的なマルチメディアやグラフィックス処理のタスクで使用され、倍精度浮動小数点数（64ビット）は、広範で高精度が求められる科学計算に必要です。

19.17 TFLOPS

FP64 (倍精度)

GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。倍精度浮動小数点数（64ビット）は、広範で高精度が求められる科学計算に必要です。単精度浮動小数点数（32ビット）は、一般的なマルチメディアやグラフィックス処理のタスクで使用されます。半精度浮動小数点数（16ビット）は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。

599.0 GFLOPS

FP32 (浮動小数点)

GPU のパフォーマンスを測定するための重要な指標は、浮動小数点コンピューティング能力です。単精度浮動小数点数 (32 ビット) は一般的なマルチメディアおよびグラフィックス処理タスクに使用されますが、倍精度浮動小数点数 (64 ビット) は広い数値範囲と高精度が要求される科学計算に必要です。半精度浮動小数点数 (16 ビット) は、精度が低くても許容される機械学習などのアプリケーションに使用されます。

19.553 TFLOPS

その他

SM数

ストリーミングプロセッサ（SP）は他のリソースとともに、ストリーミングマルチプロセッサ（SM）を形成し、これはGPUの主要コアとも呼ばれます。これらの追加リソースには、ワープスケジューラ、レジスタ、共有メモリなどのコンポーネントが含まれます。SMは、レジスタや共有メモリが希少なリソースであるGPUの中心部と考えることができます。

シェーディングユニット

最も基本的な処理単位はストリーミングプロセッサ（SP）で、特定の指示とタスクが実行されます。GPUは並行計算を行い、複数のSPが同時にタスクを処理します。

6144

L1キャッシュ

128 KB (per SM)

L2キャッシュ

4MB

TDP

140W

Vulkanのバージョン

Vulkanは、Khronos Groupによるクロスプラットフォームのグラフィックスおよび計算APIで、高性能と低CPU負荷を提供します。開発者がGPUを直接制御し、レンダリングのオーバーヘッドを減らし、マルチスレッドとマルチコアプロセッサをサポートします。

1.3

OpenCLのバージョン

3.0

OpenGL

4.6

CUDA

8.6

DirectX

12 Ultimate (12_2)

電源コネクタ

1x 6-pin

ROP

ラスタオペレーションパイプライン（ROPs）は、ゲーム内の照明や反射計算を主に取り扱い、アンチエイリアシング（AA）、高解像度、煙、火などの効果を管理します。ゲームのAAと照明効果が高いほど、ROPsの性能要求が高くなります。

シェーダモデル

6.6

推奨PSU

300W

ベンチマーク

シャドウオブザトゥームレイダー 2160p

スコア

49 fps

シャドウオブザトゥームレイダー 1440p

スコア

103 fps

シャドウオブザトゥームレイダー 1080p

スコア

147 fps

FP32 (浮動小数点)

スコア

19.553 TFLOPS

3DMark Steel Nomad

スコア

2617

3DMark タイムスパイ

スコア

10952

Blender

スコア

3477

OctaneBench

スコア

358

Vulkan

スコア

108871

OpenCL

スコア

122331

他のGPUとの比較

シャドウオブザトゥームレイダー 2160p / fps

GeForce RTX 4090

193 +293.9%

TITAN RTX

69 +40.8%

RTX A4000

Radeon RX 6600

35 -28.6%

GeForce GTX 1660 SUPER

25 -49%

シャドウオブザトゥームレイダー 1440p / fps

GeForce RTX 4090

292 +183.5%

GeForce RTX 3070 Ti

128 +24.3%

RTX A4000

103

Radeon RX 5700

69 -33%

GeForce RTX 3050 OEM

49 -52.4%

シャドウオブザトゥームレイダー 1080p / fps

Radeon RX 7900 XTX

310 +110.9%

GeForce RTX 3080 12 GB

187 +27.2%

RTX A4000

147

Radeon RX 6800M

106 -27.9%

Radeon R9 Nano

73 -50.3%

FP32 (浮動小数点) / TFLOPS

GeForce RTX 4060 Ti

21.619 +10.6%

Radeon RX 7700S

20.89 +6.8%

RTX A4000

19.553

RTX A5500 Max-Q

19.084 -2.4%

RTX A4000 Mobile

17.544 -10.3%

3DMark タイムスパイ

GeForce RTX 4080 SUPER

28395 +159.3%

Radeon RX 7700 XT

15945 +45.6%

RTX A4000

10952

Radeon VII

9090 -17%

Arc B390

7190 -34.3%

3DMark Steel Nomad

GeForce RTX 5060 Mobile

2631 +0.5%

GeForce RTX 3080 Mobile

2629 +0.5%

RTX A4000

2617

Arc A750

2596 -0.8%

GeForce RTX 3070 Ti Mobile

2566 -1.9%

Blender

GeForce RTX 5090

15026.3 +332.2%

A10 PCIe

3548 +2%

RTX A4000

3477

Arc B390

1281.07 -63.2%

Radeon Pro WX 9100

640 -81.6%

OctaneBench

GeForce RTX 4090

1328 +270.9%

RTX A4000

358

Tesla P40

163 -54.5%

Quadro P3200 Max Q

87 -75.7%

GeForce GTX 960

47 -86.9%

Vulkan

GeForce RTX 5090 D

382809 +251.6%

GeForce RTX 3080

152166 +39.8%

RTX A4000

108871

Radeon Pro W6600

76392 -29.8%

Radeon Pro 5700 XT

49804 -54.3%

OpenCL

GeForce RTX 4090

321810 +163.1%

GeForce RTX 4070

168239 +37.5%

RTX A4000

122331

Quadro RTX 4000

85184 -30.4%

Radeon RX 5600 OEM

64365 -47.4%

NVIDIA RTX A4000

基本

メモリ仕様

ディスプレイとメディア

理論上の性能

その他

ベンチマーク

他のGPUとの比較

関連する GPU の比較

ソーシャルメディアで共有する