ホーム / NVIDIA / NVIDIA GeForce RTX 4090: 性能とスペック

NVIDIA GeForce RTX 4090

NVIDIA GeForce RTX 4090: 未来のフラッグシップなのか、それとも過剰な性能なのか？

2025年4月

アーキテクチャと主な特徴

グラフィックカードNVIDIA GeForce RTX 4090は、Ada Lovelace Nextアーキテクチャを基に設計されており、これは前世代の進化版で、ゲームやプロフェッショナルなタスクにおける最大の性能を最適化しています。チップはTSMCの4nmプロセスで製造されており、RTX 3090 Tiと比較してトランジスタの密度が30%向上しました。

RTX 4090の主な「武器」は、DLSS 4.0、第3世代レイトレーシング、およびAMDのFidelityFX Super Resolution 3.0（オープンAPIを通じて）のサポートです。DLSS 4.0は、画質の損失を最小限に抑えながら、ニューラルネットワークを使用して画像の解像度を向上させる一方で、改善されたRTコアは動的なシーンにおいてもリアルな照明や反射を実現します。

メモリ: より速く、より大きく、より効率的に

RTX 4090は、24GB GDDR6Xメモリを搭載し、384ビットバスで1.1TB/sの帯域幅を実現しています。これはRTX 3090よりも15%高く、8Kテクスチャを遅延なしに処理することができます。高設定のグラフィックスでゲーム（例: Cyberpunk 2077: Phantom Liberty）を楽しむ際、このメモリ容量はアセットのロードによる「FPSの落ち込み」を解消します。

BlenderやUnreal Engine 6のようなプロフェッショナルなアプリケーションにおいて、24GBは重いシーンや複雑なシミュレーションを処理する能力を与えます。例えば、Cinema 4Dでの3Dモデルレンダリングは、RTX 4080と比較して40%速くなります。

ゲームにおけるパフォーマンス: 4Kは新しい標準

RTX 4090は、最も要求の厳しいプロジェクトでも驚異的な結果を示します：

- Cyberpunk 2077（レイトレーシング + DLSS 4.0使用時）：4Kで98 FPS。

- Alan Wake 2: Enhanced Edition：4Kで最大設定時に120 FPS。

- GTA VI（テスト版）：ウルトラ詳細設定で4Kにおいて85 FPS。

1440pや1080p解像度では、カードの性能が過剰になり、CPUの制約に達します。しかし、8Kディスプレイを持つVRゲームやヘッドセット（例: Meta Quest Pro 2）では、RTX 4090は不可欠です。

レイトレーシングはもはやFPSを激減させることはありません。第3世代Tensorコアのおかげで、RTの負荷は50%軽減されます。

プロフェッショナルなタスク: ゲームだけではない

RTX 4090は以下の分野で需要があります：

- ビデオ編集：DaVinci Resolveでの8K動画レンダリングは、RTX 3090よりも35%早く完了します。

- 3Dモデリング：Blenderにおいて、シーンのレンダリングサイクルが12分から7分に短縮されます。

- 科学計算：CUDA 5.5とOpenCL 3.5のサポートにより、MATLABや機械学習プロジェクトでのシミュレーションが加速されます。

プロフェッショナルにとって重要なのは、NVLinkのサポートです。2つのRTX 4090を組み合わせることで、レンダリングタスクで最大90%の性能向上が得られます。

電力消費と熱管理

RTX 4090のTDPは480Wであり、冷却に真剣に対処する必要があります。推奨されるものは以下の通りです：

- 電源ユニットは1000W以上で、80+ Platinumの認証を得ていること（例: Corsair AX1000）。

- 冷却システム：3スロットのクーラー（ASUS ROG Strix LC）やオールインワン水冷を使用する必要があります。

負荷時の温度は標準クーラー使用時に75°Cを超えませんが、良好な通気性のないコンパクトなケースではスロットリングが起こる可能性があります。

競合他社との比較

2025年のRTX 4090の主な競合は以下です：

- AMD Radeon RX 8900 XT：価格は安価（$1200対RTX 4090の$1599）ですが、レイトレーシングでは劣ります（Cyberpunk 2077で25-30%の劣位）。

- Intel Arc Battlemage XT：機械学習には有能ですが（$1100）、ゲーム用のドライバーは最適化が遅れています。

RTX 4090の強みは、NVIDIAのエコシステムにあります：DLSS、反射、VR技術のサポート。

実用的なアドバイス

1. 電源ユニット：最低でも850Wですが、1000Wが望ましい。

2. ケース：6台以上のファンを搭載したフルタワー（例: Lian Li PC-O11 Dynamic）。

3. ドライバー：GeForce Experienceで「実験的」機能を無効にしてください—これによりプロフェッショナルソフトウェアで競合が生じる可能性があります。

4. プラットフォーム：完全な互換性を得るためには、PCIe 5.0を持つマザーボードと、Ryzen 7 7800X3DまたはIntel Core i7-14700K以上のプロセッサが必要です。

長所と短所

長所：

- 4KとVRにおけるナンバーワンの性能。

- DLSS 4.0とRTX IOによるテクスチャの瞬時読み込みのサポート。

- プロフェッショナルに最適。

短所：

- 価格が$1599と高価で、すべての人に手が届くわけではありません。

- 強力な冷却システムと電力システムが必要。

- 1440p未満の解像度のモニターには過剰です。

最終的な結論: RTX 4090は誰に向いているのか？

このグラフィックカードは、妥協を許さない方向けの選択です：

- 4K/8Kで遊ぶゲーマーやVRを使用する人。

- ビデオ編集者や3Dアーティストで、レンダリングの速度を重視する人。

- 数年先を見越したPCを組もうとしているエンスージアスト。

もし目的が1440pでのゲームプレイやオフィスアプリケーションでの作業であれば、RTX 4070 TiやAMD RX 7900 XTの方がより合理的な投資となるでしょう。RTX 4090は単なるGPUではなく、2025年の技術的優位性の象徴です。

基本

レーベル名

NVIDIA

プラットホーム

Desktop

発売日

September 2022

モデル名

GeForce RTX 4090

世代

GeForce 40

ベースクロック

2235MHz

ブーストクロック

2520MHz

バスインターフェース

PCIe 4.0 x16

トランジスタ

76,300 million

RTコア

128

テンソルコア

テンソルコアは深層学習専用に設計された特化型プロセッサで、FP32トレーニングと比較して高いトレーニングと推論性能を提供します。コンピュータビジョン、自然言語処理、音声認識、テキストから音声への変換、個別の推奨などの領域で迅速な計算を可能にします。テンソルコアの最も注目すべき応用は、DLSS（Deep Learning Super Sampling）とAI Denoiserのノイズリダクションです。

512

TMU

テクスチャマッピングユニット（TMUs）は、二進画像を回転、スケーリング、歪曲して、それを3Dモデルの任意の平面にテクスチャとして配置することができるGPUのコンポーネントです。このプロセスはテクスチャマッピングと呼ばれます。

512

ファウンドリ

TSMC

プロセスサイズ

4 nm

アーキテクチャ

Ada Lovelace

メモリ仕様

メモリサイズ

24GB

メモリタイプ

GDDR6X

メモリバス

メモリバス幅とは、1クロックサイクル内にビデオメモリが転送できるデータのビット数を指します。バス幅が大きいほど、一度に転送できるデータ量が多くなります。メモリバンド幅の計算式は次の通りです：メモリバンド幅 = メモリ周波数 x メモリバス幅 / 8。

384bit

メモリクロック

1313MHz

帯域幅

メモリバンド幅は、グラフィックチップとビデオメモリ間のデータ転送速度を指します。単位はバイト/秒で、計算式は次の通りです：メモリバンド幅 = 動作周波数 × メモリバス幅 / 8ビット。

1008 GB/s

理論上の性能

ピクセルレート

ピクセル塗りつぶし率は、グラフィックスプロセッシングユニット（GPU）が1秒あたりにレンダリングできるピクセル数を指します。これは、MPixels/s（百万ピクセル/秒）またはGPixels/s（十億ピクセル/秒）で測定されます。これはグラフィックスカードのピクセル処理性能を評価するために最も一般的に使用される指標です。

443.5 GPixel/s

テクスチャレート

テクスチャ塗りつぶし率は、GPUが1秒間にピクセルにマッピングできるテクスチャマップ要素（テクセル）の数を指します。

1290 GTexel/s

FP16 (半精度)

GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。半精度浮動小数点数（16ビット）は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。単精度浮動小数点数（32ビット）は、一般的なマルチメディアやグラフィックス処理のタスクで使用され、倍精度浮動小数点数（64ビット）は、広範で高精度が求められる科学計算に必要です。

82.58 TFLOPS

FP64 (倍精度)

GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。倍精度浮動小数点数（64ビット）は、広範で高精度が求められる科学計算に必要です。単精度浮動小数点数（32ビット）は、一般的なマルチメディアやグラフィックス処理のタスクで使用されます。半精度浮動小数点数（16ビット）は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。

1290 GFLOPS

FP32 (浮動小数点)

GPU のパフォーマンスを測定するための重要な指標は、浮動小数点コンピューティング能力です。単精度浮動小数点数 (32 ビット) は一般的なマルチメディアおよびグラフィックス処理タスクに使用されますが、倍精度浮動小数点数 (64 ビット) は広い数値範囲と高精度が要求される科学計算に必要です。半精度浮動小数点数 (16 ビット) は、精度が低くても許容される機械学習などのアプリケーションに使用されます。

80.928 TFLOPS

その他

SM数

ストリーミングプロセッサ（SP）は他のリソースとともに、ストリーミングマルチプロセッサ（SM）を形成し、これはGPUの主要コアとも呼ばれます。これらの追加リソースには、ワープスケジューラ、レジスタ、共有メモリなどのコンポーネントが含まれます。SMは、レジスタや共有メモリが希少なリソースであるGPUの中心部と考えることができます。

128

シェーディングユニット

最も基本的な処理単位はストリーミングプロセッサ（SP）で、特定の指示とタスクが実行されます。GPUは並行計算を行い、複数のSPが同時にタスクを処理します。

16384

L1キャッシュ

128 KB (per SM)

L2キャッシュ

72MB

TDP

450W

Vulkanのバージョン

Vulkanは、Khronos Groupによるクロスプラットフォームのグラフィックスおよび計算APIで、高性能と低CPU負荷を提供します。開発者がGPUを直接制御し、レンダリングのオーバーヘッドを減らし、マルチスレッドとマルチコアプロセッサをサポートします。

1.3

OpenCLのバージョン

3.0

OpenGL

4.6

DirectX

12 Ultimate (12_2)

CUDA

8.9

電源コネクタ

1x 16-pin

シェーダモデル

6.6

ROP

ラスタオペレーションパイプライン（ROPs）は、ゲーム内の照明や反射計算を主に取り扱い、アンチエイリアシング（AA）、高解像度、煙、火などの効果を管理します。ゲームのAAと照明効果が高いほど、ROPsの性能要求が高くなります。

176

推奨PSU

850W

ベンチマーク

シャドウオブザトゥームレイダー 2160p

スコア

193 fps

シャドウオブザトゥームレイダー 1440p

スコア

292 fps

シャドウオブザトゥームレイダー 1080p

スコア

304 fps

サイバーパンク 2077 2160p

スコア

90 fps

サイバーパンク 2077 1440p

スコア

185 fps

サイバーパンク 2077 1080p

スコア

203 fps

バトルフィールド 5 2160p

スコア

194 fps

バトルフィールド 5 1440p

スコア

203 fps

バトルフィールド 5 1080p

スコア

213 fps

GTA 5 2160p

スコア

167 fps

GTA 5 1440p

スコア

177 fps

GTA 5 1080p

スコア

178 fps

FP32 (浮動小数点)

スコア

80.928 TFLOPS

3DMark タイムスパイ

スコア

36233

Blender

スコア

12832

OctaneBench

スコア

1328

Vulkan

スコア

254749

OpenCL

スコア

321810

Hashcat

スコア

2602280 H/s

他のGPUとの比較

シャドウオブザトゥームレイダー 2160p / fps

GeForce RTX 4090

193

TITAN RTX

69 -64.2%

GeForce RTX 2080

45 -76.7%

Radeon RX 6700M

34 -82.4%

GeForce RTX 2060

24 -87.6%

シャドウオブザトゥームレイダー 1440p / fps

GeForce RTX 4090

292

GeForce RTX 3070 Ti

128 -56.2%

GeForce RTX 3060 8 GB

87 -70.2%

Radeon RX 6700M

67 -77.1%

GeForce GTX 1070

49 -83.2%

シャドウオブザトゥームレイダー 1080p / fps

Radeon RX 7900 XTX

310 +2%

GeForce RTX 4090

304

GeForce RTX 3070 Ti Mobile

131 -56.9%

Radeon RX 5600 XT

101 -66.8%

Radeon RX 5500 XT

72 -76.3%

サイバーパンク 2077 2160p / fps

GeForce RTX 4090

GeForce RTX 3080

60 -33.3%

GeForce RTX 3060 Ti

40 -55.6%

GeForce RTX 3060 8 GB

30 -66.7%

Radeon RX 6600

24 -73.3%

サイバーパンク 2077 1440p / fps

GeForce RTX 4090

185

GeForce RTX 3080 Ti

79 -57.3%

GeForce RTX 4090 Mobile

59 -68.1%

GeForce RTX 2070 SUPER

44 -76.2%

Radeon RX 6600 XT

35 -81.1%

サイバーパンク 2077 1080p / fps

GeForce RTX 4090

203

GeForce RTX 3080 Ti

114 -43.8%

GeForce RTX 2080 Ti

84 -58.6%

GeForce RTX 3060 8 GB

60 -70.4%

Radeon RX 5700

48 -76.4%

バトルフィールド 5 2160p / fps

GeForce RTX 4090

194

Radeon RX 6800 XT

106 -45.4%

GeForce RTX 2080 SUPER

68 -64.9%

GeForce RTX 3060

56 -71.1%

GeForce RTX 2060 12 GB

46 -76.3%

バトルフィールド 5 1440p / fps

GeForce RTX 4090

203

GeForce RTX 4080

165 -18.7%

GeForce RTX 3080 Mobile

120 -40.9%

GeForce RTX 3070 Mobile

99 -51.2%

GeForce GTX 1070 Ti

85 -58.1%

バトルフィールド 5 1080p / fps

GeForce RTX 4090

213

GeForce RTX 3080 12 GB

194 -8.9%

GeForce RTX 3060 Ti

169 -20.7%

Radeon RX 5700 XT

139 -34.7%

Radeon RX 5600 XT

122 -42.7%

GTA 5 2160p / fps

Radeon RX 7900 XTX

174 +4.2%

GeForce RTX 4090

167

GeForce GTX 1080 Ti

79 -52.7%

GeForce GTX 1660 SUPER

59 -64.7%

GeForce RTX 2050 Mobile

39 -76.6%

GTA 5 1440p / fps

GeForce RTX 3090 Ti

191 +7.9%

GeForce RTX 4090

177

GeForce RTX 4070 Mobile

88 -50.3%

GeForce GTX 1080

73 -58.8%

GeForce RTX 3050 8 GB

47 -73.4%

GTA 5 1080p / fps

GeForce RTX 3090 Ti

231 +29.8%

GeForce RTX 4090

178

GeForce RTX 3070

156 -12.4%

Radeon R9 FURY

141 -20.8%

Radeon RX 550

86 -51.7%

FP32 (浮動小数点) / TFLOPS

RTX PRO 6000 Blackwell Server

123.48 +52.6%

GeForce RTX 4090 Ti

91.375 +12.9%

GeForce RTX 4090

80.928

H100 SXM5 80 GB

68.248 -15.7%

B200 SXM 192 GB

60.838 -24.8%

3DMark タイムスパイ

GeForce RTX 4090

36233

Radeon RX 6800

16792 -53.7%

GeForce RTX 3070 Ti Mobile

11589 -68%

GeForce RTX 2070

9097 -74.9%

GeForce RTX 2070 SUPER Max Q

7333 -79.8%

Blender

GeForce RTX 5090

15026.3 +17.1%

GeForce RTX 4090

12832

RTX A2000 12 GB

2063 -83.9%

Radeon RX 6700M

1222 -90.5%

Tesla M40 24 GB

589 -95.4%

OctaneBench

GeForce RTX 4090

1328

GeForce RTX 4070 Mobile

349 -73.7%

Tesla P40

163 -87.7%

Quadro P3200 Max Q

87 -93.4%

GeForce GTX 960

47 -96.5%

Vulkan

GeForce RTX 5090 D

382809 +50.3%

GeForce RTX 4090

254749

Radeon RX 6700

92202 -63.8%

Radeon Pro W5700X

64049 -74.9%

GeForce MX570 A

38904 -84.7%

OpenCL

GeForce RTX 5090 D

385013 +19.6%

GeForce RTX 4090

321810

Radeon PRO W7700

115655 -64.1%

Radeon Pro W5700X

79060 -75.4%

Tesla T4

61276 -81%

Hashcat / H/s

GeForce RTX 4090

2602280

GeForce RTX 3090

1198430 -53.9%

Radeon RX 6800 XT

971947 -62.7%

Arc A770

883336 -66.1%

GeForce RTX 3080

881523 -66.1%