AMD Radeon 8060S Graphics

AMD Radeon 8060S Graphics
AMD Radeon 8060S Graphics グラフィックカードのレビュー

AMD Radeon 8060S グラフィックス: AMD の AI プラットフォーム向けの内蔵グラフィックス

AMD Radeon 8060S グラフィックスは、単なるゲーム向けの強力な内蔵グラフィックスではありません。これは、AMD がローカル AI コンピュータのセグメントについていこうとするためのプラットフォーム、Ryzen AI Max のグラフィック部分と考えるのが正しいです。

AI の分野では、AMD はまだ追随しているプレイヤーです。NVIDIA には CUDA があり、成熟したフレームワークのエコシステムとプロフェッショナルなソフトウェアにおける広範なサポートがあります。Ryzen AI Max は、この利点を打破するものではなく、Radeon 8060S を RTX の万能な代替品にすることもありません。AMD の賭けは異なります:大きな共通メモリプール、大きな RDNA グラフィックス、強力な CPU および NPU が一体化された筐体です。

これが理由で、Radeon 8060S を FPS のみで評価してはいけません。ゲームにおいて、内蔵グラフィックスとしては実際に強力に見えますが、Ryzen AI Max の主な意義はローカル AI です。このようなデバイスで大きなモデルをゼロから訓練することはできませんが、ローカルで起動し、推論に使用し、パイプラインをテストし、画像の生成に取り組み、メモリが十分で必要なスタックがサポートされている場所で小規模な追加学習を行うことができます。

なぜ Radeon 8060S が Ryzen AI Max に重要なのか

一般的な内蔵グラフィックスは、計算ブロックの数だけでなく、メモリにも制約があります。強力な iGPU でも、帯域幅や利用可能なメモリの制限にすぐに直面します。Ryzen AI Max は異なります:Radeon 8060S は別個の VRAM ではなく、プラットフォーム全体のユニファイドメモリで動作します。

これは、彼女を自動的にディスクリート GPU よりも速くするものではありません。しかし、そうすることで、そうしたグラフィックが意味を持つタスクのクラスが変わります。ゲームでは FPS が重要ですが、AI ではしばしばメモリの量が重要です。モデルや大きなコンテキストが 8 GB の VRAM に収まらない場合、計算能力はもはや救いになりません。Ryzen AI Max は、グラフィックスカードなしで大きなモデルや AI 負荷を実行するために、クライアントデバイスに大きな共通メモリプールを提供することを目指しています。

Ryzen AI Max+ 395 では、Radeon 8060S は 40 のグラフィックスコア、最大 2900 MHz のクロック、256 ビットの LPDDR5x-8000 メモリと、最大 128 GB の共通メモリ構成を持ちます。AMD は、NPU が最大 50 TOPS を含め、合計 AI 性能が最大 126 TOPS に達するとも述べています。内蔵グラフィックスとしては、これはまったく異なるスケールです。

Radeon 8060S は「おまけの内蔵グラフィックス」ではなく、プラットフォーム全体の存在理由の一つです。AMD は、CUDA ソフトウェアで NVIDIA に直接対抗しようとはしていません。会社は異なるアプローチをとっています:ノートパソコン、ミニ PC、またはワークステーション形式のコンパクトな AI マシンを提供し、ここでは大きな共通メモリがグラフィックのパフォーマンスと同じくらい重要です。

Radeon 8060S はラインアップでどこに位置するか

Radeon 8060S は、Ryzen AI Max 300 シリーズの上位チップ、Ryzen AI Max+ 395 や Ryzen AI Max+ PRO 395、Ryzen AI Max+ 392 および Ryzen AI Max+ 388 に使用されます。これは Strix Halo 300 の完全なグラフィックスバージョンです。

その下には Radeon 8050S と Radeon 8040S があります。Radeon 8050S のグラフィック部分は大幅に削減されており、Radeon 8040S はさらに下位のバージョンです。これらの間の違いは単に見た目ではなく、同一プラットフォーム構想内の異なる iGPU レベルを示します。

Radeon 8065S が登場した後、8060S のステータスはより正確に記述する必要があります。Radeon 8060S は Ryzen AI Max 300 の上位グラフィックスですが、AMD の全ラインナップの絶対的な最高ではありません。Ryzen AI Max PRO 400 の Radeon 8065S は、同様の広いグラフィックブロックを使用しますが、より高いクロックと、ユニファイドメモリの上限が増加した新しいプラットフォームを得ています。

ベンチマーク: 通常の iGPU ではなく

合成テストで Radeon 8060S は、典型的な内蔵グラフィックスではなく、中級のモバイルディスクリート GPU との競争相手として見えます。Notebookcheck に基づくと、テストや特定のデバイスに応じて、GeForce RTX 4060 Laptop と RTX 4070 Laptop の間に位置しています。

テスト Radeon 8060S RTX 4060 Laptop RTX 4070 Laptop
3DMark Time Spy ~10842 ~10250 ~11732
3DMark Time Spy Graphics ~10946 ~9943 ~11609

これらの数字は指標として重要ですが、すべてのノートパソコンで RTX 4070 のレベルを約束するものとして読み取ることはできません。Radeon 8060S は共通メモリを持つ内蔵グラフィックスのままです。彼女のパフォーマンスは、電力制限、冷却、筐体、メーカーの設定によって依存します。良好に冷却されたデバイスでは、Radeon 8060S はモバイル RTX 4060 に近いかもしれませんが、コンパクトな筐体では結果が低くなるでしょう。

ゲームに関しては、実用的なレベルは明確です:1080p が基本モードで、多くの場合中程度または高設定です。1440p は、あまり重くないゲームや FSR で可能です。4K や重いレイトレーシングは彼女のエリアではありません。Radeon 8060S の強みは、ディスクリート GPU を排除することではなく、内蔵グラフィックスが高価な APU プラットフォームにおいて真剣な議論の理由となることです。

AI: プラットフォームの主な意義

Ryzen AI Max の最も重要な部分は、ローカル AI タスクです。AMD は、Ryzen AI Max+ 395 をまさに生成的 AI 向けのプラットフォームとして提唱しています:大きなユニファイドメモリ、Radeon 8060S、LLM の起動、デバイス上での画像生成を伴います。

AMD の資料には、Stable Diffusion 3.5 Large、Phi-4 14B、DeepSeek-R1-Distill-Llama-70B、ONNX-GenAI、Ollama、および Amuse が登場します。また、128 GB のユニファイドメモリと GPU に利用可能な最大 112 GB のメモリが指定されています。これは単なる「AI」というマーケティング用語ではなく、大きな共通メモリプールが実際にクライアントデバイスで実行できるモデルに影響を与えるのです。

このとき、Radeon 8060S に余計なことを付託する必要はありません。これは、大きなモデルをゼロから訓練するための加速器ではなく、サーバー GPU の代替でもなく、すべての AI ソフトウェアとの魔法のような互換性を持つものではありません。プラットフォームの意義は別にあります:ローカルで大規模なモデルを起動し、推論を行い、ローカルアシスタントを生成し、画像を生成し、パイプラインをテストし、メモリが十分で ROCm、PyTorch などのバックエンドが必要な構成をすでにサポートしている場所で小規模な学習や追加学習を行うことです。

ローカル AI に関しては、こうしたアプローチが従来のディスクリート GPU よりも重要である場合があります。サポートされているタスクでは RTX が多くの場合速いですが、モデルがメモリに収まらない場合、速度そのものは問題を解決するものではありません。Ryzen AI Max は、以前は専用ワークステーションが必要だったものをクライアント形式に持ち込むことを目指しており、モデルや AI 負荷のための大きなローカルメモリプールを提供しています。

ROCm、PyTorch と制限

AMD にとってここで重要な利点は、Ryzen AI Max 向けの ROCm が次第に現実となりつつあることです。公式の ROCm 7.2.1 マトリックスには、gfx1151 と Ryzen AI Max+ 395 が記載されており、PyTorch 2.9.1 + ROCm 7.2.1 には公式のプロダクションサポート構成が提示されています。この時、公式にバリデーションされているのは FP16 のみで、他のデータ型は機能する可能性があるものの、保証はされません。

これは重要な制約です。一つのシナリオでは、Radeon 8060S を ROCm または PyTorch 経由で問題なく使用できるモデルがある一方で、別のシナリオではツールが迂回手段を要求したり、CPU を介してのみ機能したり、iGPU を適切なアクセラレーターとしてまったく認識しない場合があります。したがって、特定の OS、ROCm のバージョン、PyTorch、モデル、計算タイプに基づいて互換性を確認する必要があります。

Radeon 8060S は、あらゆるソフトウェアのための汎用 AI 加速器として強力ではなく、AMD がユニファイドメモリ、ROCm、ONNX、DirectML、Ollama、Amuse、ローカルモデルに賭けているプラットフォームの一部として強力です。ハードウェアは非常に興味深いものでしたが、ソフトウェアスタックはまだ追いついていません。

Radeon 8065S との違い

Radeon 8065S は Radeon 8060S の価値を下げるものではありませんが、そのポジショニングを移動させます。8060S は Ryzen AI Max 300 世代の上位グラフィックスであり続けますが、8065S は Ryzen AI Max PRO 400 のより新しいバージョンとなります。

主な違いは GPU のアイデアそのものではなく、プラットフォームにあります。Ryzen AI Max+ PRO 495 には、Radeon 8065S グラフィックス、40 のグラフィックコア、最大 3000 MHz のクロック、LPDDR5x-8533 および最大 192 GB のメモリが指定されています。これがゲームに劇的な違いをもたらすことはないでしょうが、ローカル AI には追加のメモリが少しのクロック向上よりも重要です。

したがって、Radeon 8060S は 8065S の登場後に弱体化したわけではありません。単に、今その地位がより明確になったのです:これは Ryzen AI Max の第一波の強力な iGPU であり、全体の新しいラインアップの頂点ではなくなったのです。

最大の欠点 - 価格とニッチ性

Radeon 8060S は単独で購入することはできません。これは高価な Ryzen AI Max プラットフォームの一部であり、そのため彼女の価値は常に全体のデバイスの価格に依存します。

単なるゲーミングノートパソコンが必要であれば、ディスクリート RTX 4060 または RTX 4070 のモデルの方が理解しやすいかもしれません:個別のビデオメモリ、DLSS、より一般的なゲームおよびプロフェッショナルスタック。しかし、大きな共通メモリを持つ強力な CPU と、ローカル AI モデルを起動できるコンパクトなコンピュータが必要であれば、Ryzen AI Max ははるかに興味深い存在となります。

これは「すべての人のための」大衆プラットフォームではありません。これは、AMD がローカル AI に別の角度から参入しようとする高価でニッチな試みです:成熟した CUDA エコシステムを介してではなく、大きなユニファイドメモリプールと CPU、GPU、NPU を一つのチップに統合することによってです。CUDA は NVIDIA のプラットフォームとして残っているため、Radeon 8060S のための CUDA 依存型ソフトウェアはターゲットシナリオではありません。

結論

AMD Radeon 8060S グラフィックスは、なぜ AMD が Ryzen AI Max を作ったのかを示しています。ゲーム用の別の iGPU のためではなく、大きなモデルをローカルで起動し、画像生成、ONNX、Ollama、ROCm、および PyTorch シナリオと連携するクライアント AI プラットフォームのためです。

Radeon 8060S は、すべてのタスクにおいてディスクリート GPU を置き換えるものではなく、大きなモデルを訓練するためのサーバーにノートパソコンを変えるものでもありません。しかし、彼女は Ryzen AI Max を最近の APU プラットフォームの中でも非常に特異なものとし、ここで大きな共通メモリがグラフィックのパワーと同じくらい重要な議論の理由となるコンパクトなシステムを実現します。

基本

レーベル名
AMD
プラットホーム
Integrated
発売日
January 2025
モデル名
AMD Radeon 8060S Graphics
世代
Radeon 8000S
ブーストクロック
2900 MHz
バスインターフェース
Integrated
RTコア
40
計算ユニット
40
テンソルコア
?
テンソルコアは深層学習専用に設計された特化型プロセッサで、FP32トレーニングと比較して高いトレーニングと推論性能を提供します。コンピュータビジョン、自然言語処理、音声認識、テキストから音声への変換、個別の推奨などの領域で迅速な計算を可能にします。テンソルコアの最も注目すべき応用は、DLSS(Deep Learning Super Sampling)とAI Denoiserのノイズリダクションです。
No
TMU
?
テクスチャマッピングユニット(TMUs)は、二進画像を回転、スケーリング、歪曲して、それを3Dモデルの任意の平面にテクスチャとして配置することができるGPUのコンポーネントです。このプロセスはテクスチャマッピングと呼ばれます。
160
ファウンドリ
TSMC
プロセスサイズ
4 nm
アーキテクチャ
RDNA 3.5

メモリ仕様

メモリサイズ
System Shared
メモリタイプ
System Shared LPDDR5x
メモリバス
?
メモリバス幅とは、1クロックサイクル内にビデオメモリが転送できるデータのビット数を指します。バス幅が大きいほど、一度に転送できるデータ量が多くなります。メモリバンド幅の計算式は次の通りです:メモリバンド幅 = メモリ周波数 x メモリバス幅 / 8。
256-bit
メモリクロック
LPDDR5x-8000
帯域幅
?
メモリバンド幅は、グラフィックチップとビデオメモリ間のデータ転送速度を指します。単位はバイト/秒で、計算式は次の通りです:メモリバンド幅 = 動作周波数 × メモリバス幅 / 8ビット。
256 GB/s

理論上の性能

ピクセルレート
?
ピクセル塗りつぶし率は、グラフィックスプロセッシングユニット(GPU)が1秒あたりにレンダリングできるピクセル数を指します。これは、MPixels/s(百万ピクセル/秒)またはGPixels/s(十億ピクセル/秒)で測定されます。これはグラフィックスカードのピクセル処理性能を評価するために最も一般的に使用される指標です。
186 GPixel/s
テクスチャレート
?
テクスチャ塗りつぶし率は、GPUが1秒間にピクセルにマッピングできるテクスチャマップ要素(テクセル)の数を指します。
464 GTexel/s
FP16 (半精度)
?
GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。半精度浮動小数点数(16ビット)は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。単精度浮動小数点数(32ビット)は、一般的なマルチメディアやグラフィックス処理のタスクで使用され、倍精度浮動小数点数(64ビット)は、広範で高精度が求められる科学計算に必要です。
29.7 TFLOPS
FP64 (倍精度)
?
GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。倍精度浮動小数点数(64ビット)は、広範で高精度が求められる科学計算に必要です。単精度浮動小数点数(32ビット)は、一般的なマルチメディアやグラフィックス処理のタスクで使用されます。半精度浮動小数点数(16ビット)は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。
464 GFLOPS
FP32 (浮動小数点)
?
GPU のパフォーマンスを測定するための重要な指標は、浮動小数点コンピューティング能力です。 単精度浮動小数点数 (32 ビット) は一般的なマルチメディアおよびグラフィックス処理タスクに使用されますが、倍精度浮動小数点数 (64 ビット) は広い数値範囲と高精度が要求される科学計算に必要です。 半精度浮動小数点数 (16 ビット) は、精度が低くても許容される機械学習などのアプリケーションに使用されます。
14.85 TFLOPS

その他

シェーディングユニット
?
最も基本的な処理単位はストリーミングプロセッサ(SP)で、特定の指示とタスクが実行されます。GPUは並行計算を行い、複数のSPが同時にタスクを処理します。
2560
OpenCLのバージョン
2.1
OpenGL
4.6
DirectX
12
CUDA
No
電源コネクタ
None
シェーダモデル
6.8
ROP
?
ラスタオペレーションパイプライン(ROPs)は、ゲーム内の照明や反射計算を主に取り扱い、アンチエイリアシング(AA)、高解像度、煙、火などの効果を管理します。ゲームのAAと照明効果が高いほど、ROPsの性能要求が高くなります。
64

ベンチマーク

シャドウ オブ ザ トゥームレイダー 2160p
スコア
38 fps
シャドウ オブ ザ トゥームレイダー 1440p
スコア
80 fps
シャドウ オブ ザ トゥームレイダー 1080p
スコア
115 fps
サイバーパンク 2077 2160p
スコア
16 fps
サイバーパンク 2077 1440p
スコア
38 fps
サイバーパンク 2077 1080p
スコア
65 fps
FP32 (浮動小数点)
スコア
14.85 TFLOPS
3DMark Steel Nomad
スコア
2038
3DMark タイムスパイ
スコア
10010
Blender
スコア
1335.18
Vulkan
スコア
87196
OpenCL
スコア
94271

他のGPUとの比較

シャドウ オブ ザ トゥームレイダー 2160p / fps
73 +92.1%
45 +18.4%
26 -31.6%
シャドウ オブ ザ トゥームレイダー 1440p / fps
157 +96.3%
103 +28.8%
63 -21.3%
シャドウ オブ ザ トゥームレイダー 1080p / fps
214 +86.1%
163 +41.7%
94 -18.3%
70 -39.1%
サイバーパンク 2077 2160p / fps
66 +312.5%
33 +106.3%
サイバーパンク 2077 1440p / fps
74 +94.7%
42 +10.5%
11 -71.1%
サイバーパンク 2077 1080p / fps
118 +81.5%
85 +30.8%
68 +4.6%
21 -67.7%
FP32 (浮動小数点) / TFLOPS
15.983 +7.6%
15.562 +4.8%
14.413 -2.9%
3DMark タイムスパイ
19416 +94%
12617 +26%
5781 -42.2%
3DMark Steel Nomad
2093 +2.7%
2088 +2.5%
2003 -1.7%
Blender
2323 +74%
721.37 -46%
363.3 -72.8%
Vulkan
195059 +123.7%
120050 +37.7%
60353 -30.8%
34688 -60.2%
OpenCL
191319 +102.9%
134417 +42.6%
69319 -26.5%
48679 -48.4%