AMD Radeon 8065S Graphics

AMD Radeon 8065S Graphics
AMD Radeon 8065S Graphics グラフィックカードのレビュー

AMD Radeon 8065S Graphics: 次世代 iGPU Ryzen AI Max PROによるローカルAI

AMD Radeon 8065S Graphicsは、Ryzen AI Max PRO 400プラットフォームに向けたハイエンド統合グラフィックスです。しかし、GPU自体に関しては、Radeon 8060Sからの大きな飛躍とは言えません。グラフィックブロックは近い状態のままで、RDNA 3.5アーキテクチャに基づく40 CUを搭載しており、クロック周波数は3000MHzに増加しました。主な違いはこの追加の100MHzではなく、その周囲のプラットフォームにあります。

Radeon 8065Sは、Ryzen AI Max+ PRO 495に登場します。これはローカルAI用の更新されたAMD APUのハイエンド版で、コンパクトなワークステーションやプロフェッショナルシステムをターゲットにしています。ここでAMDは、ゲームからAIへのシフトをさらに進めています。最大192GBのユニファイドメモリ、GPUとして利用できる最大160GBの共有メモリ、NPUは最大55TOPSを提供し、プラットフォーム全体のAI性能は131TOPSに達します。

これは単なるゲーム用途ではありません。Radeon 8065Sは、AMDがローカルAIにおける領域を拡大しようとしているプラットフォームの一部として重要です。比較的小型のデバイスに、大きな共通メモリプール、強力なCPU、膨大なRDNAグラフィックス、そして専用のディスクリートグラフィックカードなしでNPUを提供します。

なぜRadeon 8065Sが重要なのか

Radeon 8065Sには、ディスクリートグラフィックカードのような独自のGDDR6メモリはありません。それはプラットフォーム全体の共有メモリを利用します。通常のゲームGPUにとっては、これは制限に見えるかもしれませんが、ローカルAIにおいては状況が複雑です。そこでは、単に速度だけでなく、利用可能なメモリの量も重要です。

モデルやコンテキストが利用可能なビデオメモリに収まらない場合、高速なGPUも役に立ちません。タスクは正常に実行されないか、重大な妥協を必要とします。Ryzen AI Max PRO 400は、このギャップを埋めようとしています。このプラットフォームは、LLM、画像生成、長いコンテキスト、同時に複数のAIタスクに対してクライアントデバイスに大きなローカルメモリプールを提供します。

AMDは、4ビット量子化時に300億以上のパラメータを持つモデルのローカル実行が可能であると述べています。これは、このコンピュータが専門の加速器を搭載したサーバーに取って代わることを意味するものではありません。しかし、ノートパソコン、ミニPC、またはコンパクトなワークステーションであれば、大規模なモデルを理論的に議論するだけでなく、適切なソフトウェアスタックのもとで実際にローカルで実行することができるという重要な意味を持っています。

8065S vs 8060S:プラットフォームの主な違い

Radeon 8065Sは、Radeon 8060Sの親しい親戚です。CUの数は同じで、アーキテクチャも同じですが、クロック速度の向上はわずかです。したがって、8060Sから8065Sへの移行は、単独では大きなFPSの向上を約束するものではありません。

パラメータ Radeon 8060S Radeon 8065S
アーキテクチャ RDNA 3.5 RDNA 3.5
グラフィックブロック 40 CU 40 CU
GPUクロック 最大2900MHz 最大3000MHz
プラットフォーム Ryzen AI Max 300 Ryzen AI Max PRO 400
最大ユニファイドメモリ 最大128GB 最大192GB
GPUに利用可能なメモリ 最大112GB 最大160GB

クロック周波数のみでの比較は、主要な違いであるプラットフォームのメモリ制限を見逃します。ゲームにおいて、8060Sと8065Sの間の違いは、恐らくあまり大きくはないでしょう。しかし、ローカルAIにおいては、ユニファイドメモリが128GBから192GBに増加することは、GPUのクロック速度がわずかに上がることよりも重要です。

期待されるゲームのレベル

Radeon 8065Sに関する独立したデータはまだあまり多くないため、ゲームレベルはRadeon 8060Sを通じて評価するのが理にかなっています。この二つのGPUは構成が非常に似ていて、8065Sは同じ幅広い40-CUブロックを持っていますが、クロック速度がわずかに高いです。したがって、8060Sと比べてゲームのフレームレートの向上は恐らくわずかであり、100MHzの追加はこのグラフィックスを新しいクラスに変えることはありません。

実際のシナリオは以下のようになります:

  • 1080p - 主なモードで、しばしば中程度または高い設定;
  • 1440p - 軽いゲームやFSRを使用することで可能;
  • 4K - 主に古いシンプルなプロジェクト向け;
  • レイトレーシング - サポートされているが、このiGPUの強みではありません。

Radeon 8065SをモバイルRTXの直接的な代替品として位置づけるべきではありません。これは共通メモリを持つ内蔵グラフィックスであり、その結果は電力制限、冷却、具体的なデバイスに依存します。ゲームにおいて、Radeon 8065Sは異常に強力なiGPUであり、AIにおいては主な利点はクロック速度ではなく、大量の共有メモリにアクセスできることです。

AI:Ryzen AI Max PRO 400の主要なシナリオ

Ryzen AI Max PRO 400は、通常のゲームプラットフォームとしてよりもローカルAIにかなり強く焦点を合わせています。CPU、GPU、NPU、ユニファイドメモリは、異なるメモリプールを持つ個別のコンポーネントとしてではなく、単一のAPUプラットフォームの一部として機能します。

Radeon 8065Sは以下のようなタスクに対して興味深いでしょう:

  • ローカルLLMの起動、特にモデルが8-12GBのVRAMに収まらない場合;
  • AIパイプラインの推論とテスト;
  • 長いコンテキストでの作業;
  • 画像生成や拡散モデル;
  • ローカルAIエージェントと自動化されたシナリオ;
  • PyTorch/ROCm、ONNX、Ollama、llama.cpp、Amuseなどのツール - 具体的な構成のサポートが条件。

大規模なモデルのゼロからのトレーニングはサーバー用加速器の課題です。しかし、ローカルの開発、テスト、小規模な再トレーニング、典型的なモバイルビデオカードに収まらないモデルとの作業は、ここでRyzen AI Max+ PRO 495とRadeon 8065Sが特に興味深く映ります。

ROCm、PyTorchと制限

このプラットフォームの強みはCUDAとの互換性ではなく、大容量のユニファイドメモリプールとAMDスタックがサポートするシナリオにあります。しかし、ここでは余計なことは言い過ぎないように注意が必要です。AMDは依然としてAIエコシステムにおいてNVIDIAに遅れを取っていますので、互換性は特定のOS、ROCmのバージョン、PyTorch、モデル、およびツールによって確認する必要があります。

あるシナリオでは、Radeon 8065Sは適切な速度でアクセラレーターとして正常に使用されますが、別のシナリオでは、プログラムがそれをGPUとして利用しないか、他の回避策を必要とする場合があります。したがって、8065Sはすべてのソフトウェアに対応する汎用AIアクセラレーターとして説明するのではなく、ローカルAI用の新しいAMDプラットフォームの一部として説明する方が良いでしょう。ここでの主な強みは、大きな利用可能なメモリ量です。

CUDA依存のソフトウェアは、Radeonにとってターゲット外のシナリオです。プログラムがCUDAを必要とする場合、NVIDIAのグラフィックカードが必要です。Radeon 8065Sの意味は別のところにあります:AMDスタックがサポートするツールを介してローカルモデルを起動し、メモリがCUDAとの単なる互換性よりも重要なタスクに取り組むことです。

Radeon 8065Sの位置付け

Radeon 8065Sは現在、Radeon 8000Sファミリーの中でハイエンドモデルのように見えます。その下にはRadeon 8060S、Radeon 8050S、Radeon 8040Sがあります。8065Sと8060Sの間の違いは、グラフィックブロックに関してはわずかですが、プラットフォームの文脈には顕著な違いがあります。

Radeon 8060SはRyzen AI Max 300向けのハイエンドiGPUでしたが、Radeon 8065SはRyzen AI Max PRO 400向けの更新されたトップモデルになりました。ゲームの観点からはほぼ同じクラスですが、AIにおいては8065Sは特にRyzen AI Max+ PRO 495の拡張メモリ制限のおかげで利点があります。

主な欠点 - 価格とニッチ性

Radeon 8065Sは単独で購入することはできません。これは高価なプロフェッショナルプラットフォームRyzen AI Max+ PRO 495の一部です。したがって、その価値は「8065S Graphics」という文字列自体から来るものではなく、全体のデバイスの価格や、ユーザーがローカルAIシナリオを必要とするかどうかに依存します。

もし単にゲーム用のノートパソコンが必要な場合、ディスクリートのRTX 4060やRTX 4070を搭載したモデルの方が、専用のビデオメモリ、DLSS、通常のゲームエコシステム、CUDA対応ソフトウェアにとってより論理的な選択かもしれません。しかし、巨大なユニファイドメモリ、強力なCPU、内蔵グラフィックスを備え、大規模なモデルをローカルで実行できるコンパクトなワークステーションが必要な場合、Radeon 8065Sは非常に魅力的になります。

これは一般的なゲームノートパソコン向けの大量のソリューションではありません。これは、ローカルAI、ワークステーション、コンパクトシステム向けのAMDのニッチなプラットフォーム用のハイエンドiGPUであり、大きなメモリがグラフィック性能と同じくらい重要です。

まとめ

AMD Radeon 8065S Graphicsは、純粋なGPUにおいてRadeon 8060Sに対する革命ではありません。これは、同じアイデアのより新しく拡張されたバージョンであり、40-CU RDNA 3.5グラフィックスを大規模なAPUプラットフォーム内に内蔵し、ローカルAIとユニファイドメモリに主に焦点を当てています。

ゲーム用において、Radeon 8065Sは非常に強力な内蔵グラフィックスであり続けますが、ディスクリートグラフィックカードの必要性を覆すものではありません。AIにおいては、より興味深いのは、AMDがNVIDIAとソフトウェアエコシステムで競り合っているからではなく、Ryzen AI Max+ PRO 495がモバイルシステムでは珍しい最大192GBのユニファイドメモリを提供しているからです。

Radeon 8065Sが重要なのは、ゲームにおいて8060Sよりも著しく速いからではなく、Ryzen AI Maxに新たな意味を確立するからです。それはもはや単に強力なAPUではなく、ローカルモデルのためのメモリが主要な議論となるクライアントAIプラットフォームです。

基本

レーベル名
AMD
プラットホーム
Integrated
発売日
May 2026
モデル名
AMD Radeon 8065S Graphics
世代
Radeon 8000S
ブーストクロック
3000 MHz
バスインターフェース
Integrated
RTコア
40
計算ユニット
40
テンソルコア
?
テンソルコアは深層学習専用に設計された特化型プロセッサで、FP32トレーニングと比較して高いトレーニングと推論性能を提供します。コンピュータビジョン、自然言語処理、音声認識、テキストから音声への変換、個別の推奨などの領域で迅速な計算を可能にします。テンソルコアの最も注目すべき応用は、DLSS(Deep Learning Super Sampling)とAI Denoiserのノイズリダクションです。
No
TMU
?
テクスチャマッピングユニット(TMUs)は、二進画像を回転、スケーリング、歪曲して、それを3Dモデルの任意の平面にテクスチャとして配置することができるGPUのコンポーネントです。このプロセスはテクスチャマッピングと呼ばれます。
160
ファウンドリ
TSMC
プロセスサイズ
4 nm
アーキテクチャ
RDNA 3.5

メモリ仕様

メモリサイズ
System Shared
メモリタイプ
System Shared LPDDR5x
メモリバス
?
メモリバス幅とは、1クロックサイクル内にビデオメモリが転送できるデータのビット数を指します。バス幅が大きいほど、一度に転送できるデータ量が多くなります。メモリバンド幅の計算式は次の通りです:メモリバンド幅 = メモリ周波数 x メモリバス幅 / 8。
256-bit
メモリクロック
LPDDR5x-8533
帯域幅
?
メモリバンド幅は、グラフィックチップとビデオメモリ間のデータ転送速度を指します。単位はバイト/秒で、計算式は次の通りです:メモリバンド幅 = 動作周波数 × メモリバス幅 / 8ビット。
273 GB/s

理論上の性能

ピクセルレート
?
ピクセル塗りつぶし率は、グラフィックスプロセッシングユニット(GPU)が1秒あたりにレンダリングできるピクセル数を指します。これは、MPixels/s(百万ピクセル/秒)またはGPixels/s(十億ピクセル/秒)で測定されます。これはグラフィックスカードのピクセル処理性能を評価するために最も一般的に使用される指標です。
192 GPixel/s
テクスチャレート
?
テクスチャ塗りつぶし率は、GPUが1秒間にピクセルにマッピングできるテクスチャマップ要素(テクセル)の数を指します。
480 GTexel/s
FP16 (半精度)
?
GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。半精度浮動小数点数(16ビット)は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。単精度浮動小数点数(32ビット)は、一般的なマルチメディアやグラフィックス処理のタスクで使用され、倍精度浮動小数点数(64ビット)は、広範で高精度が求められる科学計算に必要です。
30.72 TFLOPS
FP64 (倍精度)
?
GPUパフォーマンスを測定する重要な指標は浮動小数点計算能力です。倍精度浮動小数点数(64ビット)は、広範で高精度が求められる科学計算に必要です。単精度浮動小数点数(32ビット)は、一般的なマルチメディアやグラフィックス処理のタスクで使用されます。半精度浮動小数点数(16ビット)は、精度が低くても許容可能な機械学習のようなアプリケーションで使用されます。
480 GFLOPS
FP32 (浮動小数点)
?
GPU のパフォーマンスを測定するための重要な指標は、浮動小数点コンピューティング能力です。 単精度浮動小数点数 (32 ビット) は一般的なマルチメディアおよびグラフィックス処理タスクに使用されますが、倍精度浮動小数点数 (64 ビット) は広い数値範囲と高精度が要求される科学計算に必要です。 半精度浮動小数点数 (16 ビット) は、精度が低くても許容される機械学習などのアプリケーションに使用されます。
15.36 TFLOPS

その他

シェーディングユニット
?
最も基本的な処理単位はストリーミングプロセッサ(SP)で、特定の指示とタスクが実行されます。GPUは並行計算を行い、複数のSPが同時にタスクを処理します。
2560
OpenCLのバージョン
2.1
OpenGL
4.6
DirectX
12
CUDA
No
電源コネクタ
None
シェーダモデル
6.8
ROP
?
ラスタオペレーションパイプライン(ROPs)は、ゲーム内の照明や反射計算を主に取り扱い、アンチエイリアシング(AA)、高解像度、煙、火などの効果を管理します。ゲームのAAと照明効果が高いほど、ROPsの性能要求が高くなります。
64

ベンチマーク

FP32 (浮動小数点)
スコア
15.36 TFLOPS

他のGPUとの比較

FP32 (浮動小数点) / TFLOPS