AMD Radeon 8065S Graphics

AMD Radeon 8065S Graphics
Test de la carte graphique AMD Radeon 8065S Graphics

AMD Radeon 8065S Graphics : la iGPU Ryzen AI Max PRO pour l'IA locale

AMD Radeon 8065S Graphics est la solution graphique intégrée haut de gamme pour la plateforme Ryzen AI Max PRO 400. Cependant, ce GPU ne représente pas un bond significatif par rapport à la Radeon 8060S. Le bloc graphique reste similaire : 40 CU sur l'architecture RDNA 3.5, mais la fréquence a augmenté à 3000 MHz. La différence principale ne se situe pas dans ces 100 MHz supplémentaires, mais dans la plateforme qui l'encadre.

La Radeon 8065S fait son apparition dans le Ryzen AI Max+ PRO 495 - une version mise à jour du grand APU AMD pour l'IA locale, les stations de travail compactes et les systèmes professionnels. Ici, AMD réoriente encore plus son accent des jeux vers l'IA : jusqu'à 192 Go de mémoire unifiée, jusqu'à 160 Go de mémoire partagée qui peuvent être utilisés comme mémoire GPU, avec un NPU capable de délivrer jusqu'à 55 TOPS, tandis que le plafond total de l'IA de la plateforme atteint 131 TOPS.

Ce n'est plus seulement une histoire de jeux. La Radeon 8065S est importante en tant que partie de la plateforme où AMD tente d'élargir son domaine dans l'IA locale : offrir à un appareil compact un grand pool de mémoire, un CPU puissant, une grande graphisme RDNA et un NPU sans carte graphique discrète séparée.

Pourquoi la Radeon 8065S est-elle importante

La Radeon 8065S n'a pas sa propre mémoire GDDR6, comme c'est le cas pour une carte graphique discrète. Elle fonctionne avec la mémoire partagée de toute la plateforme. Pour un GPU de jeu standard, cela pourrait sembler être une limitation, mais pour l'IA locale, la situation est plus complexe : souvent, on ne se contente pas de la vitesse, mais également du volume de mémoire disponible.

Si un modèle ou un contexte ne rentre pas dans la mémoire vidéo disponible, la haute vitesse du GPU ne sert à rien : soit la tâche ne s'exécute pas correctement, soit elle nécessite de forts compromis. Le Ryzen AI Max PRO 400 tente de combler ce fossé. La plateforme offre à l'appareil client un grand pool local de mémoire pour les LLM, la génération d'images, un long contexte et plusieurs tâches d'IA simultanément.

AMD annonce la possibilité de lancer localement des modèles de plus de 300 milliards de paramètres avec une quantification de 4 bits. Cela ne signifie pas que cet ordinateur remplace un serveur avec des accélérateurs professionnels. Mais pour un ordinateur portable, un mini-PC ou une station de travail compacte, c'est une annonce significative : de grands modèles peuvent non seulement être discutés théoriquement, mais vraiment lancés localement avec la bonne pile logicielle.

8065S contre 8060S : la principale différence réside dans la plateforme

La Radeon 8065S est un proche parent de la Radeon 8060S. Le nombre de CU est le même, l'architecture est la même, et l'augmentation de la fréquence est faible. Par conséquent, le passage de la 8060S à la 8065S ne promet pas par lui-même un grand gain de FPS.

Paramètre Radeon 8060S Radeon 8065S
Architecture RDNA 3.5 RDNA 3.5
Blocs graphiques 40 CU 40 CU
Fréquence GPU jusqu'à 2900 MHz jusqu'à 3000 MHz
Plateforme Ryzen AI Max 300 Ryzen AI Max PRO 400
Max mémoire unifiée jusqu'à 128 Go jusqu'à 192 Go
Mémoire disponible GPU jusqu'à 112 Go jusqu'à 160 Go

Comparer uniquement par la fréquence ne rend pas compte de la principale différence : la limite de mémoire de la plateforme. Pour les jeux, la différence entre la 8060S et la 8065S sera probablement modérée. Pour l'IA locale, l'augmentation de la mémoire unifiée de 128 à 192 Go est plus importante que la légère augmentation de fréquence du GPU.

Niveau de jeu escompté

Pour l'instant, il y a peu de données indépendantes sur la Radeon 8065S, donc il est logique d'estimer le niveau de jeu en se basant sur la Radeon 8060S et la petite différence de fréquence. En termes de configuration, ces GPU sont très proches : la 8065S a le même large bloc de 40 CU, mais avec une fréquence légèrement supérieure. Par conséquent, le gain en termes de jeu par rapport à la 8060S sera probablement faible : 100 MHz supplémentaires ne transforment pas ce graphique en une nouvelle catégorie.

Le scénario pratique reste le suivant :

  • 1080p - mode principal, souvent avec des paramètres moyens ou élevés ;
  • 1440p - possible dans des jeux moins lourds ou avec FSR ;
  • 4K - plutôt pour des projets anciens et légers ;
  • Ray Tracing - pris en charge, mais ce n'est pas le point fort de cette iGPU.

Il ne faut pas présenter la Radeon 8065S comme un remplacement direct des RTX mobiles. C'est un graphique intégré avec mémoire partagée, et son résultat dépendra de la limite de puissance, du refroidissement et du dispositif spécifique. Dans les jeux, la Radeon 8065S reste une iGPU particulièrement puissante, tandis que pour l'IA, le principal avantage provient non pas de la fréquence, mais de l'accès à un grand volume de mémoire partagée.

IA : le principal scénario du Ryzen AI Max PRO 400

Le Ryzen AI Max PRO 400 est clairement plus orienté vers l'IA locale que vers un rôle de plateforme de jeu ordinaire. Le CPU, le GPU, le NPU et la mémoire unifiée fonctionnent comme des parties d'une même plateforme APU, et non comme des composants distincts avec des pools de mémoire différents.

La Radeon 8065S peut intéresser pour les tâches suivantes :

  • lancement de LLM locaux, surtout si les modèles ne tiennent pas dans 8-12 Go de VRAM ;
  • inference et test de pipelines AI ;
  • travail avec un long contexte ;
  • génération d'images et modèles de diffusion ;
  • agents AI locaux et scénarios automatisés ;
  • PyTorch/ROCm, ONNX, Ollama, llama.cpp, Amuse et d'autres outils - sous réserve de support pour une configuration spécifique.

L'apprentissage de grands modèles depuis zéro reste une tâche pour les accélérateurs de serveur. Mais le lancement, le test, le développement local, le léger réentraînement et le travail avec des modèles qui ne tiennent pas dans une carte graphique mobile typique - c'est ici que le Ryzen AI Max+ PRO 495 et la Radeon 8065S semblent particulièrement intéressants.

ROCm, PyTorch et limitations

La force de cette plateforme ne réside pas dans la compatibilité avec CUDA, mais dans le grand pool de mémoire unifiée et les scénarios soutenus par le stack AMD. Cependant, il est important de ne pas gonfler les attentes. AMD est encore en train de rattraper NVIDIA en ce qui concerne l'écosystème IA, et la compatibilité doit être vérifiée en fonction du système d'exploitation, de la version de ROCm, de PyTorch, du modèle et de l'outil.

Dans un scénario, la Radeon 8065S peut être utilisée comme un accélérateur normal, tandis que dans un autre, le programme peut ne pas l'utiliser comme GPU ou nécessiter des contournements. Ainsi, il est préférable de décrire la 8065S non pas comme un accélérateur IA universel pour tout logiciel, mais comme une partie de la nouvelle plateforme AMD pour l'IA locale, où le principal atout est un très grand volume de mémoire disponible.

Les logiciels dépendant de CUDA restent un scénario non ciblé pour la Radeon. Si un programme nécessite CUDA, il a besoin d'une carte graphique NVIDIA. Pour la Radeon 8065S, l'idée est différente : lancer des modèles locaux via des outils soutenus par le stack AMD et travailler sur des tâches où la mémoire est plus importante que la simple compatibilité avec CUDA.

Où se situe la Radeon 8065S dans la gamme

La Radeon 8065S se présente actuellement comme le modèle haut de gamme de la famille Radeon 8000S. En dessous se trouvent la Radeon 8060S, la Radeon 8050S et la Radeon 8040S. La différence entre la 8065S et la 8060S est minime en ce qui concerne le bloc graphique, mais significative en ce qui concerne le contexte de la plateforme.

La Radeon 8060S était le plus grand iGPU pour le Ryzen AI Max 300. La Radeon 8065S est devenue le modèle haut de gamme mis à jour pour le Ryzen AI Max PRO 400. Pour les jeux, ce sont presque les mêmes classes, tandis que pour l'IA, la 8065S profite surtout du Ryzen AI Max+ PRO 495 et de sa limite de mémoire étendue.

Principal inconvénient - prix et niche

La Radeon 8065S ne peut pas être achetée séparément. Elle fait partie d'une plateforme professionnelle coûteuse Ryzen AI Max+ PRO 495. Par conséquent, sa valeur dépend non pas de la seule mention "8065S Graphics", mais du prix de l'ensemble de l'appareil et du besoin de l'utilisateur pour des scénarios d'IA locale.

Si vous avez simplement besoin d'un ordinateur portable pour les jeux, un modèle avec une RTX 4060 ou 4070 discrète peut être un choix plus logique : mémoire vidéo dédiée, DLSS, écosystème de jeu familier et CUDA pour un logiciel compatible. Mais si vous avez besoin d'une station de travail compacte avec une énorme mémoire unifiée, un CPU puissant, une graphisme intégrée et la capacité de lancer de grands modèles localement, la Radeon 8065S devient beaucoup plus intéressante.

Ce n'est pas une solution de masse pour les ordinateurs portables de jeu ordinaires. C'est un iGPU haut de gamme d'une plateforme de niche AMD pour l'IA locale, les stations de travail et les systèmes compacts, où une grande mémoire est tout aussi importante que la puissance graphique elle-même.

Conclusion

AMD Radeon 8065S Graphics n'est pas une révolution par rapport à la Radeon 8060S en termes de GPU pur. C'est une version plus récente et améliorée de la même idée : graphique RDNA 3.5 à 40 CU à l'intérieur d'une grande plateforme APU, où le principal enjeu est l'IA locale et la mémoire unifiée.

Pour les jeux, la Radeon 8065S reste une très bonne solution graphique intégrée, mais ne remplace pas les cartes graphiques discrètes. Pour l'IA, elle est plus intéressante : non pas parce qu'AMD a égalé NVIDIA en termes d'écosystème logiciel, mais parce que le Ryzen AI Max+ PRO 495 offre quelque chose de rare dans les systèmes mobiles : jusqu'à 192 Go de mémoire unifiée.

La Radeon 8065S est significative non pas parce qu'elle est nettement plus rapide que la 8060S dans les jeux, mais parce qu'elle renforce le nouveau sens du Ryzen AI Max : ce n'est plus simplement une APU puissante, mais une plateforme AI client où la mémoire pour des modèles locaux devient l'argument principal.

Basique

Nom de l'étiquette
AMD
Plate-forme
Integrated
Date de lancement
May 2026
Nom du modèle
AMD Radeon 8065S Graphics
Génération
Radeon 8000S
Horloge Boost
3000 MHz
Interface de bus
Integrated
Cœurs RT
40
Unités de calcul
40
Cœurs de Tensor
?
Les Tensor Cores sont des unités de traitement spécialisées conçues spécifiquement pour l'apprentissage en profondeur, offrant des performances supérieures en matière d'entraînement et d'inférence par rapport à l'entraînement FP32. Ils permettent des calculs rapides dans des domaines tels que la vision par ordinateur, le traitement du langage naturel, la reconnaissance vocale, la conversion texte-parole et les recommandations personnalisées. Les deux applications les plus remarquables des Tensor Cores sont DLSS (Deep Learning Super Sampling) et AI Denoiser pour la réduction du bruit.
No
TMUs
?
Les unités de mappage de texture (TMUs) sont des composants du GPU qui sont capables de faire pivoter, mettre à l'échelle et déformer des images binaires, puis de les placer en tant que textures sur n'importe quel plan d'un modèle 3D donné. Ce processus est appelé mappage de texture.
160
Fonderie
TSMC
Taille de processus
4 nm
Architecture
RDNA 3.5

Spécifications de la mémoire

Taille de Mémoire
System Shared
Type de Mémoire
System Shared LPDDR5x
Bus de Mémoire
?
La largeur du bus mémoire fait référence au nombre de bits de données que la mémoire vidéo peut transférer lors d'un seul cycle d'horloge. Plus la largeur du bus est grande, plus la quantité de données qui peut être transmise instantanément est importante, ce qui en fait l'un des paramètres cruciaux de la mémoire vidéo. La bande passante mémoire est calculée comme suit : Bande passante mémoire = Fréquence mémoire x Largeur du bus mémoire / 8. Par conséquent, lorsque les fréquences mémoire sont similaires, la largeur du bus mémoire déterminera la taille de la bande passante mémoire.
256-bit
Horloge Mémoire
LPDDR5x-8533
Bande Passante
?
La bande passante mémoire fait référence au débit de transfert de données entre la puce graphique et la mémoire vidéo. Elle est mesurée en octets par seconde, et la formule pour la calculer est : bande passante mémoire = fréquence de fonctionnement × largeur du bus mémoire / 8 bits. En français: La bande passante mémoire désigne le taux de transfert de données entre la puce graphique et la mémoire vidéo. Elle est mesurée en octets par seconde et la formule pour la calculer est la suivante : bande passante mémoire = fréquence de fonctionnement × largeur du bus mémoire / 8 bits.
273 GB/s

Performance théorique

Taux de Pixel
?
Le taux de remplissage des pixels désigne le nombre de pixels qu'une unité de traitement graphique (GPU) peut rendre par seconde, mesuré en MPixels/s (million de pixels par seconde) ou en GPixels/s (milliard de pixels par seconde). C'est la mesure la plus couramment utilisée pour évaluer les performances de traitement des pixels d'une carte graphique.
192 GPixel/s
Taux de Texture
?
Le taux de remplissage de texture fait référence au nombre d'éléments de texture (texels) qu'un GPU peut mapper sur des pixels en une seule seconde.
480 GTexel/s
FP16 (demi)
?
Une mesure importante pour évaluer les performances des GPU est la capacité de calcul en virgule flottante. Les nombres en virgule flottante à demi-précision (16 bits) sont utilisés pour des applications telles que l'apprentissage automatique, où une précision inférieure est acceptable. Les nombres en virgule flottante simple précision (32 bits) sont utilisés pour les tâches courantes de multimédia et de traitement graphique, tandis que les nombres en virgule flottante double précision (64 bits) sont requis pour le calcul scientifique qui nécessite une large plage numérique et une grande précision.
30.72 TFLOPS
FP64 (double précision)
?
Une mesure importante pour évaluer les performances des GPU est la capacité de calcul en virgule flottante. Les nombres en virgule flottante à demi-précision (16 bits) sont utilisés pour des applications telles que l'apprentissage automatique, où une précision inférieure est acceptable. Les nombres en virgule flottante simple précision (32 bits) sont utilisés pour les tâches courantes de multimédia et de traitement graphique, tandis que les nombres en virgule flottante double précision (64 bits) sont requis pour le calcul scientifique qui nécessite une large plage numérique et une grande précision.
480 GFLOPS
FP32 (flottant)
?
Une mesure importante pour mesurer les performances du GPU est la capacité de calcul en virgule flottante. Les nombres à virgule flottante simple précision (32 bits) sont utilisés pour les tâches courantes de traitement multimédia et graphique, tandis que les nombres à virgule flottante double précision (64 bits) sont requis pour le calcul scientifique qui exige une large plage numérique et une grande précision. Les nombres à virgule flottante demi-précision (16 bits) sont utilisés pour des applications telles que l'apprentissage automatique, où une précision inférieure est acceptable.
15.36 TFLOPS

Divers

Unités d'Ombrage
?
L'unité de traitement la plus fondamentale est le processeur en continu (SP), où des instructions et des tâches spécifiques sont exécutées. Les GPU effectuent des calculs parallèles, ce qui signifie que plusieurs SP fonctionnent simultanément pour traiter les tâches.
2560
Version OpenCL
2.1
OpenGL
4.6
DirectX
12
CUDA
No
Connecteurs d'alimentation
None
Modèle de shader
6.8
ROPs
?
Le pipeline des opérations de rasterisation (ROPs) est principalement responsable de la gestion des calculs d'éclairage et de réflexion dans les jeux, ainsi que de la gestion d'effets tels que l'anti-aliasing (AA), la haute résolution, la fumée et le feu. Plus les effets d'anti-aliasing et d'éclairage sont exigeants dans un jeu, plus les exigences de performances pour les ROPs sont élevées ; sinon, cela peut entraîner une chute importante du taux de rafraîchissement.
64

Benchmarks

FP32 (flottant)
Score
15.36 TFLOPS

Comparé aux autres GPU

FP32 (flottant) / TFLOPS