Accélérateur AMD Instinct MI300X
Accélérateur AMD Instinct MI300X

AMD présente le MI300X, nouveau GPU porte-étendard d’intelligence artificiel

Lors de l’événement « Data Center and AI Technology Premiere », AMD a annoncé ses derniers produits pour les serveurs et les centres de données.

Extension de la famille de 4e génération de processeurs EPYC

Le processeur EPYC 97X4, nom de code « Bergamo », est composé de 128 cœurs d’architecture Zen 4c par réceptacle de processeur, à la fois, d’après AMD, un record de densité de processeur virtuel, et de performances pour des applications qui tournent dans le nuage.

Amazon Web Services propose en aperçu les instances M7a qui intégreront le nouveau processeur.

Oracle annonce qu’il sera exploité dans les instances E5.

Deux variations du processeur sont commercialisées : les AMD EPYC 9754 et 9754S. Le premier se distingue du second principalement par l’hyper-threading. Ils ont en commun 128 cœurs, 256 mégaoctets de mémoire tampon L3, ainsi qu’une dissipation thermique de 360 watts.

Série Instinct MI300

La série Instinct MI300 fut annoncée il y a un an, puis détaillée lors du CES 2023 en janvier.

Cette série d’accélérateurs Instict serait optimisée pour l’intelligence artificielle générative, la dernière mode du monde de l’informatique depuis le succès populaire de ChatGPT.

Le MI300X serait « l’accélérateur le plus avancé pour l’IA générative ».

Basé sur l’architecture AMD CDNA 3, il intègre jusqu’à 192 gigaoctets de mémoire HBM3. Une capacité suffisante pour y faire tenir de grands modèles linguistiques, tels que Falcon-40.

AMD lance à cette occasion la plateforme Instict, qui combine huit accélérateurs MI300X dans un facteur de forme standard.

Cette quantité d’accélérateurs semble être le point idéal : le supercalculateur HGX H100 de NVIDIA intègre huit accélérateurs, tout comme le futur Intel x8 Universal BaseBoard avec huit accélérateurs Ponte Vecchio Max.

Des échantillons seront envoyés aux grands comptes au troisième trimestre.

Des échantillons de l’Instict MI300A, la première puce intégrée pour les charges de travail d’intelligence artificielle et de calcul intensif, sont actuellement envoyés aux clients.

On peut considérer que le MI300X est une version simplifiée du MI300A, dont on aurait retiré les trois pucettes CPU pour les remplacer par uniquement deux GPU CDNA 3, pour un total de douze pucettes : huit pucettes GPU et quatre pucettes de mémoire à large bande passante.

Le fondeur met en avant la dernière version de ROCm, son écosystème logiciel pour les accélérateurs dans les centres de données, dont la compatibilité avec PyTorch 2.0.

Discours inaugural