NVIDIA présente sa nouvelle architecture Ampere

GTC 2020

Durant le discours inauguralv d’une conférence GTC 2020 bien spéciale cette année, puisque entièrement virtuelle, Jensen Huang, CEO de NVIDIA, a présenté en diffusion en direct la nouvelle architecture de processeurs graphique du groupe : Ampere.

Elle est le successeur de l’architecture Volta, dévoilée il y a trois ans, et comme pour cette dernière, NVIDIA commence son nouveau cycle de produits avec le très haut de gamme.

NVIDIA A100

En l’occurrence, la puce A100, amenée à remplacer la puce V100, et dédiée à l’accélération des calculs dans les centres de données et les serveurs, notamment pour l’intelligence artificielle, l’analyse des données, l’informatique scientifique et les graphiques dans le nuage.

D’après NVIDIA, le saut de performance d’une génération à l’autre est le plus grand des huit générations de ses puces graphiques : on pourrait atteindre des gains de performances jusqu’à 20 fois, comparé à Volta.

La puce A100, avec seulement 11 mm2 de plus que la puce V100, pour une surface tout de même gigantesque de 826 mm2, est composée de 54,2 milliards de transistors, soit plus de deux fois plus que la V100.

Bien que fabriquée avec le procédé 7N de TSMC, elle consomme encore plus que la V100, fabriquée en 12nm FFN : 400 W, contre 300 à 350 W pour la précédente.

Elle est équipée de 40 Go de mémoire ultrarapide, d’un bus mémoire d’une largeur de 5 120 bits pour une bande passante de 1,6 To par seconde, de 6 912 cœurs CUDA, et de nouveau cœurs Tensor TF32, un nouveau format mathématique pour optimiser les opérations d’intelligence artificielle en simple précision.

D’après NVIDIA, tout cela résulterait en une puce 6 fois plus rapide que l’architecture Volta pour l’entraînement, et 7 fois plus rapide pour l’inférence.

NVIDIA DGX A100

NVIDIA présente également la troisième génération de son serveur DGX AI, le NVIDIA DGX A100, équipé de 8 puces A100. Ce serait le premier serveur au monde à atteindre les 5 téraflops.

Grâce à une nouvelle fonctionnalité de la puce A100, Multi-Instance GPU ou MIG, qui permet à une seule puce d’être partitionnée en multiples GPUs indépendants, chacun avec ses propres ressources, pour un maximum de 7 partitions, le DGX A100 peut être divisé en jusqu’à 56 applications tournant indépendamment.

La puce A100 sera également disponible pour les fournisseurs d’informatique en nuage, avec le HGX A100.

DGX SuperPOD

Pour les besoins encore plus grand, NVIDIA présente le DGX SuperPOD, composé de 140 DGX A100 interconnectés avec la technologie Mellanox, pour 700 pétaflops de performance en IA, soit l’équivalent du 20e superordinateur le plus puissant du monde.

NVIDIA n’a pipé mot de l’exploitation de l’architecture Ampere pour ses futures générations de cartes graphiques. On espère que les gains seront supérieurs à ceux de la gamme RTX 20nn sur la gamme GeForce 10nn, très décevants, surtout en début de cycle : les avancés en accélération de l’IA ne se traduisent pas toujours par des avancées graphiques.