Xeon Phi Knights Landing

Six chercheurs russes travaillant sur le simulateur PICADOR de la physique du plasma, écrit en C++, ont décidé de le tester sur la deuxième génération, nom de code Knights Landing, de coprocesseurs hautement parallèles d’Intel, les Xeon Phi.

L’étude a été effectuée sous le patronage de la RFBR, Fondation Russse pour la Recherche Fondamentale, avec le concours d’Intel.

Parmi les nouveautés des Knights Landing (KNL), on notera le nouveau jeu d’instructions AVX-512, la mémoire à haute bande passante MCDRAM, l’interconnect Omni-Path (en remplacement du PCIe) et le mode en grappes.

Deux kits de développement pour les coprocesseurs Knights Landing sont disponibles depuis quelques mois.

Les Xeon Phi sont notamment utilisés dans le nouveau supercalculateur d’Atos, le Bull sequana.

Pour Intel, les Xeon Phi se démarquent des coprocesseurs graphiques de plus en plus utilisés pour l’informatique haute performance, du fait de leur architecture hautement parallèle, par leur facilité d’utilisation.

Contrairement aux coprocesseurs graphiques, qui nécessitent une programmation spécifique, les Xeon Phi permettent aux programmeurs de passer de processeurs à quelques cœurs à des processeurs à nombreux cœurs, avec des modèles consistants de langages de programmation, d’outils et de techniques. On peut ainsi préserver les acquis et les savoir-faire.

Premiers résultats

Pour une première évaluation des performances de KNL, les chercheurs ont décidé d’utiliser PICADOR. D’une part, parce que la physique du plasma est un domaine porteur, notamment pour les lasers à impulsions haute intensité. Et d’autre part, parce que la simulation de la physique du plasma est un problème difficile à paralléliser, et bien connu du monde scientifique.

Les résultats sont largement à la hauteur des attentes.

Une simple recompilation du code, écrit pour la première génération des Xeon Phi, a permis de multiplier la vitesse par 2,43 sur la même configuration matérielle.

Le choix optimal du nombre de processus et de fils d’exécutions, tout comme d’autres optimisations, permet de multiplier encore ces résultats par 1,89.

Au final, le code tourne 2,35 fois plus rapidement que sur un processeur Xeon Haswell à 14 cœurs, et 3,47 fois plus vite que sur un Xeon Phi de première génération, nom de code Knights Corner, à 61 cœurs.

Le code a dépassé la barre des 100 gigaflops par seconde en double précision sur KNL.

Pour les chercheurs, KNL est d’autant plus intéressant qu’à quelques optimisations près, on peut utiliser le même code source que pour les processeurs habituels.

Ils envisagent désormais de pousser plus loin les optimisations, en tirant mieux parti de la vectorisation, du cache, et du programme Intel Advisor Analysis.