Amazon Web Services Logo

Amazon reboote son Cloud EC2

Redémarrages forcés

D’aujourd’hui à la fin du mois, Amazon va procéder à des redémarrages forcés de la plupart des instances sur les serveurs de son Elastic Cloud Compute (EC2).

Il s’agit d’un événement exceptionnel qui pourrait occasionner des désagréments pour les entreprises qui utilisent son Cloud.

En effet, contrairement au déroulement habituel, le fait de redémarrer soi-même une instance de serveur virtuel, au moment le moins pénalisant pour le client et avant qu’Amazon ne le fasse, ne garantit pas que l’instance se retrouvera sur un hôte corrigé. Il est donc impossible de contrôler à 100 % le processus de mise à jour, et de choisir le moment et l’ordre des redémarrages.

Amazon a refusé de motiver ce redémarrage global. Il est fort probable qu’il s’agisse de corriger une faille de sécurité. D’après IT News, il s’agirait d’une vulnérabilité de l’hyperviseur Xen.

 

Instances visées

Les instances de type T1, T2, M2, R3 et  HS1 ne sont pas concernées.

Les instances d’un même compte qui sont répliquées géographiquement ne seront pas redémarrées au même moment dans toutes les régions.

Les instances dans une région unique, mais dans plusieurs zones de disponibilité ne redémarreront pas en même temps : les instances d’une seule zone de disponibilité seront redémarrées le même jour.

La situation est donc critique pour les instances d’une même région et d’une même zone de disponibilité.

 

Recommandations

Thorsten von Eicken, le directeur technique de Rightscale, une SSII spécialisée dans le Cloud, recommande la procédure suivante:

  1. Lire la notice envoyée par AWS ;
  2. Vérifier la page ‘Events’ de la console AWS des instances affectées, qui sera toujours la source la plus à jour d’information ;
  3. Relancer ces instances de façon contrôlée pour maximiser les chances d’arriver sur un hôte corrigé ;
  4. Après avoir attendu un peu, vérifier que les instances sont bien sur des hôtes corrigés ;
  5. Si ce n’est pas le cas, essayer à nouveau ;
  6. Vérifier périodiquement qu’aucune instance ne nécessite la maintenance ;
  7. Configurer les alertes appropriées ;
  8. Surveiller de près les applications dépendantes d’AWS pendant toute la durée de la maintenance.