La fin de semaine dernière, l’alimentation électrique de l’un des dix centres de données de la région US-East-1 d’Amazon Web Services (AWS) tomba en panne. Un générateur de secours fut mis immédiatement en marche, mais tomba lui aussi en panne une heure trente plus tard, pour des raisons que AWS est toujours en train d’éclaircir.
Ce qui résultat en le crash de 7,5 % des instances virtuelles EC2 et des volumes de stockage EBS (Elastic Block Store) dans cette zone de disponibilité.
L’électricité fut restaurée cinq heures plus tard, et encore deux heures plus tard, seulement 0,5 % des instances ne fonctionnait toujours pas.
Malheureusement, Amazon Web Services n’a pas réussi à récupérer toutes les données de ses clients, certains volumes EBS étant irrécupérables.
Amazon AWS had a power failure, their backup generators failed, which killed their EBS serversl, which took all of our data with it. Then it took them four days to figure this out and tell us about it.
Reminder: The cloud is just a computer in Reston with a bad power supply.
— Andy Hunt (@PragmaticAndy) September 3, 2019
Si ces clients n’ont pas effectué eux-mêmes des sauvegardes, leurs données sont perdues à jamais…
Facteur aggravant, AWS a mis parfois 4 jours pour s’en apercevoir et pour en informer ses clients.
La perte de données est sans doute la pire catastrophe qui peut arriver dans un nuage informatique.
Il est impératif d’effectuer des sauvegardes, et il est sans doute nécessaire de profiter des possibilités de réplication sur plusieurs zones de disponibilités, malgré le surcoût financier.