La panne d’une heure de Google est liée à l’authentification

Lundi, de très nombreux services de Google, y compris le moteur de recherche, YouTube ou Gmail, et les services dans le nuage tels Cloud Console, Cloud Storage, BigQuery, Kubernetes Engine, sont tombés en panne de par le monde pendant près d’une heure.

Une réalité niée par son tableau de bord, affichant tous les services au vert, jusqu’au dernier moment où ils sont passés au rouge.

Depuis, Google estime avoir trouvé la cause première de l’incident : un problème dans la gestion automatisée de quotas a réduit la capacité du système centralisé de gestion de l’authentification.

Ne pouvant vérifier la légitimité des requêtes des utilisateurs, les services renvoyèrent des erreurs à ces derniers.

Comme de nombreux employés de Google et outils internes ont été affectés par la panne, la mise à jour des tableaux de bord et de la communication externe sur la panne prit un délai certain.

L’authentification est au cœur des services dans le nuage, et sa panne entraîne inéluctablement celle de la plupart des services.

Microsoft connut une panne similaire d’Active Directory le 28 septembre, qui entraîna à son tour Office 365 et de nombreux services d’Azure, de façon intermittente, pendant 3 heures.

 

Dans un courriel séparé à ses employés, Sundar Pichai, CEO de Google, a annoncé que la plupart des employés ne reviendraient pas travailler dans ses locaux avant septembre 2021, afin de lutter contre la propagation de la maladie à coronavirus covid-19.