Page "Etat du service ATRIUM" - Introduction

Bienvenue sur la page "État du service ATRIUM".

Vous trouverez ci-dessous des informations actualisées régulièrement concernant l'état du service ATRIUM. L'objectif est de vous tenir informés des actions en cours lorsque le service est perturbé, qu'il s'agisse d'opération de maintenance prévues ou d'incidents inopinés.


 

État du service ATRIUM

Coupures de service

Quand : 
  • Le 17/11/2020 17h30
  • Le 18/11/2020 11h00

Nature de l'incident : Panne du portail ATRIUM. 
La navigation a pu être fortement perturbée et ralentie avant que le portail ne soit plus accessible.
Le serveur d'authentification n'ayant pas été affecté, l'authentification directe sur les services tiers restait possible.

Interventions réalisées :
  • Lors de chacun des 2 arrêts de service, le redémarrage des serveurs a permis de rétablir le service.
  • Les données d'usages et les métriques des différents serveurs sont en cours d'analyse pour déterminer la cause du problème.
  • Modernisation des outils de supervision de l'infrastructure pour disposer d'informations plus complètes sur l'activité des serveurs, ce qui devrait nous permettre de diagnostiquer plus rapidement les causes des incidents (ce chantier a été entrepris il y a plusieurs mois ; nous accélérons la mise en oeuvre des nouveaux outils pour nous aider dans le rétablissement de la qualité du service ).

Statut de l'incident : en cours.

Lors des deux évènements nous avons constaté un ralentissement de la plateforme qui déclenche très rapidement une réaction en chaîne (les requêtes utilisateurs étant traitées moins rapidement, elles s'accumulent, augmentant la charge des serveurs, ce qui ralentit le traitement des requêtes...).
Nous constatons également depuis la rentrée des vacances de la Toussaint une forte augmentation des usages sur ATRIUM ; il est trop tôt pour dire si cette augmentation du trafic est la cause directe des coupures de service.