Page "Etat du service ATRIUM" - Introduction

Bienvenue sur la page "État du service ATRIUM".

Vous trouverez ci-dessous des informations actualisées régulièrement concernant l'état du service ATRIUM. L'objectif est de vous tenir informés des actions en cours lorsque le service est perturbé, qu'il s'agisse d'opération de maintenance prévues ou d'incidents inopinés.


 

État du service ATRIUM

Coupures de service (suite)

Point de situation sur les ralentissements et coupures de service :
  • De Jeudi 19 novembre à Dimanche 22 novembre, nous n'avons pas constaté de problème de disponibilité ou de temps de réponse (vous pouvez constater très ponctuellement des lenteurs, mais dans l'ensemble les indicateurs de la plateforme sont bons)
  • Lundi 23 novembre nous avons subi une coupure du service de 16h à 17h
  • Ce jour, Mardi 24 novembre, nous avons subi plusieurs perturbations :
    • de 9h à 9h12 le service a été interrompu (il s'agit d'un évènement isolé lié à un défaut de redémarrage des serveurs)
    • de forts ralentissements entre 10h et 11h30, suivi d'une interruption du service jusqu'à 12h10
    • une nouvelle interruption de service entre 13h45 et 14h45
    • la situation est revenue à la normale à 14h45 et aucun nouvel incident n'a été constaté depuis (ce billet étant rédigé à 19h15)

Actions en cours :
  • L'analyse des données déjà disponibles est effectuée en continue. Nous ne sommes pas parvenus à ce stade à identifier le composant qui déclenche le problème. Nous observons une charge tout à fait acceptable sur l'ensemble des composants avant une explosion soudaine de la charge qui déclenche la coupure de service ; il n'est donc pas évident à ce stade que ce soit un problème de surchage lié au volume d'utilisation. De plus, la survenue des incidents ne correspond pas aux pics d'utilisation.
  • L'installation des nouveaux outils de monitoring sur les infrastructures de production se poursuit
  • Un audit du serveur de base de données par une équipe d'experts va être programmée très prochainement.

Statut de l'incident : en cours.