Accueil Cloud Panne géante d’AWS aux Etats-Unis

Panne géante d’AWS aux Etats-Unis

Le Cloud d’Amazon, AWS, connait depuis mercredi 25 novembre une panne technique avec son service de diffusion de données en temps réel.

Il y a 11 heures, le support technique d’AWS aux Etats-Unis indiquait : « Nous constatons actuellement une augmentation des taux d’erreur pour les flux de données Kinesis dans notre région US-EAST-1, affectant d’autres services de la région. Nous travaillons activement pour résoudre le problème. »
Kinesis est le service de diffusion de données en temps réel.
Permettant le traitement en temps réel de la diffusion en continu d’une grande quantité de données par seconde, il est conçu pour les applications en temps réel et permet aux développeurs de récupérer n’importe quelle quantité de données provenant de plusieurs sources.

AWS précisait alors que les services touchés étaient CodeGuru Profiler, CodeGuru Reviewer, CloudMap, Connect, Comprehend, DynamoDB, Elastic Beanstalk, GuardDuty, IoT Services, LEX, Managed Blockchain, Marketplace, MediaLive, MediaConvert, Personalize, Rekognition, SageMaker et Workspaces.

Le problème affecte de nombreuses entreprises puisque beaucoup de sites web dépendent du service d’infrastructure internet d’AWS. Dans un avis sur son « Tableau de bord de la santé des services » (Service health dashbord), AWS a indiqué qu’il continuait à restaurer progressivement toutes les demandes vers les flux de données Kinesis. « Nous travaillons à une récupération complète. Nous continuerons de vous tenir au courant de nos progrès. »

Seuls les services Amazon CloudFront, Amazon Elastic Container Service, Amazon Kinesis Data Streams, Amazon WorkSpaces, AWS IoT SiteWise semblaient montrer quelques retards dans la remédiation, comme l’indique le tableau de bord reproduit ci-dessous en partie.

 

PLus tard, AWS indiquait : « Nous avons restauré tout le trafic vers Kinesis Data Streams (…) et il fonctionne désormais normalement. Nous avons également résolu les taux d’erreur en appelant les API CloudWatch. Nous continuons à œuvrer pour une restauration complète pour IoT SiteWise et Elastic Container Service. Tous les autres services fonctionnent normalement. »

Ce 26 novembre, à l’heure où nous écrivons, seul le servive AWS IoT SiteWise présentait des taux d’erreur.

En Europe, tous les services sont au vert à examiner le tableau de bord technique d’AWS.