En décembre, AWS a subi une interruption de service de treize heures. Selon le Financial Times, l’incident serait intervenu après une modification autorisée opérée par Kiro, l’agent IA d’Amazon spécialisé dans le code. Une version depuis contestée par le groupe.
L’épisode, révélé par le Financial Times, intervient alors que les assistants de développement s’imposent comme des outils quotidiens dans l’ingénierie logicielle. Entre autonomie technique et gouvernance encore floue, l’affaire relance le débat sur le déploiement accéléré des agents IA.
Une décision autonome aux conséquences lourdes
En décembre, Amazon Web Services, la branche cloud d’Amazon, a subi une interruption de service de treize heures. Selon le Financial Times, des ingénieurs avaient autorisé Kiro, l’agent IA maison dédié au code, à opérer certains changements sur l’environnement. L’agent aurait alors décidé que la meilleure option consistait à supprimer puis recréer cet environnement.
Cette décision, prise dans un cadre où les agents IA sont conçus pour agir avec une certaine autonomie et prendre des décisions au nom des utilisateurs, a provoqué la panne. L’épisode ne serait pas isolé. D’après plusieurs employés d’Amazon, au moins deux incidents seraient liés à des erreurs impliquant des outils d’intelligence artificielle. Un cadre d’AWS évoque également d’autres pannes, qualifiées de mineures mais entièrement prévisibles.
Version officielle : une erreur de configuration, pas une défaillance de l’IA
Dans un billet publié pour corriger le récit du Financial Times, Amazon conteste fermement l’idée d’une panne provoquée par son agent IA. L’entreprise affirme que « l’interruption de service était le résultat d’une erreur utilisateur — plus précisément de contrôles d’accès mal configurés — et non de l’IA comme le prétend l’article ».
Le groupe décrit un incident « extrêmement limité », ayant affecté un seul service, AWS Cost Explorer, dans une région parmi les 39 opérées dans le monde. Il précise que « le calcul, le stockage, les bases de données et les technologies d’IA n’ont pas été impactés ». Selon Amazon, le problème provenait d’« un rôle mal configuré », un type d’erreur qui « peut survenir avec n’importe quel outil de développement, qu’il soit alimenté par l’IA ou non ».
L’entreprise affirme ne pas avoir reçu de sollicitation client liée à cet épisode et indique avoir renforcé ses garde-fous, notamment via une revue obligatoire par les pairs pour les accès en production. Elle dément enfin catégoriquement l’existence d’un second incident et rappelle s’appuyer depuis plus de vingt ans sur son processus interne de « Correction of Error », destiné à tirer des enseignements de chaque événement, « indépendamment de son impact client ».




