Accueil Agent IA Claude Fable 5 : Anthropic franchit le seuil Mythos, sous haute surveillance

Claude Fable 5 : Anthropic franchit le seuil Mythos, sous haute surveillance

Deux mois après avoir réservé ses capacités les plus avancées à un cercle restreint de cyberdefenseurs, Anthropic ouvre partiellement l’accès. Claude Fable 5, version grand public du modèle Mythos 5, est disponible depuis le 9 juin. Même architecture, garde-fous activés.

Un modèle Mythos rendu accessible par des classifieurs de sécurité

Fable 5 et Mythos 5 reposent sur le même socle technique. Ce qui les distingue : la présence de classifieurs, des systèmes d’IA autonomes chargés de détecter les requêtes potentiellement dangereuses. Lorsqu’une requête touche à la cybersécurité offensive, à la biologie ou à la chimie, la réponse est automatiquement prise en charge par Claude Opus 4.8, le modèle de génération précédente. L’utilisateur en est informé. Anthropic précise que plus de 95 % des sessions ne déclenchent aucun basculement.

La justification est technique autant que stratégique. Les modèles de classe Mythos sont capables de mener des attaques informatiques de bout en bout, reconnaissance et exploitation comprises. En biologie, Mythos 5 surpasse sur certaines tâches des modèles spécialisés, sans y avoir été explicitement entraîné. Anthropic a donc calibré ses classifieurs de façon délibérément large, quitte à générer des faux positifs sur des requêtes légitimes. Plus de 1 000 heures de red teaming externe ont été conduites avant le lancement, sans qu’aucun contournement universel ne soit trouvé. Un troisième classifieur cible par ailleurs la distillation, cette technique qui permet de reproduire les capacités d’un modèle avancé pour entraîner un système concurrent.

Une rétention de données à trente jours qui interpelle les entreprises

Anthropic impose une conservation de 30 jours sur l’ensemble du trafic des modèles de classe Mythos, côté grand public comme côté entreprises. Ces données ne seront pas utilisées pour entraîner de nouveaux modèles, assure la société, et seront supprimées passé ce délai dans la quasi-totalité des cas, avec traçabilité de tous les accès humains. La mesure vise officiellement à détecter les attaques complexes et à réduire les faux positifs.

C’est précisément ce point qui pourrait freiner l’adoption dans les environnements les plus sensibles. Selon The Verge, Microsoft aurait restreint en interne l’accès à Claude Fable 5, le temps que ses équipes juridiques évaluent les risques liés à cette politique de rétention sur ses propres données confidentielles et celles de ses clients.