Le modèle d’Anthropic fait son retour, après une suspension de près de trois semaines imposée par le gouvernement américain. Anthropic en profite pour détailler le renforcement de ses garde-fous de cybersécurité.
Le 12 juin dernier, les autorités américaines imposaient des restrictions à l’export sur Claude Fable 5 et Claude Mythos 5, deux modèles lancés seulement trois jours plus tôt. Faute de moyen fiable pour vérifier la nationalité des utilisateurs en temps réel, Anthropic avait dû couper l’accès aux deux modèles pour l’ensemble de ses utilisateurs, quelle que soit leur localisation. Anthropic annonce que le gouvernement américain a levé, le 30 juin, les restrictions à l’export qui pesaient sur Claude Fable 5 et Mythos 5.
Un rapport d’Amazon à l’origine de la suspension
À l’origine de cette décision, un rapport de chercheurs d’Amazon ayant identifié une méthode permettant de contourner les protections de Fable 5 : en formulant certaines requêtes, le modèle pouvait être amené à identifier des vulnérabilités logicielles, et dans un cas précis, à produire du code démontrant comment en exploiter une.
Malgré ce constat, Anthropic a travaillé avec le gouvernement américain pour entraîner un nouveau classifieur de sécurité ciblant spécifiquement le comportement signalé, bloquant désormais la technique décrite dans plus de 99 % des cas selon l’entreprise. Les chercheurs du Center for AI Standards and Innovation (CAISI), rattaché au département du Commerce, ont testé les anciennes et nouvelles protections et les jugent particulièrement robustes. Revers de la médaille assumé par Anthropic : ce nouveau filtre bloque aussi plus fréquemment des requêtes bénignes lors de tâches courantes de codage et de débogage.
Une marge de sécurité volontairement large
Fable 5 repose sur plusieurs mécanismes de défense complémentaires, une approche dite de « défense en profondeur » : entraînement du modèle à refuser certaines requêtes dangereuses, analyse rétroactive des usages détournés, et surtout des classifieurs chargés de détecter en temps réel les tâches potentiellement dangereuses en cybersécurité. Ces derniers ne sont pas infaillibles, et peuvent eux-mêmes être contournés. Anthropic a donc fixé une marge de sécurité volontairement plus large que pour tout modèle précédent : une requête doit apparaître clairement inoffensive pour ne pas être bloquée, quitte à générer davantage de faux positifs.
Côté disponibilité, Fable 5 est accessible dès aujourd’hui à l’échelle mondiale sur le Claude Platform, Claude.ai, Claude Code et Claude Cowork, avec un accès via AWS, Google Cloud et Microsoft Foundry attendu dans les prochains jours. Mythos 5, de son côté, reste réservé à un cercle restreint d’organisations américaines ayant reçu l’aval du gouvernement le 26 juin.






