La direction générale du Trésor a stoppé net, le 23 juin, l’expérimentation du modèle d’intelligence artificielle Qwen AI, propriété d’Alibaba. En cause : des réponses jugées orientées sur des sujets liés à la Chine, remontées par plusieurs hauts fonctionnaires. La start-up française Mistral AI a pris le relais dès le lendemain.
L’affaire remonte à début juin. Une centaine d’agents de la DGT, sur les 1 300 que compte la direction, testaient depuis quelques semaines un outil baptisé « HéphAIstos », en référence au dieu grec de la forge. Ce dispositif, développé en interne, associait un agent conversationnel destiné à assister les hauts fonctionnaires dans leurs tâches quotidiennes, y compris pour du traitement de données confidentielles ou sensibles, et un outil de transcription multilingue. Le choix du modèle sous-jacent, Qwen AI, avait surpris certains utilisateurs, qui ont fait remonter des réponses qu’ils jugeaient orientées ou biaisées sur des questions touchant à la Chine, rapportait Le Monde le 25 juin, à partir d’informations transmises par l’AFP.
Des biais suspectés, jamais détaillés publiquement
Selon les informations recueillies par l’AFP auprès de Bercy, le ministère a choisi d’interrompre l’expérimentation après seulement quelques jours d’usage, en raison de ces signalements. Aucun exemple concret de biais n’a toutefois été communiqué publiquement. Le Monde rappelle que plusieurs chatbots chinois ont déjà été pointés du doigt par le passé pour des réponses évasives ou trompeuses sur des sujets sensibles pour Pékin, comme la répression des Ouïghours ou le statut de Taïwan. Sollicité par l’AFP, Alibaba Cloud, qui pilote l’activité IA du groupe, n’a pas donné suite.
Un haut fonctionnaire passé par la DGT, cité de manière anonyme par Le Monde, va plus loin et juge le choix initial de ce modèle problématique pour la manière dont la France conseille son gouvernement sur la politique commerciale chinoise, estimant qu’un biais pro-chinois est quasiment inévitable avec un logiciel conçu sous la supervision des autorités de Pékin. Une lecture que Bercy nuance, en rappelant que ce modèle n’avait pas vocation à s’installer durablement et que d’autres solutions devaient de toute façon être évaluées.
La question de la souveraineté et de la sécurité des données
Au-delà des biais éditoriaux, l’épisode relance la question de la sécurité des informations publiques sensibles traitées par ce type d’outil. Bercy assure que le modèle fonctionnait sans accès à Internet ni possibilité de porte dérobée, donc sans transmission de données vers l’extérieur. Une architecture déconnectée du réseau, présentée comme indispensable pour limiter les risques de fuite. Interrogée par l’AFP, Annabelle Blangero, spécialiste de l’IA responsable chez Ekimetrics, rappelle que les biais sont inhérents à tout modèle, mais que certains peuvent avoir été ajoutés volontairement pour éviter certaines réponses ou orienter le discours sur certains sujets. Elle note également que les capacités d’audit de la sécurité des modèles restent encore limitées à ce jour, tout en jugeant peu probable la persistance de portes dérobées sur un modèle aussi largement diffusé que Qwen.
Mistral AI prend le relais
Dès le mercredi suivant l’arrêt de Qwen AI, un nouveau modèle signé Mistral AI a été installé à la DGT. Ce choix s’inscrit dans la continuité du plan gouvernemental présenté la semaine précédente pour déployer l’intelligence artificielle dans l’administration. Ce plan prévoit notamment la généralisation d’un agent conversationnel, « L’Assistant », alimenté par des modèles Mistral, à destination d’un million d’agents publics. Son déploiement est budgété à 700 000 euros pour 2026, auxquels s’ajouteront entre 2 et 4 millions d’euros annuels selon les usages et l’évolution des technologies, précise le cabinet du ministre David Amiel à l’AFP.






