Le ministère de l’Éducation nationale et l’éditeur français Huwise ont déployé deux services exploitant le protocole MCP sur data.education.gouv.fr. Objectif : permettre à chacun d’interroger des centaines de jeux de données publics en langage naturel. En moins de quatre mois, plus de 18 000 questions ont été posées. Une illustration concrète de la façon dont l’IA peut rendre l’open data plus accessible.
Un portail qui ne suffisait plus
Nommé administrateur des données, des algorithmes et des codes sources du ministère fin 2021, Philippe Ajuelos hérite d’un portail riche en données ouvertes. Mais si les informations sont disponibles, leur exploitation reste limitée.
Avec une équipe réduite à deux ETP et de nombreux producteurs de données, un premier chantier est lancé dès 2022 avec OpenDataSoft, devenu Huwise : harmoniser les données et développer des visualisations interactives. L’audience progresse mais une difficulté demeure.
« Un être normal ne va pas chercher des datavisualisations. Il veut l’information tout de suite », résume Philippe Ajuelos.
L’idée d’un accès en langage naturel s’impose alors. L’arrivée de ChatGPT accélère les réflexions mais plusieurs années seront nécessaires pour trouver la bonne approche.
Trois ans d’expérimentation
Les premiers tests avec les grands modèles de langage se révèlent décevants : hallucinations, analyses déconnectées des données réelles ou manque de précision malgré l’utilisation du RAG. La solution viendra finalement du MCP (Model Context Protocol).
Ce protocole standardise les échanges entre un agent IA et une source de données externe. Il permet de contrôler les données accessibles, les requêtes et les garde-fous. « On préfère qu’il ne réponde pas plutôt qu’il réponde n’importe quoi », résume Philippe Ajuelos.
Pour Jean-Marc Lazard, président et cofondateur de Huwise, le choix du MCP s’est imposé très tôt : « Nous avons rapidement compris qu’il allait devenir un standard. » Le portail réunissait les conditions idéales : données nombreuses, travail de qualité déjà réalisé et collaboration ancienne entre les équipes.
Deux services complémentaires
Depuis février 2026, le portail propose deux nouveaux services.
« Poser une question » permet d’interroger l’assistant Huwy en langage naturel. Il identifie les jeux de données pertinents, réalise les agrégations nécessaires et fournit une réponse structurée : synthèse, tableaux, graphiques, sources et métadonnées. Les requêtes sont limitées à cinq par utilisateur et cent par jour afin de maîtriser les coûts et l’empreinte numérique.
« Connecter votre IA » expose directement le serveur MCP du portail. Chercheurs, journalistes ou collectivités peuvent connecter leur propre agent IA et exploiter les données via leurs outils. L’ensemble repose sur une infrastructure française : Scaleway, Mistral et Huwise.
Une IA qui explique son raisonnement
L’une des spécificités du dispositif est son approche dite « socratique ». Avant de répondre, l’agent détaille les jeux de données utilisés, la méthode employée et les limites éventuelles de l’analyse. Cette transparence renforce la confiance dans les résultats tout en sensibilisant les utilisateurs à la donnée publique. Car derrière les statistiques sur les établissements, les résultats scolaires ou les indicateurs sociaux se trouvent des réalités humaines.
« Derrière chaque donnée, ce sont des parcours, des réussites, des échecs. Ça doit être utile et utilisé », souligne Philippe Ajuelos.
18 000 questions et un usage qui s’élargit
L’adoption a été rapide. Depuis son lancement, le module « Poser une question » a enregistré plus de 18 000 requêtes, émises par plus de 16 000 utilisateurs distincts. Près de 3 000 comptes ont aussi été créés pour accéder au serveur MCP.
Et cela sans campagne majeure : un simple post LinkedIn a accompagné le lancement. Les usages sont variés : parents cherchant un établissement, chercheurs croisant des indicateurs sociaux, journalistes produisant des visualisations ou agents publics explorant des quantités de données volumineuses. Philippe Ajuelos cite notamment plusieurs jeux de données totalisant 1,5 gigaoctet, désormais analysables en quelques requêtes pour alimenter tableaux de bord et études.






