Accueil Automatisation Gouvernance des données : qui vérifie vraiment ce que l’IA produit ?

Gouvernance des données : qui vérifie vraiment ce que l’IA produit ?

Benoit Perigaud, Staff Developer Experience Advocate chez dbt Labs. Crédit : Benoit Perigaud.

Le rapport annuel de dbt Labs sur l’ingénierie analytique dresse un constat sans appel : les équipes data ont massivement intégré l’IA dans leurs workflows, mais les mécanismes de gouvernance peinent à suivre le rythme. Un déséquilibre qui interroge jusqu’aux directions générales.

Coder vite, tester peu

L’IA n’est plus en phase d’expérimentation au sein des équipes data. Elle est financée, embarquée, et remodèle activement les workflows d’ingénierie analytique, la façon dont le code est écrit, dont les insights sont produits, dont les équipes investissent dans l’infrastructure. Le chiffre qui résume tout : 72 % des répondants font désormais du codage assisté par IA une priorité dans leur processus de développement, contre seulement 24 % pour la gestion assistée des pipelines, tests, observabilité, contrôles qualité. On accélère la production, mais on ne renforce pas la vérification au même rythme.

Ce déséquilibre vient de la tension entre accélération et stabilisation. L’IA se déploie sur deux fronts : la montée en débit de l’ingénierie portée par le codage assisté, et les outputs destinés aux métiers via les insights générés automatiquement. Mais l’investissement dans la validation, les tests et les mécanismes de gouvernance ne progresse pas au même rythme. Benoit Perigaud, Staff Developer Experience Advocate chez dbt Labs, le formule en termes opérationnels :

« L’IA peut créer des transformations, mais aussi définir les tests au même moment. Si les gens utilisent des outils qui n’intègrent pas les tests dans la transformation elle-même, il peut y avoir des problèmes »

Le risque survient précisément quand ces deux dimensions sont dissociées.

83 % pour la confiance, mais la gouvernance attend

La part des répondants qui jugent important d’accroître la confiance dans les données et les équipes data est passée de 66 % en 2025 à 83 % en 2026 — la plus forte progression parmi tous les objectifs mesurés. La rapidité suit le même mouvement, de 50 % à 71 %. La réduction des coûts, elle, n’enregistre qu’un gain marginal. La hiérarchie des priorités a changé : ce n’est plus l’efficience qui prime, c’est la fiabilité sous accélération. Comme le résume le rapport : « 2025 a révélé le potentiel. 2026 exige de la discipline. »

71 % des professionnels de la data se déclarent préoccupés par la diffusion de données incorrectes ou hallucinées auprès des parties prenantes. Et si la mauvaise réponse vient non pas d’une hallucination du modèle, mais d’une transformation de données erronée en amont ? C’est précisément la question que posent les équipes data, désormais positionnées comme garantes de la qualité des outputs IA. Benoit Perigaud y voit une réponse technique concrète : investir dans une couche sémantique configurée pour les KPIs critiques, qui circonscrit les requêtes de l’IA aux périmètres où les réponses ne peuvent pas être fausses. « On va laisser l’IA seulement parler à cette couche sémantique. Elle va toujours donner les bons résultats parce qu’elle est vraiment configurée dans l’outil », explique-t-il. Pour le reste, l’IA fait des requêtes directes sur les données, avec davantage de risques — et une transparence accrue sur le raisonnement suivi devient alors indispensable.

Focus PME : gouverner ce qu’on ne peut pas prédire

La question de la vérification prend une dimension particulière pour les organisations de taille intermédiaire, qui ne disposent ni des ressources ni des équipes spécialisées pour absorber l’incertitude structurelle des systèmes IA. Peter Manta, AI Strategy & Practice Director chez Informatica, identifie l’angle mort central : les principes traditionnels de gouvernance des données ne se transposent pas directement à l’IA. « Lorsqu’un modèle apprend quelque chose, il ne peut pas vraiment désapprendre. S’il intègre une information erronée, il n’a pas de moyen simple de revenir en arrière », souligne-t-il. Et si le modèle a accès à des ensembles de données apparemment sans lien, il peut les combiner de manière inattendue et générer des inférences non désirées. On essaie, en somme, de gouverner un système dont on ne peut pas toujours prédire le résultat.

Sa recommandation pratique rejoint les conclusions du rapport dbt Labs : définir une frontière homme-machine explicite, c’est-à-dire déterminer à quelle étape du processus l’intervention humaine reste nécessaire, en fonction du profil de risque et des conséquences d’une éventuelle erreur. « La gouvernance ne vise pas à éliminer tous les risques, car c’est impossible. Il s’agit plutôt de les gérer », rappelle Peter Manta. Le prochain stade de l’intégration IA passera vraisemblablement de la génération à l’exécution, avec des systèmes coordonnant des workflows et opérant sur plusieurs outils avec une intervention humaine réduite. Si les contrôles qualité et les mécanismes de gouvernance ne mûrissent pas au même rythme, l’autonomie accroîtra la complexité plutôt qu’elle ne la réduira. La discipline, conclut le rapport, devient le prérequis de l’autonomie.