Accueil Green IT Frugalia veut mesurer et réduire l’impact environnemental de l’IA générative

Frugalia veut mesurer et réduire l’impact environnemental de l’IA générative

Porté par DRI, Easyvirt et IMT Atlantique, le projet Frugalia vise à mieux mesurer l’impact environnemental de l’IA générative et à développer des outils capables de le réduire. Pour Édouard Guegain, chercheur chez DRI et chef de file du projet, l’enjeu n’est pas seulement de connaître la consommation des modèles, mais d’identifier les leviers concrets qui permettront d’adapter les usages sans dégrader la qualité des réponses.

Un projet né d’un constat chez DRI

Hébergeur souverain et responsable, DRI a commencé à héberger des modèles d’IA pour répondre aux demandes de ses clients et proposer une alternative à des usages qui partent souvent vers des infrastructures américaines. Très vite, l’entreprise s’est heurtée à une réalité difficile à contourner : « En mettant à disposition ces modèles d’IA, on s’est rendu compte que ça consomme beaucoup d’énergie, beaucoup plus que des serveurs classiques, beaucoup plus que du web », explique Édouard Guegain, chercheur chez DRI et chef de file du projet Frugalia. Pour une entreprise qui revendique un positionnement numérique responsable, cette hausse de consommation impose de chercher des leviers d’action. 

« On a besoin de réduire cet impact pour être cohérent avec nous-mêmes »

Le projet associe trois acteurs ligériens aux compétences complémentaires. DRI apporte notamment sa plateforme ia-souveraine.fr, ses infrastructures de calcul GPU et le datacenter Datagrex. Easyvirt contribue avec son expertise en mesure environnementale des serveurs, grâce à son logiciel DC Scope. IMT Atlantique intervient comme partenaire académique, avec un accès à son infrastructure de recherche. Frugalia représente un investissement de 992 788 euros, dont 651 997,38 euros de subvention européenne FEDER, et mobilise actuellement onze personnes, soit six équivalents temps plein.

Mesurer, mais surtout réduire

Le projet Frugalia ne vise pas seulement à produire une méthode de calcul. Il doit aussi déboucher sur des outils utilisables dans des environnements réels. « On cherche à la fois à avoir de la méthodologie et quelque chose d’académique. Mais en même temps, on veut des retombées industrielles et des choses qu’on peut vraiment implémenter techniquement dans nos solutions », résume Édouard Guegain.

La première étape consiste à construire un modèle de mesure et de prédiction de l’impact carbone des usages d’IA. Le défi est complexe, car il ne suffit pas de brancher un wattmètre à une machine pour obtenir une mesure fiable par requête. L’empreinte dépend du modèle utilisé, de la longueur du prompt, de la réponse générée, de l’infrastructure matérielle, du datacenter et de nombreux paramètres encore difficiles à isoler.

« Le sujet de mesurer l’impact de l’IA, c’est un sujet extrêmement complexe »

Selon Édouard Guegain, une partie de cette complexité vient aussi du manque de transparence du marché. « Il y a énormément d’acteurs qui n’ont aucun intérêt à communiquer sur ce sujet-là. Et même ça les arrange bien qu’on ne sache pas trop dans le détail ce que ça consomme. » L’ambition de Frugalia est donc double et cette approche distingue le projet d’une simple démarche d’évaluation environnementale. La mesure doit servir à identifier les bons leviers d’optimisation.

Orienter chaque requête vers le bon modèle

Le deuxième axe du projet porte sur le routage IA. L’idée est simple à formuler, mais beaucoup plus complexe à mettre en œuvre. Toutes les requêtes n’ont pas besoin du même niveau de puissance. Une question factuelle ne nécessite pas nécessairement un grand modèle généraliste, coûteux et énergivore. Elle peut parfois être traitée par un modèle plus petit, à condition que la qualité de réponse reste suffisante.

« On n’a pas forcément besoin du modèle le plus intelligent », explique Édouard Guegain. 

« Si l’utilisateur pose une question purement factuelle, une question type Wikipédia, on n’a pas besoin de sortir l’artillerie lourde et de sortir des gros modèles très consommateurs. » poursuit-il. Frugalia prévoit donc de développer un module capable de classifier la requête d’un utilisateur selon sa complexité et sa nature. Une demande liée au code pourra être orientée vers un modèle spécialisé. Une requête simple pourra être traitée par un modèle plus léger. Une question nécessitant davantage de raisonnement sera confiée à un modèle plus puissant.

Pour Édouard Guegain, le potentiel d’optimisation est réel : « Le routage d’IA, c’est identifier quel est le modèle le plus petit, tout en restant pertinent, qui permet de répondre à la question de l’utilisateur. » Il évoque même « un ordre de x3 entre le plus petit et le plus gros modèle » actuellement hébergé par DRI.

Des réponses plus courtes, mais toujours pertinentes

Le troisième axe du projet concerne l’optimisation des prompts et des réponses. Les modèles génératifs ont tendance à produire des réponses longues, parfois plus détaillées que nécessaire. Or la longueur de la réponse influe directement sur la consommation.

« Plus la réponse est longue, plus ça prend de temps à traiter et donc plus ça consomme », rappelle Édouard Guegain. L’objectif n’est pas de raccourcir toutes les réponses de manière brutale, mais de trouver un équilibre entre sobriété et qualité. « Il faut arriver à trouver l’équilibre entre des réponses courtes et des réponses qualitatives. » Les premiers travaux semblent déjà montrer un potentiel important. « On arrive à réduire de 90 % la longueur des réponses, donc à peu près 90 % la consommation énergétique sur ces réponses-là. Mais si le modèle répond à côté de la plaque, on perd tout l’intérêt de ces optimisations », explique-t-il.

Ce point est central pour l’adoption. Une IA plus sobre ne sera utilisée que si elle reste utile. Frugalia doit donc éviter l’écueil d’un mode « écoresponsable » perçu comme moins performant. Édouard Guegain le dit clairement, le projet devra tenir compte des usages réels et de la perception des utilisateurs. « Si nos outils d’IA écoresponsable sont associés à une idée de plus mauvaise qualité, on aura difficilement de l’adoption. »

Une sobriété qui pourrait aussi améliorer l’expérience utilisateur

L’un des points les plus intéressants de l’entretien concerne justement la manière de présenter ces optimisations. Pour DRI, il ne s’agira peut-être pas seulement de vendre un mode plus sobre, mais aussi un mode plus rapide, plus direct, plus agréable à utiliser.

« Le mode qui permet d’obtenir des réponses plus courtes, ce n’est pas juste une optimisation environnementale. C’est possible que l’utilisateur trouve ça plus satisfaisant à utiliser », avance Édouard Guegain. Une réponse plus courte peut aussi être une réponse qui va droit au but et arrive plus vite. « Le mode éco-conçu pourrait aussi être un mode plus intéressant pour les utilisateurs. »

Ce déplacement est important. La sobriété numérique ne repose pas uniquement sur la contrainte ou la culpabilisation. Elle peut aussi devenir un levier d’efficacité, à condition d’être intégrée intelligemment dans les produits. Dans cette logique, Frugalia pourrait contribuer à rapprocher optimisation environnementale, performance d’usage et expérience utilisateur.

L’impact de l’IA ne se limite pas à l’électricité

Édouard Guegain insiste aussi sur une idée souvent oubliée dans les débats sur l’IA générative. La consommation électrique n’est qu’une partie du sujet. L’impact environnemental inclut aussi la fabrication du matériel, les GPU, les datacenters, leur emprise au sol et les choix énergétiques des infrastructures. 

« Les impacts de l’IA, ce n’est pas juste de la consommation d’électricité. C’est aussi la fabrication du matériel. C’est aussi de l’emprise au sol par des datacenters »

Le lieu d’exécution des modèles joue également un rôle. Édouard Guegain estime que faire tourner un même modèle en France plutôt qu’aux États-Unis peut fortement réduire l’impact carbone lié à l’électricité consommée, en raison du mix énergétique français. Mais cette réduction ne suffit pas à régler l’ensemble du problème, puisque l’impact matériel reste encore difficile à évaluer précisément. « L’impact environnemental de fabriquer les GPU, donc les composants sur lesquels les modèles tournent, c’est très obscur pour l’instant », observe-t-il. Les données disponibles restent rares, parfois discordantes, et les fournisseurs ne mesurent pas toujours les mêmes périmètres.

Raisonner les usages de l’IA

Au-delà des infrastructures, Frugalia pose aussi la question de l’usage. Tous les besoins numériques ne justifient pas nécessairement le recours à l’IA générative. Pour Édouard Guegain, l’un des leviers les plus efficaces consiste donc à interroger la pertinence même de certains usages : « Le deuxième gros levier que je vois, c’est de raisonner l’usage et de ne pas aller systématiquement sur de l’IA quand on peut avoir des réponses plus simples ailleurs », explique-t-il. Les modèles actuels sont souvent « surdimensionnés par défaut », à la fois trop puissants et trop bavards pour certains besoins.

Pour les DSI, cette approche peut se traduire de deux façons. Elles pourront soit réutiliser les méthodologies scientifiques publiées dans le cadre du projet, soit s’appuyer sur des fournisseurs capables d’intégrer ces mécanismes dans leurs propres offres d’hébergement IA. Le projet étant financé en partie par des fonds européens, ses travaux ont vocation à donner lieu à des publications et à nourrir la communauté, notamment à travers des jeux de données, des protocoles expérimentaux reproductibles et des benchmarks de performance énergétique.

Un projet encore en phase de développement

Frugalia est prévu sur trente mois. Au moment de l’entretien, le projet en était encore à ses premiers jalons, mais les partenaires disposent déjà de premières pistes sur la mesure et l’optimisation : « On commence à avoir des résultats à la fois en termes d’optimisation et de mesure », indique Édouard Guegain. Les travaux menés avec IMT Atlantique doivent notamment permettre d’estimer l’impact à une granularité plus fine, jusqu’au niveau de la requête, avant un déploiement chez DRI pour mesurer les usages de ses clients.

Le projet revendique une articulation entre recherche académique et retombées industrielles. Édouard Guegain insiste sur ce point en fin d’entretien. « C’est bien un projet entre trois acteurs qui décident de travailler ensemble pour apporter des solutions à la fois académiques et industrielles. »