Accueil Open Source Apertus, le choix suisse d’une IA ouverte, traçable et souveraine

Apertus, le choix suisse d’une IA ouverte, traçable et souveraine

Avec Apertus, modèle de langage (LLM) entièrement open-source et multilingue, la Suisse franchit une étape symbolique dans la course à l’intelligence artificielle souveraine. Porté par les établissements fédéraux de recherche, Apertus incarne une réponse analytique à la dépendance envers les géants commerciaux américains et pose la question de l’IA comme bien commun technologique pour les organisations. 

Un projet d’État, pas un produit commercial

Au cœur du projet Apertus se trouve une logique institutionnelle plutôt qu’une stratégie de produit. Développé par l’École polytechnique fédérale de Lausanne (EPFL), l’École polytechnique fédérale de Zurich (ETH Zurich) et le Centre suisse de calcul scientifique (CSCS), ce LLM se veut une infrastructure ouverte, transparente et accessible à tous, y compris à des acteurs publics ou privés souhaitant bâtir des cas d’usage sur une base indépendante. Contrairement aux modèles commerciaux dominants qui restent fermés sur leurs données d’entraînement, leurs architectures et leurs poids, Apertus divulgue intégralement tout son écosystème scientifique et technique.

Le projet s’inscrit dans une logique de souveraineté numérique : en exposant les recettes de formation, les données utilisées, les poids et la documentation sous licence permissive Apache 2.0, cette initiative cherche à répondre aux attentes réglementaires européennes (dont le futur AI Act) et aux contraintes strictes de protection des données et de respect du droit d’auteur.

Multilinguisme et transparence comme vecteurs d’inclusion

Sur le plan technique, Apertus s’articule autour de modèles de 8 milliards et 70 milliards de paramètres, entraînés sur près de 15 000 milliards de tokens provenant de plus de 1 000 langues, avec une proportion significative de données non anglophones. Cette orientation manifeste une ambition d’inclusion linguistique rarement atteinte dans les LLM ouverts jusqu’ici, en particulier pour des langues sous-représentées comme le suisse allemand ou le romanche. L’ouverture ne se limite pas aux langues : la philosophie du projet consiste à offrir une base sur laquelle des institutions, des PME ou des équipes de recherche peuvent construire, adapter ou auditer des solutions, qu’il s’agisse de chatbots, de moteurs de traduction, d’outils éducatifs ou d’applications sectorielles. Dans un contexte où la plupart des modèles « open » n’exposent souvent que leurs poids sans la méthodologie complète de formation, Apertus se distingue par la profondeur de sa documentation et l’accessibilité de ses composants.

Des ambitions claires, mais des limites pragmatiques

Pour autant, l’intention ouverte ne transforme pas automatiquement Apertus en concurrent direct des leaders commerciaux du marché. Avec 70 milliards de paramètres, il se situe en deçà des échelles des modèles propriétaires les plus robustes (par exemple GPT-4 ou ses successeurs), qui opèrent avec des ordres de grandeur supérieurs en termes de taille et de capacité d’entraînement. Cela peut, dans certains cas, traduire des performances moindres sur des tâches spécifiques ou des contextes de langage complexe.

Vers des modèles d’IA comme bien public numérique

Qualifier Apertus de « ChatGPT suisse » est tentant, mais inexact. Le modèle n’a jamais été conçu pour un usage personnel ou conversationnel à destination du grand public. Il s’agit d’un modèle de langage de base, pensé comme une brique technologique que des acteurs économiques, scientifiques ou institutionnels peuvent adapter à leurs propres cas d’usage, du traitement de données multilingues au soutien à la recherche médicale. Cette différence de positionnement explique aussi pourquoi Apertus ne joue pas dans la même catégorie que les modèles propriétaires dominants, entraînés à partir de volumes de données et de capacités de calcul sans commune mesure. La comparaison serait trompeuse, et ses concepteurs le reconnaissent volontiers.

Mais c’est précisément dans cet écart que le projet trouve sa cohérence. Des modèles plus petits, mieux maîtrisés et moins énergivores peuvent s’avérer plus pertinents pour les PME, plus accessibles pour les acteurs publics et plus compatibles avec les contraintes réglementaires européennes. Apertus s’inscrit ainsi dans un mouvement de fond qui remet en question la course à la taille et à la performance brute, au profit de la qualité des données et de leur gouvernance. En se conformant dès sa conception aux exigences de l’European AI Act, notamment en matière de transparence, de traçabilité et de respect de la propriété intellectuelle, le projet suisse esquisse une autre voie pour l’intelligence artificielle : moins spectaculaire, mais plus responsable.