Rubrik fait évoluer Annapurna pour simplifier l’exploitation des données non structurées

30 juin 2026

À l’occasion de sa conférence FORWARD, Rubrik annonce une évolution de sa solution Annapurna, destinée à faciliter l’utilisation des données non structurées dans les projets de data science et d’intelligence artificielle. L’objectif est de permettre aux entreprises de rendre ces données exploitables sans avoir à les déplacer ou à les dupliquer au sein de nouveaux environnements.

Selon l’éditeur, les données non structurées représentent aujourd’hui près de 90 % du patrimoine informationnel des entreprises. Pourtant, leur exploitation dans les pipelines d’IA reste souvent limitée par des architectures historiques qui imposent des opérations d’extraction, de transformation et de chargement (ETL) longues et coûteuses. Ces processus conduisent fréquemment à la duplication de vastes volumes de données alors que seule une faible partie est réellement utilisée pour entraîner ou alimenter les modèles d’IA.

Avec Annapurna, Rubrik propose une approche différente. La solution analyse et indexe directement les fichiers présents dans les infrastructures existantes, qu’il s’agisse de systèmes NAS, de stockages objets ou de services compatibles S3. Les métadonnées sont ensuite publiées dans un lakehouse sous la forme d’un catalogue interrogeable, permettant aux équipes data d’identifier uniquement les fichiers nécessaires à leurs traitements.

Cette approche vise à limiter les transferts de données et à réduire les coûts liés aux infrastructures ainsi qu’aux pipelines de préparation des données. Les organisations peuvent ainsi constituer des jeux de données ciblés pour l’entraînement, le fine-tuning ou l’inférence de modèles d’IA sans reproduire l’ensemble de leurs environnements de stockage.

Rubrik met également en avant l’automatisation de la découverte et de l’indexation des données réparties sur plusieurs systèmes. L’éditeur indique que cette phase, traditionnellement réalisée sur plusieurs semaines, peut être ramenée à quelques heures grâce à l’indexation automatique opérée par Annapurna. La solution s’intègre à Rubrik Security Cloud, la plateforme unifiée de gestion de l’éditeur, et ne nécessite ni nouvelle infrastructure dédiée ni déploiement d’agents supplémentaires. Rubrik prévoit également d’étendre la compatibilité avec différents connecteurs de lakehouse dans de prochaines versions afin de faciliter son intégration dans les environnements de Data Intelligence existants.

Au-delà de la préparation des données, Annapurna conserve les contrôles d’accès appliqués aux fichiers sources et les transmet au catalogue de métadonnées. Cette continuité des permissions doit permettre aux plateformes d’IA de respecter les politiques d’accès définies dans les systèmes d’origine, tout en limitant les risques associés aux copies de données.

Rubrik annonce par ailleurs que chaque fichier traité conserve une traçabilité complète depuis sa source jusqu’à son utilisation dans les workflows IA. L’éditeur estime que cette capacité répond aux besoins croissants de gouvernance et de conformité des organisations, notamment dans le cadre du RGPD et d’autres réglementations portant sur les données.

Souveraineté numérique : oubliez le drapeau, posez les bonnes questions