Longtemps reconnu pour sa maîtrise de la fédération de données et du data mesh, Starburst entre dans une nouvelle phase. L’éditeur a récemment enrichi sa plateforme d’outils dédiés à l’IA générative et agentique, avec l’ambition de devenir un acteur de référence dans l’IA d’entreprise. Ce virage marque une évolution importante de son positionnement, au-delà de son rôle historique de spécialiste du “lakehouse”.
De la fédération de données au pilotage par l’IA
S’appuyant sur le moteur de requête open source Trino, Starburst, Galaxy en mode SaaS et Enterprise en déploiement auto-hébergé, s’est imposé comme un outil clé pour donner un accès unifié à des données dispersées entre lacs, entrepôts et bases. Au fil du temps, la plateforme s’est dotée d’un catalogue de données, d’une couche de gouvernance, de fonctions de transformation et de capacités analytiques en libre-service. Avec l’intégration de l’IA, elle franchit désormais un nouveau palier.
L’une des principales annonces récente est AI Workflows, un environnement complet pour concevoir, déployer et administrer des modèles et applications IA, actuellement en préversion privée. L’approche permet de travailler directement sur les données existantes, sans pipeline complexe ni duplication. Elle intègre la conversion de données non structurées en vecteurs exploitables dans Apache Iceberg, la combinaison de prompts en langage naturel et de requêtes SQL, ainsi qu’un système de gouvernance pour encadrer l’accès aux modèles.
L’IA agentique en ligne de mire
Autre nouveauté, AI Agent introduit une interface conversationnelle prête à l’emploi, déployable par des analystes ou agents autonomes. L’objectif est de simplifier des tâches comme la création de tableaux de bord, la génération d’indicateurs clés ou la rédaction de documentation technique. Ces outils s’appuient sur la capacité de Starburst à exploiter des données distribuées, qu’elles soient hébergées sur site ou dans le cloud, tout en garantissant leur qualité et leur contextualisation.
En parallèle, Starburst a renforcé les fondations de sa plateforme. Un nouveau catalogue de données remplace Hive Metastore et facilite la gestion des actifs. La fonction d’auto-étiquetage détecte et classe automatiquement les informations sensibles. Les pipelines Apache Iceberg entièrement managés intègrent des opérations de maintenance automatisées et offrent des options d’ingestion temps réel ou batch. La prise en charge native des S3 Tables et un routage intelligent des requêtes améliorent encore les performances. Enfin, l’offre Data-to-AI Readiness Blueprint accompagne les organisations dans la préparation de leur architecture de données aux workloads IA, sans passer par des migrations coûteuses.
En misant sur l’interopérabilité et les standards open source, Starburst affirme une vision claire : supprimer les silos, simplifier l’accès aux données et fournir une infrastructure capable d’alimenter la prochaine génération d’agents IA avec des informations contextualisées et gouvernées. Le positionnement de Starburst sur la convergence entre fédération de données et IA pourrait bien lui ouvrir une place de choix dans un marché en pleine recomposition.