Accueil données VAST Data s’attaque au “dernier kilomètre” des données pour l’IA

VAST Data s’attaque au “dernier kilomètre” des données pour l’IA

VAST Data, fournisseur d’un OS orienté IA combinant stockage, base de données et orchestration de calcul, introduit SyncEngine, une nouvelle fonctionnalité destinée à unifier des données d’entreprise fragmentées pour les préparer aux traitements IA.

Unifier des données éclatées entre systèmes legacy et applications SaaS

VAST Data annonce SyncEngine, une nouvelle composante de son système d’exploitation dédié à l’IA, VAST AI OS. Cette fonctionnalité vise à répondre à un problème désormais courant dans les projets d’IA en entreprise : la dispersion des données entre infrastructures historiques, services cloud et applications SaaS, qui freine la mise en place de pipelines d’IA cohérents.

Le communiqué décrit cette fragmentation comme un « problème du dernier kilomètre », où des informations essentielles restent difficiles d’accès malgré les outils existants. SyncEngine se présente comme un routeur universel de données combinant ingestion, découverte et transformation au sein d’un même service. L’éditeur explique que la solution permet de traiter des volumes importants de fichiers, d’objets et de données issus de plateformes SaaS telles que Confluence, SharePoint ou Google Drive.

Catalogage global, ingestion massive et préparation pour les pipelines IA

Selon VAST Data, SyncEngine propose « les services de migration de données les plus rapides au monde » pour des datasets issus de systèmes POSIX, compatibles S3 ou d’applications SaaS. La fonctionnalité s’appuie notamment sur une indexation de métadonnées à grande échelle via la VAST DataBase, permettant de « cataloguer et rechercher des centaines de milliers de milliards de fichiers et d’objets ».

Le système inclut un catalogue global interrogeable en temps réel couvrant plusieurs environnements et offrant des fonctions de synchronisation avec vérification d’intégrité et reprise automatique. Les performances seraient évolutives « via un simple ajout de nœuds » afin d’augmenter le débit sans créer de nouveaux points de congestion. SyncEngine prépare également les données pour les pipelines d’IA du VAST AI OS grâce au découpage et à la vectorisation de données non structurées. Cette étape vise à faciliter les usages de type RAG ou les workloads agentiques, en alimentant les pipelines « sans nécessiter de migration massive des workloads ».

Le communiqué met aussi en avant des considérations de souveraineté : « L’avenir de l’IA en France appartient à celles et ceux capables de tirer pleinement parti de l’ensemble de leurs données tout en préservant leur souveraineté numérique », déclare Nathan Reiczyk, Head of Central Europe chez VAST Data. Selon lui, la dispersion des données « est devenue un frein discret mais réel » dans les secteurs régulés.