Accueil Alibaba mise sur la personnalisation avec Wan 2.7 pour la génération d’images

Alibaba mise sur la personnalisation avec Wan 2.7 pour la génération d’images

Alibaba poursuit ses avancées dans l’intelligence artificielle générative avec le lancement de Wan2.7-Image, un modèle conçu pour améliorer la création et l’édition d’images. Avec cette nouvelle version, le groupe chinois entend répondre à un enjeu clé du secteur : produire des visuels personnalisés avec un niveau de précision compatible avec les usages professionnels.

Jusqu’à présent, les images générées par l’IA étaient souvent critiquées pour leur rendu standardisé et leurs approximations, notamment en matière de couleurs. Wan2.7-Image vise à dépasser ces limites en offrant aux créateurs un contrôle plus fin sur les résultats. L’objectif affiché est de permettre la production de contenus sur mesure, tout en réduisant les tâtonnements souvent associés à ces technologies. Pensé comme un outil créatif complet, le modèle couvre l’ensemble du processus de conception. Il permet de générer des images à partir de texte, mais aussi d’éditer des visuels existants à partir d’instructions simples. Il intègre également des capacités de traitement simultané, avec la possibilité de générer plusieurs images en parallèle, afin d’améliorer la productivité des créateurs. Selon des tests de préférence humaine réalisés de manière anonymisée, Wan2.7-Image offrirait une meilleure fidélité visuelle et une compréhension plus fine des concepts complexes que les solutions concurrentes.

L’un des axes majeurs du modèle repose sur la personnalisation. Les utilisateurs peuvent ajuster précisément certains éléments visuels, comme la structure du visage ou les traits d’un personnage, afin de produire des rendus plus réalistes et adaptés à des besoins spécifiques. Le modèle introduit également une fonctionnalité de gestion avancée des couleurs. En définissant des codes précis et leurs proportions, il devient possible de reproduire des styles graphiques complexes ou de respecter strictement des chartes visuelles, un point clé pour les usages professionnels et les marques.

Wan2.7-Image apporte par ailleurs des améliorations dans la génération de texte au sein des images. Grâce à un cadre d’apprentissage capable de traiter des séquences longues, il peut gérer des entrées allant jusqu’à 3 000 tokens et produire du contenu structuré, comme des formules ou des tableaux, dans plusieurs langues. Cette capacité facilite la création de supports variés, qu’il s’agisse de storyboards, de rendus architecturaux ou de visuels e-commerce, en s’appuyant sur des images de référence.L’éditeur met également en avant une interface d’édition simplifiée, reposant sur un système de sélection directe des éléments à modifier. Les utilisateurs peuvent ainsi intervenir sur des zones spécifiques d’une image pour ajouter, déplacer ou ajuster des objets avec une précision fine. Cette approche vise à réduire l’imprévisibilité des contenus générés par l’IA, souvent pointée du doigt par les professionnels.

Sur le plan technique, le modèle s’appuie sur un entraînement à grande échelle lui permettant de mieux interpréter les intentions des utilisateurs. Il ne se limite plus à une simple génération de pixels, mais intègre une compréhension plus avancée de la composition, de l’éclairage ou encore de la mise en page.

En parallèle , Alibaba annonce Wan2.7-Image-Pro, une version enrichie offrant une meilleure stabilité de composition, une compréhension plus fine des requêtes et une sortie en haute définition. Les modèles sont accessibles via Model Studio, la plateforme de développement IA d’Alibaba Cloud, ainsi que sur le site officiel de Wan. Ils doivent également être intégrés à Qwen App, l’application IA du groupe. Lancée en 2023, la série Wan s’inscrit dans une stratégie plus large d’Alibaba visant à renforcer ses capacités dans les technologies multimédias basées sur l’intelligence artificielle.