OpenAI dévoile une évolution majeure de son assistant : l’agent ChatGPT, capable de raisonner et d’exécuter des tâches complexes, en ligne comme hors-ligne. L’intérêt est d’automatiser les workflows, libérer du temps, tout en gardant le contrôle.
Un agent proactif et multitâche
L’agent ChatGPT combine la navigation web, l’analyse multi-étapes, l’accès aux API et l’exécution de code. Il peut par exemple comparer des concurrents et créer une synthèse en diaporama, mettre à jour une feuille de calcul avec des données financières récentes, remplir des formulaires ou réorganiser des réunions ou encore réaliser des recherches complexes en ligne et produire un rapport structuré. Le tout depuis l’interface de ChatGPT, sans jamais changer d’outil.
Une fusion de technologies maison
Ce nouvel agent unifie deux briques développées par OpenAI, à savoir Operator (navigation active sur le web) et la recherche approfondie (raisonnement multi-étapes et synthèse fine). Le modèle sélectionne le bon outil pour chaque étape, apprend en cours de tâche et s’adapte aux instructions en temps réel.
Des performances impressionnantes
L’agent ChatGPT dépasse les précédentes versions sur plusieurs benchmarks, comme l’indique OpenAI dans sa présentation. Son agent obtient les meilleurs scores sur DSBench dans l’analyse de données, double ses résultats sur SpreadsheetBench dans la modification de tableurs et affiche de hautes performances sur WebArena et BrowseComp concernant la navigation web complexe. Il brille aussi sur des cas d’usage pointus comme la modélisation financière de niveau analyste.
Contrôle, sécurité et confidentialité
OpenAI insiste : l’utilisateur reste maître du processus. Pour garantir cela, l’agent demande la confirmation explicite avant toute action sensible de type formulaire, réservation ou achat. Il peut aussi être interrompu, reprendre à tout moment et le mode « prise de contrôle » permet de piloter soi-même les actions web dites sensibles. Enfin, toutes les données restent privées et aucune saisie sensible n’est stockée. Un simple clic permet de supprimer l’historique de navigation.
Déploiement et accès
L’agent est disponible pour les utilisateurs Pro, Team, Enterprise et Education. Selon les formules, il est possible de lancer de 50 à un nombre quasi illimité de tâches par mois. L’activation se fait dans le menu « mode agent » de ChatGPT.