OpenAI, le créateur de ChatGPT, a lancé jeudi Operator, un agent IA capable d’effectuer des tâches en ligne pour l’utilisateur, telles que planifier des vacances, réserver un restaurant ou faire des courses, une étape importante dans la course aux assistants IA toujours plus performants.
Operator “utilise son propre navigateur“, il peut “regarder une page web, la faire défiler, cliquer sur les boutons” et “remplir les champs de texte comme les gens le font au quotidien“, a indiqué l’entreprise californienne dans un communiqué. La nouvelle fonction n’est pour l’instant disponible que pour les abonnés professionnels de ChatGPT, aux Etats-Unis afin de l’améliorer grâce aux retours. “Operator est l’un de nos premiers agents, c’est-à-dire des IA capables d’effectuer des tâches pour vous de manière autonome: vous lui confiez une tâche et il l’exécute“, résume OpenAI.
La concurrence…
Operator ressemble à “Computer Use”, une fonctionnalité lancée en octobre par Anthropic, une startup rivale. Computer Use permet en effet à Claude, l’interface d’IA générative
d’Anthropic, d’utiliser les ordinateurs comme un humain, de la sélection des
boutons à la saisie de texte et au maniement de différents logiciels.
Google, qui a présenté en décembre Gemini 2.0, sa nouvelle famille de modèles d’IA générative, avance aussi sur des interactions plus complexes avec la technologie, pour que les agents IA naviguent sur internet de façon autonome, cherchent des informations complémentaires en ligne ou dans un document, etc.
Le communiqué d’OpenAI comprend une vidéo montrant le fonctionnement
d’Operator. Un ingénieur lui demande de trouver une recette et d’ajouter les ingrédients nécessaires dans son panier sur un service de commande en ligne : l’agent IA va sur le site de cuisine, pose des questions complémentaires à l’utilisateur et lui demande de se connecter quand c’est nécessaire.
Des capacités intégrées à ChatGPT…
OpenAI prévoit de révéler prochainement le modèle qui alimente Operator, afin que les développeurs puissent l’utiliser pour créer leurs propres agents. Le créateur de ChatGPT compte aussi amélioré la capacité de son agent à gérer des flux de travail plus longs et plus complexes. Il prévoit un accès aux utilisateurs Plus, Team et Enterprise. Il compte enfin “à l’avenir” intégrer les capacités de son agent directement dans ChatGPT.
Juliette Paoli avec AFP