Le cerveau d’un bébé
Récemment, OpenAI a lancé son nouvel agent IA nommé “Operator”. Ce modèle autonome est conçu pour réaliser diverses tâches numériques à notre place, notamment les courses en ligne. Toutefois, il serait approprié de le décrire comme un “jeune enfant”. Un reporter de Bloomberg partage son expérience avec cet outil, soulignant qu’il nécessite une surveillance constante en raison de ses nombreuses erreurs et de sa tendance à demander de l’aide lorsqu’il se trouve dans une impasse.
D’après les retours d’autres utilisateurs, l’agent IA est particulièrement lent et met du temps à réagir, un comportement typique d’un cerveau encore en développement. Rachel Metz de Bloomberg décrit avec humour comment elle a observé le fonctionnement de cet agent qui naviguait sur Internet comme si quelqu’un lui avait longuement expliqué le web sans qu’il l’ait jamais utilisé. Elle a dû rester attentive à tout moment.
ParentGPT
Les expériences comme celle de Metz suggèrent qu’il reste encore beaucoup à faire pour que la vision d’OpenAI et celle de l’industrie d’un agent IA capable de jouer le rôle d’un employé virtuel devienne une réalité. Les modèles de langage traditionnels se limitent aux mots, tandis que les agents IA ont la capacité d’interagir avec le monde qui les entoure, comme un ordinateur de bureau.
Cette capacité pourrait les amener à accomplir une multitude de tâches, allant de la navigation sur le web à l’utilisation de logiciels installés sur un PC. Dans son annonce, OpenAI a mis en avant l’utilité d’Operator pour des fonctions telles que réserver des vols, faire des réservations ou créer des listes de courses. Actuellement, cet agent est uniquement accessible aux abonnés de l’offre ChatGPT Pro, qui coûte 200 dollars par mois.
Si Operator parvenait à réaliser ces tâches de manière rapide et fiable, cela pourrait s’avérer être un gain de temps considérable. Cependant, la technologie est encore à ses débuts et ne fonctionne pas aussi autonomement que souhaité. OpenAI a même averti qu’Operator doit demander votre validation avant d’exécuter des tâches importantes, ce qui indique qu’il n’est pas encore assez fiable pour être opéré seul.
Un parent surprotecteur
Selon Metz, l’agent a réussi à accomplir des tâches simples, comme la livraison de crème glacée, mais cela a nécessité un certain niveau de guidance et d’autorisation, notamment en fournissant des informations de paiement et en approuvant l’achat. Pour des tâches plus complexes, comme la création de tableaux ou la gestion de calendriers, il a souvent échoué à respecter les détails requis. OpenAI a reconnu qu’Operator éprouve encore des difficultés avec des interfaces complexes.
Il serait agréable de savoir qu’il peut commander de la nourriture et faire des courses, mais cela vaut-il 200 dollars par mois ? Metz a conclu que, tout en étant prête à surveiller l’appareil lors de son test, la confiance est essentielle. Si OpenAI et d’autres entreprises souhaitent que les agents IA se développent, ils doivent prouver qu’ils peuvent agir de manière autonome et fiable. Sinon, les utilisateurs pourraient préférer réaliser eux-mêmes leurs tâches pour garantir qu’elles soient bien faites.
FAQ
Quel est le but principal d’OpenAI avec Operator ?
OpenAI souhaite créer un agent IA capable d’effectuer des tâches numériques autonomes, augmentant ainsi la productivité des utilisateurs sans nécessiter d’intervention humaine constante.
Quels types de tâches Operator peut-il réaliser ?
Operator peut effectuer des réservations, configurer des listes de courses et naviguer sur Internet, bien qu’il ait encore du mal avec certaines tâches complexes.
Qui peut utiliser Operator ?
Actuellement, l’accès à Operator est limité aux abonnés du plan ChatGPT Pro, disponible à 200 dollars par mois.
Quelles sont les principales critiques formulées à l’égard d’Operator ?
Les utilisateurs soulignent la lenteur de l’agent, son besoin de supervision et son incapacité à mener à bien des tâches plus complexes sans assistance.
Quels sont les défis à relever pour OpenAI ?
OpenAI doit convaincre les utilisateurs de la fiabilité de ses agents IA si elle souhaite qu’ils soient adoptés et utilisés de manière autonome.
