Intelligence Artificielle

Un Agent IA ultramoderne bloqué dans un jeu Pokémon pour enfants.

Un Agent IA ultramoderne bloqué dans un jeu Pokémon pour enfants.

Image : Tim Roney via Getty / Nintendo / GameFreak / Futurism

L’expérience de Claude : Un défi ludique

Anthropic a récemment lancé une diffusion en direct de son modèle d’intelligence artificielle, Claude 3.7 Sonnet, qui essaie de terminer Pokémon Rouge. Ce projet, intitulé « Claude joue à Pokémon », vise à démontrer la capacité des agents IA à agir de manière autonome tout en interagissant avec leur environnement.

Un parcours laborieux

Pour ceux qui suivent l’expérience, Claude a surpris beaucoup de monde en progressant dans le jeu. Il a réussi à obtenir trois badges de Gym et a atteint la Cité de Cérule cette semaine. Cependant, son avancement est excessivement lent, car il s’arrête pour “réfléchir” après chaque mouvement. Par exemple, après presque 80 heures de circulation inefficace autour de Mont Lune, il a enfin trouvé l’échelle nécessaire pour sortir, laissant les spectateurs soulagés.

Les limitations de Claude

Malheureusement, le parcours de Claude n’indique pas une accélération prochaine. Ses aventures dans la région de Kanto se sont en grande partie soldées par une série de circonvolutions sans but, démontrant son incapacité à trouver son chemin vers le Route 5, une étape cruciale du jeu. Un élément clé fait défaut : l’utilisation de l’HM « Coupe » pour dégager des arbres et accéder au chemin tant désiré. Actuellement, Claude semble plus préoccupé par la nécessité de trouver le « bâtiment » menant à la route.

A lire :  Manifestation devant Anthropic : Des inquiétudes sur une IA en auto-amélioration

Un modèle fini aux résultats mitigés

Dans l’ensemble, Claude montre des signes d’égarement, et il est étonnant qu’une des IA les plus avancées soit bloquée par un jeu que de nombreux enfants ont réussi avec facilité. Les ingénieurs notent que Claude rencontre des difficultés avec le traitement visuel des éléments du jeu. Bien qu’il soit performant dans les segments textuels et ait accès aux coordonnées du jeu via la RAM, il lutte pour interpréter les maigres pixels de son environnement.

Perspectives d’amélioration

David Hershey, l’ingénieur d’Anthropic derrière ce projet, souligne que Claude peine à saisir ce qui est affiché à l’écran. Bien qu’il traduise bien le texte du jeu, l’interaction physique avec l’environnement reste un défi. Hershey conclut que s’il devait naviguer dans un jeu ayant des graphismes plus réalistes, ses performances pourraient s’améliorer.

Malgré ces blocages, il arrive à faire preuve d’intuition par moments, comme lorsqu’il répond correctement à des indices trompeurs dans le jeu. Par exemple, lorsque le jeu mentionne que Professeur Chen n’est pas là, Claude réagit comme un enfant perdant son repère, tout en cherchant à comprendre la situation.

Claude 3.7 Sonnet a encore du chemin à faire avant de rivaliser avec les capacités humaines, mais il a déjà fait mieux que son prédécesseur, Claude 3.0, qui n’avait même pas réussi à sortir de Pallet Town. Ses difficultés actuelles révèlent néanmoins les défis techniques considérables auxquels cette technologie est confrontée.

FAQ

Qu’est-ce qu’Anthropic et quel est son objectif ?

Anthropic est une entreprise spécialisée dans la recherche sur l’intelligence artificielle, cherchant à créer des modèles d’IA sûrs et efficaces pouvant interagir de manière autonome avec divers environnements.

A lire :  Nouvelle Application Deepfake : Devenez Acteur dans vos Films et Séries Préférés

Pourquoi Claude a-t-il des difficultés avec Pokémon Rouge ?

Claude a du mal à interpréter l’environnement graphique du jeu, qui est en basse résolution. Bien qu’il gère bien les éléments textuels, il échoue à naviguer efficacement dans le monde virtuel.

Combien de temps Claude a-t-il passé à jouer jusqu’à présent ?

Jusqu’à présent, Claude a passé près de 80 heures à jouer, mais ses progrès sont très lents en raison de sa stratégie d’élimination pour décider de ses déplacements.

Quel rôle jouent les graphismes dans les performances de Claude ?

Des graphismes plus réalistes pourraient potentiellement aider Claude à mieux comprendre son environnement, contrairement à la visualisation limitée des éléments en basse résolution dans Pokémon Rouge.

Claude peut-il apprendre de ses erreurs ?

Actuellement, Claude montre des signes de progrès, mais il doit surmonter des défis fondamentaux pour améliorer ses compétences de navigation et d’interaction dans le jeu.