Intelligence Artificielle

Vous Rirez de Cette Tâche Simple que l’IA Ne Maîtrise Toujours Pas

Vous Rirez de Cette Tâche Simple que l'IA Ne Maîtrise Toujours Pas
</div>

<p>
    <figcaption class="article-featured-image-caption">
        Intelligence artificielle, œuvre d'art conceptuel d'ordinateur. <em>Image : ANDRZEJ WOJCICKI / Getty Images</em>
    </figcaption>
</p>

Des enfants qui apprennent à lire l’heure et une IA qui peine

La capacité des enfants humains à lire l’heure se développe généralement autour de six à sept ans. Toutefois, il semble que l’intelligence artificielle ait encore des difficultés à comprendre les cadrans analogiques.

Les recherches de l’Université d’Édimbourg

Des scientifiques écossais de l’Université d’Édimbourg ont mis en évidence que les modèles d’IA, capables de traiter à la fois du texte et des images, appelés modèles de langage multimodal ou MLLM, ne réussissent qu’à lire les cadrans analogiques dans 25 % des cas. Ces recherches révèlent un véritable défi pour les systèmes d’intelligence artificielle.

Dans une étude en attente de revue par des pairs, ils ont examiné Gemini de Google ainsi que d’autres modèles d’OpenAI et d’Anthropic pour déterminer leurs performances dans la lecture des heures et des dates. Tous les modèles testés ont rencontré des difficultés dues à la combinaison d’une conscience spatiale, du contexte, et de compétences en mathématiques de base.

Les résultats des tests sur les cadrans

Les chercheurs ont mis à l’épreuve divers types de cadrans, certains avec des chiffres romains, d’autres avec ou sans trotteuse, et avec des nuances de couleurs différentes. Ils ont découvert que les systèmes d’IA réussissaient à déterminer la position des aiguilles seulement dans un peu moins de 25 % des cas. Les erreurs étaient particulièrement fréquentes dans les cadrans à chiffres romains ou à aiguilles stylisées.

La lecture des calendriers

Concernant les calendriers, les modèles MLLM se sont légèrement mieux débrouillés pour lire les dates comparé à l’heure, avec les résultats d’OpenAI étant relativement meilleurs. Le modèle GPT-o1 a obtenu 80 % de réponses correctes sur les questions de dates, mais a néanmoins fait des erreurs dans 20 % des cas, même sur des questions simples comme « Quel jour de la semaine est le jour de l’An ? ».

Les implications de ces résultats

Rohit Saxena, le principal auteur de l’étude, a souligné dans un communiqué que bien que la plupart des humains soient capables de lire l’heure et d’utiliser des calendriers dès leur jeune âge, l’intelligence artificielle, d’après ces nouvelles recherches, éprouve des difficultés à réaliser des tâches qui semblent élémentaires. Pour Saxena, ces lacunes doivent être corrigées pour que les systèmes d’intelligence artificielle puissent être intégrés efficacement dans des applications sensibles au temps, telles que la planification ou l’automatisation.

L’état actuel de l’intelligence artificielle

Ce décalage met en lumière la situation actuelle de l’IA : lorsqu’elle navigue dans des domaines complexes tels que les mathématiques ou la loi, elle excelle souvent, mais continue de rencontrer des obstacles pour des tâches basiques comme celle de lire l’heure. Des entreprises comme Apple ont récemment dû retarder des fonctionnalités d’intelligence artificielle pour leur assistant vocal Siri, car, malgré des promesses alléchantes, des difficultés persistent dans des opérations simples comme régler une alarme.

Plus sur les échecs de l’IA : Une étude indique que les moteurs de recherche basés sur l’IA commettent des erreurs dans une proportion significative de cas.

FAQ

Quelle est la principale difficulté des IA avec les cadrans analogiques ?

L’IA peine à combiner la conscience spatiale, le contexte et des simples compétences mathématiques pour interpréter correctement l’heure.

Est-ce que tous les modèles d’IA échouent à lire les cadrans ?

Bien que les performances varient, la majorité des modèles testés échouent à lire correctement l’heure dans une proportion alarmante.

Pourquoi ces résultats sont-ils préoccupants ?

Ces lacunes montrent que, malgré des avancées en AI, des tâches basiques restent difficiles, ce qui pourrait poser des problèmes dans des situations critiques.

Comment se compare l’IA dans la lecture des dates par rapport à l’heure ?

Les modèles d’IA se montrent légèrement plus compétents pour lire les dates que pour interpréter l’heure, mais les résultats restent médiocres.

Quelles applications pourraient souffrir de ces faiblesses ?

Les systèmes d’IA peuvent rencontrer des difficultés dans des applications telles que la planification d’événements, les alertes de rendez-vous et bien d’autres services basés sur le temps.

Quitter la version mobile