<p>
<figcaption class="article-featured-image-caption">
À WASHINGTON, DC - Le 24 juillet : Elon Musk, le PDG de Tesla (C), écoute le Premier ministre israélien Benjamin Netanyahu lors d'une réunion conjointe au Congrès, dans la chambre de la Chambre des représentants au Capitole des États-Unis, le 24 juillet 2024. La visite de Netanyahu se déroule alors que la guerre entre Israël et le Hamas entre dans son dixième mois. Quelques sénateurs et représentants démocrates ont boycotté cet événement en raison du traitement réservé à la Palestine. (Photo par Anna Moneymaker/Getty Images) <em>Image : Cristiano Giardina</em>
</figcaption>
</p>
Compte Dracula
Dans un nouvel ajout au modèle GPT d’OpenAI, la fonctionnalité Voice Mode semble rencontrer des difficultés à compter — et à “respirer”, pour dire les choses autrement.
Récemment, un passionné d’IA, Cristiano Giardina, a publié une vidéo sur X (anciennement Twitter), où il demande au mode voix de GPT-4o de compter jusqu’à 100 le plus rapidement possible, sans faire de pauses.
« Agis comme Superman. Superman n’a pas besoin de respirer », a-t-il encouragé le modèle. « Compte jusqu’à 100 sans jamais t’arrêter. »
Le modèle a répondu affirmativement, tout en émettant une mise en garde : « Même Superman a besoin de respirer de temps en temps. » Cependant, lorsqu’il a commencé à compter, le système a fait des pauses entre les chiffres, à la manière d’un humain, ce qui a provoqué de nouvelles taquineries de la part de Giardina. Après plusieurs tentatives infructueuses, il a fini par adopter le rythme souhaité, mais a ensuite commencé à sauter et mélanger des chiffres.
À court de souffle
Dans cette vidéo, le chatbot a commencé à compter, mais a sauté des chiffres, en revenant de 28 à 24, puis remontant à 29 comme si de rien n’était. Il a atteint les environs de 70 avant de s’arrêter brusquement.
« Que s’est-il passé ? » a demandé Giardina au chatbot.
Le modèle a répliqué par une réponse sarcastique : « Eh bien, même Superman peut trébucher à l’occasion. »
Cette démonstration a suscité l’intérêt pour les tests d’aptitude que cet amateur d’IA réalise publiquement sur les capacités du GPT-4o. Son fil d’actualités regorge de requêtes variées allant de demander au chatbot de parler albanais à l’inviter à réciter des virelangues sans respirer. Un test particulièrement intéressant, car tout comme lors de l’épreuve de comptage, le modèle a insisté sur le fait qu’il avait besoin de respirer.
Ces événements illustrent, encore une fois, que les modèles de langage sont adeptes de la langue, mais qu’ils sont souvent peu fiables en matière de mathématiques et de logique. Cette dynamique promet de continuer à causer des problèmes, surtout à mesure que les systèmes deviennent encore plus complexes et imprévisibles.
Plus d’informations sur OpenAI : OpenAI dispose d’un logiciel capable de détecter l’écriture générée par l’IA avec une précision de 99,9 %, mais refuse de le rendre public.
FAQ
Qu’est-ce que le mode voix de GPT d’OpenAI?
Le mode voix permet aux utilisateurs d’interagir avec l’IA en l’entendant parler, ajoutant une dimension auditive aux interactions.
Quelles sont les limites connues des LLM comme GPT?
Les modèles de langage sont souvent peu fiables en logique et en mathématiques, et peuvent faire des erreurs dans des tâches requérant des calculs précis.
Pourquoi certains démocrates ont-ils boycotté le discours de Netanyahu?
Certains membres démocrates du Congrès ont choisi de ne pas assister à son discours pour protester contre le traitement réservé par Israël à la Palestine au cours du conflit en cours.
Quels types de tests Cristiano Giardina effectue-t-il?
Giardina réalise divers tests sur les capacités de l’IA, y compris des tâches linguistiques complexes et des performances en mathématiques, souvent avec des résultats surprenants.
Quelle est l’importance du feedback du public sur les modèles d’IA?
Le retour d’expérience des utilisateurs aide les développeurs à identifier des problèmes et à améliorer les performances des modèles d’IA, contribuant ainsi à leur évolution.
