<figure class="article-featured-image-caption">
<em>Image : @EgeErdil2 via X / Futurism</em>
</figure>
Lancement de GPT-5 : Un début chaotique
OpenAI a récemment lancé la version GPT-5 de son modèle de langage, intégrée dans ChatGPT. Toutefois, les premiers retours semblent mitigés. Lors d’un événement en direct pour célébrer sa sortie, la société a voulu présenter ce modèle comme une avancée majeure vers l’Intelligence Artificielle Générale (AGI). Malheureusement, elle a été confrontée à des erreurs embarrassantes qui ont attiré l’attention du public.
Erreurs flagrantes lors de la démo
En essayant de démontrer les prouesses de GPT-5, des graphiques à barres censés illustrer ses résultats impressionnants se sont révélés être des absurdités. Bien qu’ils aient une apparence professionnelle, un examen plus attentif a révélé de graves inexactitudes. Par exemple, un graphique comparant des scores de performances en programmation a présenté le score de GPT-5 à 52,8 % d’exactitude avec une barre presque deux fois plus haute que celle de l’ancien modèle o3, qui a obtenu un 69,1 %. Ce contraste a suscité de vives réactions sur les réseaux sociaux.
Réactions et conséquences
Cette inexactitude a été signalée sur les réseaux sociaux et archivée par des médias comme The Verge. Le cas le plus frappant était ce graphique où une barre représentant 30,8 % pour un autre modèle, GPT-4o, était de la même taille que celle représentant le score supérieur, ce qui a ajouté à la confusion.
En réponse à cet incident embarrassant, OpenAI n’a pas précisé si GPT-5 avait généré ces graphiques, et à ce stade, cela semble peu probable. Cette situation est d’autant plus dérangeante pour une entreprise qui est évaluée à plusieurs centaines de milliards de dollars.
La dégradation des performances des nouveaux modèles
Il existe des études suggérant que les modèles récents peuvent devenir moins intelligents dans certains domaines, hallucinations fréquentes à l’appui. Une recherche a montré que plus un modèle de raisonnement « pense », moins sa performance est bonne. Ces éléments, liés à la qualité des données utilisées pour entraîner l’IA, posent question sur la fiabilité des résultats d’OpenAI. Par ailleurs, cette tentative de présenter un score inférieur comme étant « meilleur » que celui de son prédécesseur n’a pas manqué de susciter des interrogations.
Prise de recul d’OpenAI
Face à cet échec, Sam Altman, le PDG d’OpenAI, a tenté d’alléger la situation. Dans un tweet, il a reconnu l’erreur, qualifiant le graphique de « mega chart screwup ». À ce moment, il a même ironisé sur le futur modèle, en demandant : « Quand sortira GPT-6 ? »
Corrections et retours des utilisateurs
OpenAI a mis à jour les graphiques dans son article de blog, mais les versions originales demeurent disponibles dans la vidéo de l’événement en direct. Bien après le lancement de GPT-5, les utilisateurs ont continué à signaler des problèmes avec ses capacités à générer des images et des diagrammes. Par exemple, une demande de création d’une carte de deux villes en Virginie a abouti à des résultats incompréhensibles.
Un autre utilisateur a demandé une carte des États-Unis, mais l’IA a produit des noms absurdes comme « West Wigina » ou « Mississipo ». Ce contraste avec les affirmations précédentes d’OpenAI sur l’amélioration des performances pour générer du texte dans les images a mis en lumière leurs limites.
Réflexion finale
Le retour au travail de GPT-5 laisse penser qu’OpenAI pourrait avoir parlé un peu trop vite sur ses avancées. Le débat sur l’évolution de l’intelligence artificielle se poursuit et soulève des interrogations sur l’avenir des modèles.
FAQ
Qu’est-ce que GPT-5 et en quoi est-il différent de ses prédécesseurs ?
GPT-5 est la dernière itération du modèle de langage d’OpenAI, visant à améliorer la compréhension et la génération de texte. Il est censé être plus avancé que les versions antérieures, mais des erreurs significatives soulignent des incohérences.
Quels types d’erreurs ont été rapportés avec GPT-5 ?
De nombreuses erreurs portent sur la création de graphiques et d’images, où les résultats étaient souvent incohérents ou significativement inexacts, remettant en question la qualité des données d’entraînement.
Pourquoi le lancement de GPT-5 a-t-il suscité des critiques ?
La démo a révélé des erreurs embarrassantes, entraînant des questionnements sur la fiabilité de la technologie, d’autant plus que cela provient d’une entreprise de haute valeur.
OpenAI prévoit-elle d’apporter des corrections à GPT-5 ?
Oui, OpenAI a déjà corrigé certaines des erreurs dans les graphiques présentés lors de la démo, mais les versions originales posent toujours problème.
Y a-t-il des recherches concernant la performance des nouveaux modèles ?
Oui, certaines études suggèrent que les modèles récents peuvent en fait afficher des performances moins bonnes dans certains scénarios, ce qui un ralentissement par rapport aux versions précédentes.
