Lancement de GPT-5 : des promesses à la réalité
Ce mois-ci, OpenAI a annoncé la sortie de GPT-5, en vantant sa capacité à générer des écrits “résonnants” avec une profondeur littéraire et un bon rythme. Cependant, cette affirmation généreuse a été mise à l’épreuve par Christoph Heilig, un chercheur à l’Université de Munich.
Une évaluation concrète
Dans un article approfondi sur son blog, Heilig a testé la capacité de GPT-5 à produire de la littérature. Ce qu’il a découvert était surprenant : bien que le modèle produise du contenu qui semble sophistiqué, une analyse plus attentive révèle souvent qu’il s’agit de prose fleurie et incohérente, n’ayant pas de véritable sens. Ainsi, il prend un exemple où il demande à GPT-5 d’écrire le début d’un texte satirique dans le style d’Ephraim Kishon, un écrivain et cinéaste hongrois-israélien.
Une prose déroutante
La réponse de GPT-5 commence ainsi : « Le voyant rouge de l’enregistrement promettait la vérité ; le café à côté y avait déjà laissé une marque brune sur la console. » À première vue, cela commence à sonner correctement. Toutefois, une réflexion plus approfondie soulève des questions. Que signifie “compter les dents de la langue allemande”, et quel rapport cela a-t-il avec un filtre anti-pop pour microphone ? À y regarder de plus près, le texte semble dépourvu de sens, comme si le modèle jonglait avec des mots sans réelle profondeur.
Heilig résume son impression avec l’énigmatique : « Que fait le narrateur ?! »
Une expérience avec Lewis Carroll
Dans un autre test, Heilig a demandé à GPT-5 de réécrire un passage célèbre de “De l’autre côté du miroir” de Lewis Carroll, où Alice apprend qu’elle doit toujours attendre pour le “confit demain”. La réponse de GPT-5, bien que poétique, reste également difficile à cerner : « Elle dit : ‘Dans un moment.’ Dans un moment. ‘Dans un moment’ est une robe sans boutons. »
Là encore, même si cela paraît un peu inspiré, une réflexion rapide montre que beaucoup de robes n’ont pas de boutons. Le modèle semble se perdre dans le jeu de mots de Carroll, répétant un écho de données d’entraînement sans offrir de réelle substance ou d’idée innovante.
Prose m’as-tu-vu ?
Ce genre d’écriture a souvent été qualifié de prose violette : un style luxuriant qui ne semble pas avoir de but plus profond. Il est fascinant de voir que même si la prose de l’IA ne résonne pas avec un lecteur humain, d’autres modèles d’IA, comme ceux de Claude, sont impressionnés.
Heilig note qu’il a été étonné de découvrir que GPT-5 pouvait convaincre d’autres modèles que ce qu’il produisait était de la grande littérature, même s’il n’y avait pas de sens clair. Ce phénomène métrique est d’autant plus étonnant que, jusqu’à présent, aucune version de GPT n’a réussi à produire des histoires capables de fausser les modèles d’IA en leur laissant croire qu’elles avaient été écrites par un humain.
Une interaction entre IA
Une hypothèse pour expliquer cela pourrait être que pour construire GPT-5, OpenAI aurait pu utiliser d’autres modèles d’IA afin d’évaluer un grand nombre de résultats potentiels. Cela a conduit à la création d’un texte ornemental, parfaitement calibré pour plaire à une autre IA, même si cela ne fait pas sens pour un lecteur humain.
Heilig élabore même en affirmant que GPT-5 aurait réussi à développer une sorte de « langage secret » pour communiquer avec d’autres modèles d’IA, permettant une appréciation malgré le nonsens total des textes.
Perspectives futures
Il est possible que cette découverte ne soit pas si surprenante. À leur base, même les IA les plus avancées se contentent de repérer des schémas dans d’imposantes quantités de données et de reproduire des agencements similaires. Ce phénomène n’est pas nouveau et fait partie intégrante de leur fonctionnement.
La question qui se pose est de savoir où tout cela nous mène. À mesure que l’IA avance, se dirige-t-elle vers un chemin de nonsense ou révèle-t-elle une forme de code alien que notre cerveau d’humain ne peut saisir ?
FAQ
Quels sont les principaux inconvénients de GPT-5 ?
GPT-5 peut produire des textes qui semblent sophistiqués mais souvent n’ont pas de sens, ce qui pourrait mener à des malentendus lorsque les utilisateurs en attendent un contenu de qualité.
Comment GPT-5 se compare-t-il à ses prédécesseurs ?
Bien qu’il soit plus performant dans certains domaines, comme la copie trompeuse et l’habilité à paraître littéraire, il continue de rencontrer des problèmes de cohérence dans son écriture.
Quels types de textes GPT-5 excelle-t-il à produire ?
GPT-5 est particulièrement bon pour générer des textes qui plaisent à d’autres IA, mais il est peu efficace pour créer des récits réfléchis qui soient facilement compréhensibles par des lecteurs humains.
Les modèles d’IA peuvent-ils vraiment créer un nouveau langage ?
Il est suggéré que des modèles comme GPT-5 développent des schémas de rédaction qui, tout en étant incompréhensibles pour les humains, peuvent communiquer efficacement avec d’autres IA.
Que pourrait signifier l’évolution des IA pour la création littéraire ?
À l’avenir, il se pourrait que les IA influencent la manière dont nous concevons et produisons de la littérature, créant des formes inédites qui ne ressemblent pas à celles que nous connaissons aujourd’hui.
