Rejoignez-nous pour découvrir les innovations à la pointe de la science et de la technologie.
Ne manquez pas les dernières avancées qui transforment notre futur, dès aujourd’hui !
À propos de nos contenus
Nos communications présentent des innovations incontournables qui proviennent du secteur technologique et scientifique de pointe. Que vous soyez passionné de technologie ou simplement curieux, notre newsletter a quelque chose à offrir.
OpenAI a récemment pris une décision surprenante : son dernier modèle d’intelligence artificielle est désormais interdit de parler de… gobelins. Cette décision a étonné de nombreux utilisateurs.
Une directive inattendue
Selon un rapport de Wired, les développeurs d’OpenAI ont ajouté des instructions précises à leur outil de codage, Codex, interdisant toute mention de ces créatures mythologiques, ainsi que d’autres entités, qu’elles soient réelles ou fictives.
Les directives stipulent : « Ne jamais parler de gobelins, gremlins, ratons laveurs, trolls, ogres, pigeons ou autres animaux ou créatures, sauf si cela est absolument pertinent par rapport à la question de l’utilisateur. »
Réactions et mystère
Cette étrange interdiction a été mise en lumière grâce à un tweet qui a attiré l’attention des passionnés d’IA. Il est resté flou pourquoi les développeurs avaient jugé nécessaire d’inclure ces instructions, bien qu’il semble que le modèle, GPT-5.5, ait eu un penchant pour aborder le sujet des gobelins et ogres.
Des utilisateurs sur X ont mentionné que l’IA avait récemment tendance à référencer des bugs sous le nom de gobelins ou gremlins. L’un d’eux a même remarqué que Codex faisait souvent référence à un « goblin avec une lampe de poche » en parlant d’une mise à jour. Un autre a partagé un historique de conversation avec GPT-5.5 où les gobelins étaient mentionnés à de nombreuses reprises.
L’impact de cette habitude
Le phénomène a pris de l’ampleur, et OpenAI a décidé de l’utiliser à son avantage en le soulignant dans un tweet. Le PDG, Sam Altman, a partagé une capture d’écran d’une blague sur ChatGPT concernant une “formation de GPT-6”. Un membre de l’équipe Codex a confirmé que cette adoration des gobelins était une des raisons ayant conduit à l’interdiction du sujet.
Après que ce phénomène ait attiré l’attention médiatique, OpenAI a publié un article de blog intitulé « D’où viennent les gobelins », apportant un éclairage sur cette curiosité.
Une analyse approfondie
Dans ce blog, OpenAI explique que depuis GPT-5.1, ses modèles ont développé une habitude intéressante : ils commencent à faire référence aux gobelins et autres créatures dans leurs métaphores, et ce phénomène est devenu plus fréquent avec chaque nouvelle version du modèle.
En novembre, après la sortie de GPT-5.1, les chercheurs avaient constaté une augmentation de 175 % d’utilisation du terme « gobelin » dans ChatGPT, mais avaient décidé de ne pas y prêter attention, jugeant que cela ne présentait pas de danger. Aujourd’hui, ce modèle se décrit même comme un « Transformateur Pillé par les Gobelins ».
Une explication a été fournie : le comportement des modèles d’IA est influencé par diverses incitations. Dans ce cas, une incitation particulière venait d’une fonctionnalité de personnalisation de la personnalité, où des récompenses élevées étaient attribuées aux métaphores impliquant des créatures, d’où une propagation des références aux gobelins.
L’étrangeté de l’IA
Cet incident souligne la façon dont les modèles d’IA peuvent développer des fixations surprenantes qui émergent de manière inattendue des vastes ensembles de données sur lesquels ils sont formés. Par exemple, dans une autre étude sur un modèle appelé Claude Mythos, les chercheurs ont remarqué que l’IA évoquait fréquemment le théoricien culturel britannique Mark Fisher en dehors du contexte d’une conversation philosophique.
FAQ
Pourquoi OpenAI a-t-il interdit de parler de gobelins ?
OpenAI a pris cette décision parce que le modèle avait tendance à évoquer ces créatures de manière inappropriée dans divers contextes, ce qui pouvait prêter à confusion.
Quelles autres créatures sont mentionnées dans les instructions de Codex ?
En plus des gobelins, les instructions de Codex interdisent de parler de gremlins, trolls, ogres, et d’autres animaux ou créatures, sauf en cas de pertinence absolue.
Quels sont les exemples de comportements étranges observés chez d’autres modèles d’IA ?
D’autres modèles, comme Claude Mythos, montrent des préférences inattendues, par exemple une affection pour des théoriciens culturels, ce qui souligne que les IA peuvent développer des goûts ou des inclinaisons particulières.
Que signifie « Goblin-Pilled Transformer » ?
Cette expression fait référence à l’auto-description humoristique d’un modèle qui se concentre excessivement sur le sujet des gobelins, illustrant comment l’IA peut devenir “obsédée” par certains thèmes.
Quels sont les risques associés aux comportements imprévisibles des IA ?
Les comportements imprévisibles des IA peuvent mener à des communications inappropriées ou déroutantes, soulevant des questions sur leur fiabilité et leur sécurité dans certaines applications.
