Une mystérieuse sortie de modèle d’IA
Ce week-end, des discussions animées ont éclaté dans les cercles de l’IA. Un modèle d’IA mystérieux, disponible sur le site LMSYS Chatbot Arena, a attiré l’attention. Certains utilisateurs ont affirmé que ses performances rivalisent, voire dépassent, celles du modèle GPT-4 d’OpenAI.
La disparition soudaine du modèle
Cependant, après quelques jours de frénésie et de tests désordonnés, ce modèle, désigné simplement par “gpt2-chatbot,”, a disparu soudainement mardi. LMSYS a ensuite annoncé sur Twitter que ce retrait était lié à un trafic inattendu sur la plateforme.
Cela n’a pas freiné les spéculations. Beaucoup considèrent que “gpt-2” pourrait être une version préliminaire d’un futur modèle issu d’une entreprise majeure comme OpenAI. Ce doute a été renforcé par un tweet récent de Sam Altman, le PDG de la startup soutenue par Microsoft, qui a évoqué le modèle mystérieux.
Altman a avoué sur X qu’il avait un certain attachement à gpt2, ajoutant que le précédent modèle de la série, GPT-2, lancé en 2019, était désormais dépassé par les développements récents.
Une performance remarquable
Malgré la brève période de test, les utilisateurs qui ont eu accès à ce modèle s’accordent à dire que ses aptitudes sont impressionnantes, en particulier pour un modèle qui pourrait ne pas provenir des grandes entreprises d’IA.
Ethan Mollick, professeur à l’Université de Pennsylvanie, a mentionné sur X que ce modèle semblait avoir des capacités comparables à celles de GPT-4. Il a même laissé entendre qu’il pourrait être encore meilleur. Des chercheurs en IA ont également salué la capacité de gpt2 à résoudre des problèmes mathématiques complexes qui posent encore des difficultés aux modèles les plus avancés.
Ce qui suscite le débat, c’est de savoir si ce modèle représente une avancée par rapport à des modèles déjà existants, comme GPT-4.5 ou Claude 3 Opus d’Anthropic. Après avoir réalisé ses propres tests, le média Ars Technica a conclu que, malgré le battage médiatique, gpt2 n’est probablement pas le GPT-5 tant attendu.
Un secret bien gardé ?
Est-ce que ce modèle provient d’un développeur désireux de se faire un nom sur la scène mondiale ? Peut-être. Mais, en prenant une approche plus cynique, il pourrait bien s’agir d’un coup marketing.
Simon Willison, un programmeur renommé et chercheur en IA, a exprimé qu’il pourrait s’agir d’un aperçu secret d’OpenAI. Il a aussi expliqué que si cette hypothèse s’avérait vraie, cela irait à l’encontre de la philosophie ouverte de la plateforme LMSYS, qui vise à développer des modèles de langage de manière transparente.
Face aux interrogations, LMSYS a confirmé qu’ils avaient déjà collaboré avec plusieurs développeurs de modèles pour apporter leurs innovations sur la plateforme.
Willison a exprimé sa frustration à Ars, soulignant que la situation représente de manière chaotique la recherche en IA : une publication opacifiée et des évaluations menées par des utilisateurs sans cadre scientifique sur Internet.
FAQ
Qu’est-ce que le LMSYS Chatbot Arena ?
C’est une plateforme conçue pour tester et comparer différents modèles de chatbot, favorisant des développements ouverts dans le domaine de l’IA.
Quelles sont les différences entre GPT-4 et gpt2 ?
Bien que gpt2 ait été perçu comme comparable, les détails techniques concernant ses architectures et performances n’ont pas encore été publiés, rendant toute comparaison préliminaire difficile.
OpenAI a-t-il des plans futurs pour GPT-5 ?
Bien que des rumeurs circulent sur un potentiel GPT-5, OpenAI n’a pas encore confirmé de calendrier officiel ni de fonctionnalités.
Quel est l’impact du trafic sur les plateformes d’IA ?
Un trafic élevé peut entraîner des soucis techniques, notamment une surcharge des systèmes, obligeant les entreprises à retirer temporairement des modèles en ligne.
Les modèles d’IA comme gpt2 doivent-ils être testés scientifiquement ?
Oui, pour garantir leur efficacité et sécurité, les modèles d’IA devraient être soumis à des tests rigoureux et vérifiés par des professionnels dans le domaine.
