En savoir plus
OpenAI dévoile GPT-5.4 : Une avancée majeure
OpenAI a récemment lancé GPT-5.4, une nouvelle version de son modèle qui vise à optimiser l’exécution de travaux professionnels complexes par rapport à ses prédécesseurs. Ce modèle intègre des avancées notables en matière de raisonnement, de programmation et d’automatisation, dans le but d’aider les utilisateurs à réaliser leurs tâches de manière plus rapide et avec moins d’erreurs.
Un modèle repensé pour le travail professionnel
La société qualifie ce système de son « modèle de pointe le plus puissant et efficace pour le travail professionnel », représentant une réelle mise à niveau des fonctions proposées via ChatGPT, Codex, et son API pour développeurs.
Ce lancement introduit deux variantes du modèle : GPT-5.4 Thinking, qui se concentre sur le raisonnement et la résolution de problèmes par étapes, et GPT-5.4 Pro, conçu pour offrir des performances maximales sur des tâches exigeantes.
Optimisation des tâches professionnelles courantes
OpenAI affirme que ce modèle excelle dans des activités qui reflètent la vie professionnelle quotidienne, comme la création de présentations, la révision de documents et la conception de tableaux. Dans l’évaluation GDPval, qui mesure les performances de l’IA dans 44 métiers, GPT-5.4 a obtenu des résultats impressionnants, égalant ou surpassant les professionnels humains dans 83 % des cas, ce qui marque une amélioration significative par rapport aux versions précédentes.
Des tests internes confirment également ces progrès : par exemple, le modèle a atteint 87.3 % dans des tâches de modélisation de tableaux, contre 68.4 % pour GPT-5.2. Les évaluateurs humains ont montré une préférence pour les présentations générées par GPT-5.4 dans 68 % des cas, soulignant de meilleurs visuels et un meilleur agencement.
Interactions directes avec les ordinateurs
L’une des innovations majeures de GPT-5.4 est sa capacité à interagir directement avec des ordinateurs, ce qui constitue un pas en avant significatif. OpenAI explique que c’est le premier système polyvalent qu’ils proposent avec des fonctions d’utilisation informatique intégrées. Cela signifie que l’IA peut non seulement naviguer dans des applications, mais aussi interagir avec des interfaces et exécuter des flux de travail complexes sur différentes plateformes.
Le modèle est capable d’interpréter des captures d’écran, de donner des commandes clavier et souris, et même de coder pour contrôler les logiciels via des bibliothèques d’automatisation. Ces nouvelles aptitudes illustrent l’émergence croissante des agents IA.
Une expérience développeur plus fluide
Du côté technique, OpenAI s’attaque à la problématique du coût en tokens qui rend souvent les agents IA complexes lents et coûteux. Une nouvelle fonctionnalité appelée Tool Search permet au modèle de chercher des définitions d’outils spécifiques uniquement quand c’est nécessaire, évitant ainsi de charger en mémoire toutes les instructions potentielles simultanément. Un test mené sur 36 serveurs a montré une réduction de 47 % de l’utilisation des tokens.
Les développeurs bénéficieront également d’un fenêtre contextuelle de 1 million de tokens dans l’API et Codex, ce qui leur permettra de traiter de plus grandes quantités de données à la fois. Cependant, OpenAI prévient que les invites dépassant 272 000 tokens seront facturées au double du tarif normal. Pour optimiser le travail, un nouveau mode « /fast » dans Codex offre un gain de vitesse de 1.5x, facilitant ainsi le débogage et le développement d’applications.
Sécurité, précision et tarifs
OpenAI prend également des mesures contre le problème des hallucinations. Selon la société, GPT-5.4 est 33 % moins enclin à faire des erreurs individuelles par rapport à GPT-5.2. Ils ont également introduit un nouveau test de sécurité pour s’assurer que le modèle ne tente pas de dissimuler son raisonnement, avec des résultats prometteurs pour les chercheurs en sécurité, indiquant que le modèle ne semble pas capable de masquer son processus de pensée.
Le nouveau modèle est désormais disponible pour les utilisateurs Plus, Team et Pro. En ce qui concerne les développeurs, le tarif pour GPT-5.4 est de 2,50 $ par million de tokens d’entrée pour le modèle standard, avec des tarifs plus élevés pour les tokens de sortie et la version Pro. Bien que le prix de l’API soit supérieur à celui des modèles précédents, OpenAI souligne que l’amélioration de l’efficacité et la réduction des essais infructueux pourraient diminuer les coûts globaux pour de nombreux utilisateurs.
Si vous êtes encore attaché à l’ancien modèle GPT-5.2 Thinking, sachez que vous avez jusqu’au 5 juin 2026 pour l’utiliser avant son retrait officiel.
FAQ
Quelles sont les principales différences entre GPT-5.4 Thinking et GPT-5.4 Pro ?
GPT-5.4 Thinking se concentre sur le raisonnement et la résolution de problèmes en plusieurs étapes, tandis que GPT-5.4 Pro vise une performance optimale pour des tâches plus exigeantes.
Comment fonctionne la fonction Tool Search ?
Tool Search permet au modèle d’accéder uniquement aux définitions d’outils nécessaires au moment opportun, ce qui optimise l’utilisation de la mémoire et réduit la consommation de tokens.
Est-ce que GPT-5.4 est plus sûr que ses prédécesseurs ?
Oui, OpenAI affirme que GPT-5.4 est moins susceptible de faire des affirmations incorrectes et a introduit de nouveaux tests de sécurité pour garantir la transparence du raisonnement.
Quel impact a la nouvelle fenêtre contextuelle de 1 million de tokens ?
Cette fonctionnalité permet de traiter un volume de données plus important, ce qui peut améliorer la performance lors de l’exécution de tâches complexes, mais notez que les prompts excessifs seront facturés à un tarif supérieur.
Quand GPT-5.2 sera-t-il retiré ?
L’ancien modèle sera officiellement retiré le 5 juin 2026, offrant aux utilisateurs encore un peu de temps pour l’adopter avant qu’il ne soit désactivé.
