GPT-Image 1.5 : Accélération et Précision Révolutionnaires face à la Concurrence du Nano Banana Pro

OpenAI a réalisé des avancées significatives dans ses modèles de génération d’images en 2025, et l’entreprise intensifie ses efforts dans cette direction pour terminer l’année en beauté.

Sommaire

Toggle

Lancement de GPT-Image 1.5

Ce mardi, OpenAI a présenté GPT-Image Model 1.5, son nouvel outil de création d’images. Ce modèle promet non seulement des performances accrues et une meilleure suivi des instructions, mais également des outils d’édition plus précis. Dès maintenant, tous les utilisateurs de ChatGPT à travers le monde peuvent accéder à ce modèle via l’API d’OpenAI, sous le nom de GPT-Image-1.5.

Nouvelle interface de création

OpenAI a également intégré un nouvel espace dédié à la création d’images dans la barre latérale de ChatGPT, qui inclut des styles prédéfinis et des designs tendance. Ce changement représente un passage d’une approche basée sur le texte vers un flux de travail davantage axé sur le visuel. Fidji Simo, la PDG des applications chez OpenAI, a mentionné que beaucoup d’utilisateurs découvrent ChatGPT en transformant un texte en image, mais que l’interface de chat n’était pas initialement conçue pour cela.

A lire : Airbus A320 : une mise à jour logicielle risque d’entraîner des retards de vols généralisés

Performances améliorées

Le modèle GPT-Image 1.5 est déclaré jusqu’à quatre fois plus rapide que son prédécesseur. En outre, OpenAI souligne que ce modèle suit les instructions de manière plus précise, surtout lors des modifications successives. Les utilisateurs ont désormais la possibilité de modifier des éléments spécifiques d’une image, comme ajouter ou retirer des objets, ajuster les styles visuels ou encore affiner certaines zones, sans avoir à régénérer l’intégralité de l’image.

Résoudre les défis de création

Cette capacité de contrôle aide à surmonter une faiblesse fréquente des outils de création d’images génératives, qui tendent souvent à changer des scènes au lieu d’apporter des modifications ciblées. OpenAI souligne qu’éditer des images nécessite un environnement particulier adapté à la création visuelle. Par ailleurs, le modèle offre une meilleure lisibilité du texte intégré dans les images, un défi relevé par les précédents modèles d’OpenAI. Les premiers tests montrent des améliorations, même si la validation sur le terrain est essentielle pour assurer la constance des résultats.

Réinvention de l’interaction visuelle

Au-delà des améliorations apportées au modèle, OpenAI modifie la manière dont les utilisateurs interagissent avec les images dans ChatGPT. La nouvelle section de la barre latérale fonctionne comme un studio de création, offrant de l’inspiration grâce à des requêtes tendances et des filtres prédéfinis. Selon Simo, « les nouvelles interfaces de visualisation et d’édition d’images facilitent la création d’images alignées avec votre vision ou fournissent une source d’inspiration ».

Expansion des éléments visuels

OpenAI envisage d’élargir l’utilisation d’éléments visuels au sein de ChatGPT dans son ensemble. Les résultats de recherche pourraient bientôt inclure plus d’images accompagnées de sources claires, ce qui pourrait être utile pour des tâches comme vérifier des scores sportifs ou effectuer des conversions de mesures. « Lors de la création, on devrait pouvoir voir et façonner ce que l’on est en train de concevoir », a-t-elle ajouté.

A lire : Squelette de 7 000 ans dévoile une attaque de lion traumatique et la solidarité communautaire

Concurrence accrue

La sortie de GPT-Image 1.5 survient dans un contexte de concurrence croissante avec Google. D’après des rapports, Sam Altman, le PDG d’OpenAI, aurait déclaré un « code rouge » le mois dernier après que les modèles Gemini 3 et Nano Banana Pro de Google aient dominé le classement LMArena. Même après le lancement de GPT-5.2, que l’entreprise décrit comme son modèle le plus avancé pour les développeurs, Google maintient le rythme.

Perspectives d’avenir

Fin 2025, OpenAI avait prévu de lancer son prochain modèle d’image en janvier, mais a décidé d’accélérer le processus. GPT-Image 1.5 arrive peu de temps après qu’OpenAI ait conclu un accord avec Disney pour intégrer plus de 200 personnages emblématiques dans les images de ChatGPT et les vidéos Sora. Cependant, la disponibilité des personnages Disney dans GPT-Image 1.5 est attendue pour début 2026. À mesure que les outils d’images et de vidéos s’approchent de systèmes prêts pour la production, OpenAI semble se concentrer sur la rapidité, la cohérence et le contrôle, cherchant à réduire l’écart entre imagination et réalisation, une image à la fois.

FAQ

Quelle est la principale amélioration de GPT-Image 1.5 par rapport à son prédécesseur ?

GPT-Image 1.5 est jusqu’à quatre fois plus rapide et offre un meilleur suivi des instructions, permettant des modifications ciblées sans régénérer l’intégralité de l’image.

Quels types de modifications les utilisateurs peuvent-ils effectuer sur une image ?

Les utilisateurs peuvent ajouter ou retirer des objets, changer les styles visuels, ajuster les vêtements, et affiner des zones spécifiques dans l’image.

Comment OpenAI prévoit-elle d’étendre l’utilisation d’images dans ChatGPT ?

OpenAI vise à intégrer davantage d’éléments visuels dans les résultats de recherche, offrant ainsi plus d’images avec des sources claires, facilitant l’accès à des informations essentielles.

A lire : Alerte au tsunami après un tremblement de terre de magnitude 7,6 au large du Japon.

Les personnages Disney seront-ils intégrés dans GPT-Image 1.5 ?

Non, les personnages Disney ne seront pas disponibles dans la version initiale de GPT-Image 1.5, leur intégration étant prévue pour début 2026.

Comment se positionne OpenAI face à la concurrence actuelle ?

OpenAI fait face à une concurrence accrue, notamment de la part de Google, et a réagi en lançant GPT-Image 1.5 pour rester à la pointe des avancées technologiques.