Intelligence Artificielle

Microsoft présente MAI-Image-2 : Son modèle d’IA d’image le plus avancé à ce jour.

Microsoft présente MAI-Image-2 : Son modèle d'IA d'image le plus avancé à ce jour.

ADGO.ca fournit des recommandations de contenus et de produits de manière indépendante, et nous pouvons gagner de l’argent lorsque vous cliquez sur les liens vers nos partenaires.
En savoir plus

Microsoft présente MAI-Image-2, son nouveau modèle génératif

Microsoft a récemment lancé MAI-Image-2, son dernier modèle de conversion de texte en images, spécialement conçu pour créer des visuels plus réalistes et utilisables pour les travaux créatifs. Ce lancement représente une avancée significative dans le développement de la technologie de génération d’images de Microsoft, après la première version, MAI-Image-1.

Une approche centrée sur les créateurs

MAI-Image-2 est conçu non seulement pour des expériences visuelles, mais pour répondre aux flux de travail créatifs du monde réel. Selon Microsoft, ce modèle met l’accent sur le photorealisme et la facilité d’utilisation.

Dans un article de blog, Microsoft a déclaré : « MAI-Image-2 est destiné aux créateurs qui recherchent des images ayant un aspect réaliste, avec un éclairage naturel et des tons de peau fidèles, dans des environnements qui donnent l’impression d’être habités. » Cette approche vise à réduire le temps de montage, permettant ainsi aux créateurs de consacrer plus de temps à la production plutôt qu’aux retouches.

A lire :  Captcha IA : Identifiez des Objets Étranges et Imaginaires

Résoudre un problème majeur : le texte dans les images

L’une des améliorations notables de MAI-Image-2 est sa capacité à produire du texte clair et cohérent au sein des images, une faiblesse bien connue de nombreuses autres technologies d’IA.

Microsoft affirme que ce modèle peut générer de manière fiable des éléments visuels contenant des éléments textuels comme des affiches, des infographies, des diapositives et des diagrammes, avec peu de différences entre l’intention et le résultat final. Cette avancée ouvre la porte à des cas d’utilisation pratiques, particulièrement avantageux pour les designers et les marketers qui travaillent avec des visuels riches en texte.

Contrairement aux versions précédentes centrées sur des critères techniques, MAI-Image-2 a été élaboré grâce aux retours de photographes, designers et narrateurs visuels. Ces experts ont permis d’identifier les lacunes des outils existants, notamment en matière de réalisme, de précision des textes et de capacité à créer des scènes complexes ou cinématographiques. Le modèle est également capable de concevoir des rendus plus imaginatifs, incluant des concepts surréalistes et des compositions très détaillées.

Des résultats prometteurs mais encore perfectibles

MAI-Image-2 a rapidement progressé dans les classements d’Arena.ai. Microsoft annonce que ce modèle a propulsé la famille MAI dans le top 3 global des laboratoires de conversion de texte en image. Toutefois, il reste derrière certains concurrents, comme les modèles Gemini de Google et les systèmes GPT-Image d’OpenAI. Néanmoins, cette montée est significative : MAI-Image-1 avait commencé à un niveau bien inférieur, ce qui marque un progrès clair pour les efforts internes d’IA de Microsoft.

Mustafa Suleyman, le PDG de Microsoft AI, a indiqué sur X : « Notre équipe a travaillé exceptionnellement dur pour ce lancement, et nous sommes maintenant parmi les meilleurs modèles du marché. »

A lire :  Des Scientifiques Créent une IA pour des Conseils Éthiques, Mais Elle Se Révèle Hautement Raciste.

Intégration dans l’écosystème de Microsoft

MAI-Image-2 est déjà en train d’être intégré dans la gamme de produits de Microsoft. Les utilisateurs peuvent l’essayer dès aujourd’hui dans le MAI Playground, tandis que son déploiement a commencé pour Copilot et Bing Image Creator.

Un accès pour les entreprises est également en cours, permettant à certains clients d’utiliser le modèle via API. Une disponibilité plus large pour les développeurs est attendue prochainement à travers Foundry.

Ce lancement intervient alors que Microsoft se concentre sur la création de ses propres modèles d’IA en interne, plutôt que de dépendre exclusivement de son partenariat avec OpenAI, qui avait précédemment alimenté une grande partie de la génération d’images dans Bing et Copilot. Cette initiative surgit également après un changement de direction, dengan Suleyman ayant pris en charge l’équipe Superintelligence à temps plein en novembre 2025, faisant d’MAI-Image-2 le premier modèle public à émerger depuis cette transition.

« Nous sommes très fiers de nos progrès sur les modèles et les produits. Restez à l’écoute pour de nouvelles annonces et rejoignez-nous dans notre mission de Superintelligence », a ajouté Suleyman dans son poste sur X.

À lire aussi : Les outils d’image basés sur l’IA s’améliorent rapidement, mais la meilleure option dépend encore de vos besoins en matière de photoréalisme, de vitesse, de contrôles d’édition ou de rendu de texte clair.

FAQ

Qu’est-ce que MAI-Image-2 ?

MAI-Image-2 est un modèle de génération d’images développé par Microsoft qui transforme le texte en visuels réalistes, axé sur l’utilisation pratique dans des contextes créatifs.

Comment puis-je accéder à MAI-Image-2 ?

Les utilisateurs peuvent tester MAI-Image-2 dans le MAI Playground, avec une intégration prévue dans des produits comme Copilot et Bing Image Creator.

A lire :  Taylor Swift Avertit Microsoft sur les Risques d'un Chatbot Raciste

Quelles améliorations MAI-Image-2 apporte-t-il par rapport à la version précédente ?

MAI-Image-2 a amélioré la génération de texte dans les images, une faiblesse antérieure, et a été développé avec des retours d’experts du secteur créatif pour un usage plus efficace.

Quel est l’objectif de Microsoft avec MAI-Image-2 ?

Microsoft vise à fournir un outil qui réduit le temps de retouche et améliore l’efficacité globale des créateurs en fournissant des visuels réalistes.

Comment cela s’inscrit-il dans la stratégie de Microsoft ?

Ce lancement fait partie de la stratégie de Microsoft de développer ses propres modèles d’IA en interne pour diminuer sa dépendance envers OpenAI.