L’**intelligence artificielle (IA)** a connu des avancées majeures dans des domaines tels que les inflexions vocales humanoïdes ou encore l’auto-construction. Cependant, la **création artistique** par le dessin demeure un véritable défi pour les ordinateurs. Bien que Google ait développé son IA pour gribouiller avec le programme SketchRNN, demander à un ordinateur de dessiner quelque chose de précis et complexe reste un enjeu bien plus grand. Récemment, des chercheurs de Microsoft ont mis au point un générateur d’images IA capable de produire des illustrations à partir de descriptions textuelles.
Ce nouvel outil représente une **réalisation remarquable** car il est beaucoup plus difficile pour un ordinateur de dessiner quelque chose que de rechercher une image correspondant à une description sur Internet. Le générateur d’images IA de Microsoft, appelé **Attentional Generative Adversarial Network (AttnGAN)**, a été entraîné en utilisant des **paires d’images et de sous-titres**, ce qui lui permet d’apprendre quelle image correspond à quel mot.
Dans leur étude, les chercheurs expliquent que leur IA est capable de sélectionner automatiquement les conditions au niveau des mots pour générer différentes zones de l’image, ce qui constitue un **exploit sans précédent**. Par exemple, lorsqu’ils ont introduit la phrase “cet oiseau a une couronne verte, des plumes noires et un ventre blanc”, l’ordinateur a réussi à produire une image correspondante avec une **précision surprenante**.
Xiaodong He, le chercheur principale, a déclaré dans un communiqué de presse de Microsoft : “Si vous allez sur Bing et que vous cherchez un oiseau, vous obtenez une photo d’oiseau. Mais ici, les images sont créées par l’ordinateur, pixel par pixel, à partir de rien.”
Les chercheurs estiment que cette technologie représente une **amélioration significative** par rapport aux précédents générateurs d’images, ce qui pourrait faciliter le travail de montage des photographes ou servir d’assistant de croquis aux artistes. Dans le communiqué, He a mentionné qu’il envisageait des films d’animation générés à partir de scénarios écrits comme une autre application potentielle.
Il est évident que des entreprises technologiques comme Google et Microsoft continueront de rivaliser pour dominer le secteur de l’IA en repoussant les limites de l’apprentissage automatique. Cependant, dans ce contexte, l’image d’oiseau multicolore de Microsoft apparaît plus **impressionnante** que les gribouillis de chat de Google.
FAQ
Comment fonctionne le générateur d’images de Microsoft ?
Le générateur utilise un modèle d’IA qui analyse les liens entre les mots et les images, permettant ainsi de créer des illustrations à partir de descriptions textuelles.
Quelles applications pratiques pourraient découler de cette technologie ?
Cela pourrait transformer des secteurs comme le design, la publicité ou le cinéma, en permettant la création rapide d’illustrations et d’animations.
Quelle est la différence entre le générateur d’images de Microsoft et les outils précédents ?
L’AttnGAN de Microsoft est capable de générer des images de manière plus nuancée, en se basant sur des descriptions détaillées et en ajustant les éléments visuels en fonction du texte.
Est-ce que ce type de technologie est accessible au grand public ?
Pour l’instant, ces technologies d’IA sont principalement en phase de recherche et développement, mais des versions simplifiées pourraient devenir accessibles à l’avenir.
Quels défis restent à relever dans le domaine de l’art généré par l’IA ?
Les défis incluent l’amélioration de la créativité des machines, la capacité à comprendre des concepts abstraits et la gestion des attentes artistiques des utilisateurs.
