Abonnez-vous pour découvrir l’avenir, dès aujourd’hui.
<div class="newsletter-cta-description">
<p class="article-paragraph skip">Des innovations incontournables à la pointe de la science et de la technologie.</p>
</div>
</div>
</div>
Sommaire
ToggleLes Mains de Salade
Les générateurs d’images alimentés par l’IA sont incroyablement avancés et performants. Ils ont la capacité de produire des images réalistes de presque tout, simplement à partir d’une description textuelle. Cependant, ces outils ne sont pas infaillibles, en particulier en ce qui concerne la représentation des mains humaines. C’est un problème bien connu, même pour des systèmes sophistiqués comme Midjourney. Selon un article de BuzzFeed News, cela reste un défi pour ces intelligences artificielles, et les raisons sont complexes.
L’Essence du Cauchemar
Les tentatives d’IA pour créer des images de mains humaines donnent souvent des résultats dérangeants. Un exemple marquant est celui de Midjourney, qui a généré des images presque photoréalistes lors d’une fête, mais avec des représentations de mains qui frôlent l’absurde. Ces images, produites par le développeur Miles Zimmerman, ressemblent à des photos prises il y a des décennies, mais leurs mains semblent véritablement déformées.
Que ce soit des mains avec un nombre excessif de doigts ou des doigts flottants isolés dans l’espace, ces détails sont ce qui trahit l’illusion.
Anatomie des Mains
Alors pourquoi l’IA rencontre-t-elle tant de difficultés avec les mains ? Plusieurs raisons peuvent l’expliquer. Selon un représentant de Stability AI, la société derrière le générateur d’images Stable Diffusion, il apparaît que dans les ensembles de données utilisés pour l’IA, les mains sont moins visibles que les visages. De plus, elles sont généralement représentées dans des dimensions plus petites, ce qui complique la détection.
Les intelligences artificielles, comme Midjourney, peinent à comprendre la relation anatomique entre les mains et le corps humain. Comme l’indique Amelia Winger-Bearskin, experte en IA à l’Université de Floride, elles n’analysent que ce que représentent les mains dans leurs jeux de données. Dans les images, les mains sont souvent en interaction avec des objets ou des personnes, ce qui rend leur représentation encore plus complexe.
Pour progresser, ces systèmes doivent saisir « l’anatomie humaine », une compréhension qui pourrait arriver plus rapidement que prévu.
LIRE ENCORE : Pourquoi les mains générées par l’IA sont-elles si déformées ? [BuzzFeed News]
Plus sur les mains déformées : Ces photos de fête générées par l’IA nous fascinent.
FAQ
Pourquoi les générateurs d’images IA échouent-ils souvent avec les mains ?
Les générateurs n’ont pas accès à une représentation complète et variée des mains. La plupart des images qu’ils analysent mettent l’accent sur le visage, rendant l’apprentissage sur les mains plus difficile.
Que pourrait améliorer la technologie dans le futur ?
Avec des ensembles de données plus riches et diversifiés et une meilleure capacité d’apprentissage, l’IA pourra potentiellement comprendre la morphologie des mains et améliorer ses représentations.
Quels sont d’autres domaines où l’IA rencontre des difficultés ?
Outre les mains, l’IA peut aussi avoir du mal à représenter des scènes complexes avec de nombreuses interactions humaines, notamment dans la création d’images d’événements en groupe.
L’IA peut-elle un jour imiter parfaitement la main humaine ?
Il est possible que des avancées dans les algorithmes et les bases de données entraînent un jour des résultats proches de la réalité, mais cela reste un défi technique.
Existe-t-il des initiatives pour améliorer cela ?
Des chercheurs et des développeurs travaillent activement sur des techniques d’apprentissage automatique qui pourraient permettre une représentation plus précise des mains et d’autres parties du corps.
