Intelligence Artificielle

La Nouvelle Stable Diffusion : Création de Corps Humains Déformés et Horrifiants

La Nouvelle Stable Diffusion : Création de Corps Humains Déformés et Horrifiants

Un nouveau modèle d’IA qui déçoit

Après des mois tumultueux, l’entreprise d’IA, Stability AI, a lancé la dernière version de son modèle de génération d’images à partir de texte, baptisée Stable Diffusion 3 Medium. Selon les déclarations de Stability, cette nouvelle version serait leur modèle de génération d’images le plus avancé à ce jour. Cependant, les résultats laissent beaucoup à désirer, notamment en raison de l’apparition de créations horrifiantes.

Les utilisateurs de Stable Diffusion, déçus par ce modèle, se sont tournés vers Reddit pour exprimer leur frustration. Ils constatent que l’IA a souvent du mal à produire des représentations humaines décentes, se traduisant plutôt par des aberrations grotesques où les membres sont déformés et entremêlés.

Un utilisateur, visiblement agacé, a fait part de son expérience dans un fil de discussion, déclarant qu’il était impossible de générer une image acceptable en dehors des exemples fournis. Même des requêtes simples, comme “photographie d’une personne dormant dans un salon”, résultent en horreurs visuelles. Un autre membre a commenté que la situation serait presque comique si elle n’était pas si désespérante.

Des images troublantes

Dans ce fil, quelques utilisateurs ont mentionné qu’ils avaient réussi à obtenir des images de personnes d’apparence normale, mais il semble que ce soit une minorité.

Le terme “Cronenberg-esque” a été utilisé pour décrire les résultats étranges générés par le modèle, et des exemples partagés sur Reddit montrent des images à la fois dérangeantes et difficilement explicables. Des tentatives de requêtes simples comme “femme sur une plage” ont donné lieu à des résultats déconcertants. D’autres utilisateurs remontaient des essai pour générer des photos de femmes dans l’herbe, mais seuls leur étaient présentés des rendus cauchemardesques.

Il est à noter que l’IA semble se heurter particulièrement à des représentations de figures humanoïdes. À l’inverse, d’autres types de contenus s’affichent correctement. Cette disparité pourrait être liée au choix de Stability de former son modèle avec un ensemble de données qui exclut les images explicites et inappropriées.

Un dilemme de sécurité

Le choix de ne pas entraîner le modèle sur des contenus pour adultes pose un vrai dilemme pour les entreprises d’IA comme Stability. Bien que le matériel NSFW soit omniprésent sur Internet, il a été observé que ne pas inclure ce type de contenu lors de l’entraînement complique considérablement la capacité des modèles à générer des formes humaines de façon fiable.

En parallèle, utiliser des contenus dérivés du web provenant de sources explicites soulève de graves préoccupations en matière de sécurité et d’éthique. Dans un souci de protection — et sans doute pour éviter des poursuites —, Stability a choisi de ne pas intégrer ce type de contenu dans son processus de formation. Or, de nombreux utilisateurs, notamment ceux désireux de créer des images de femmes, s’avèrent déçus par les résultats.

Un utilisateur a même plaisanté en disant que l’entreprise pourrait maintenant faire faillite de manière “sûre et éthique”.

FAQ

Qu’est-ce que le modèle Stable Diffusion 3 Medium ?

Stable Diffusion 3 Medium est un modèle d’intelligence artificielle développé par Stability AI, conçu pour générer des images à partir de descriptions textuelles.

Pourquoi les utilisateurs sont-ils déçus par ce modèle ?

Les utilisateurs constatent que le modèle produit souvent des images défigurées ou grotesques, en particulier pour des représentations humaines, entraînant une grande frustration.

Quelles mesures ont été prises pour éviter les contenus inappropriés ?

Stability AI a choisi de former son modèle en excluant les images NSFW pour répondre à des préoccupations de sécurité et d’éthique.

Comment la génération d’images est-elle impactée par le choix de formation ?

L’absence de formation sur les contenus explicites peut limiter la capacité du modèle à générer des formes humaines de manière précise et cohérente.

Y a-t-il des solutions à ces problèmes de génération d’images ?

Les utilisateurs espèrent que des améliorations futures dans l’entraînement du modèle permettront de résoudre ces problèmes et de générer des images de meilleure qualité.

Quitter la version mobile