Un Nouveau Pas dans l’IA Vidéo avec Sora
OpenAI a récemment annoncé sa nouvelle intelligence artificielle dédiée à la création de vidéos à partir de textes, suscitant un grand intérêt, notamment parmi les utilisateurs férus de technologie. Bien que le modèle ne soit pas encore accessible au grand public, la scène sur X (anciennement Twitter) a déjà été inondée de threads enthousiastes évaluant les vidéos générées par cette technologie, ainsi que les instructions utilisées pour les produire.
L’Engouement pour Sora
Un utilisateur connu, Rowan Cheung, a particulièrement partagé son enthousiasme, évoquant une “révolution” dans le domaine de la vidéo grâce à Sora, ajoutant que les vidéos générées sont parmi les plus impressionnantes qu’il ait vues. D’autres utilisateurs, également optimistes, ont noté que ceux qui croient en la Théorie de la Simulation se sentent confortés par ces avancées technologiques.
Des Vidéos Impressionnantes, mais…
Les premières vidéos créées par Sora, comme celle d’un mammouth en images de synthèse, ont été saluées pour leur qualité. OpenAI a même affiché en ligne que Sora peut comprendre non seulement ce qui a été demandé dans la demande, mais aussi comment ces éléments existent dans le monde réel. C’est un éloge qui, tout en étant mérité, soulève des questions quant aux résultats.
Cependant, à mesure que le public découvre d’autres vidéos produites par Sora, il apparaît que cette technologie souffre de nombreux problèmes similaires à ceux rencontrés avec d’autres intelligences créatives, que ce soit à travers des images ou des vidéos.
Problèmes Techniques et Incohérences
Prenons un exemple où un vidéo montre une course de vélos sur une plage, peuplée par divers animaux. À première vue, la création semble cohérente, mais en y regardant de plus près, les incohérences deviennent évidentes : certains animaux flottent inexplicablement dans les airs, tandis que d’autres ressemblent à des monstres marins inventés.
Une autre vidéo censée montrer New York sous l’eau, évoque une scène de l’Atlantide, mais les poissons et les tortues naviguent au-dessus de la surface, flânant dans l’air. Ce genre d’observation souligne les points faibles du modèle en matière de physique.
Une Communication Sur les Limites
OpenAI a reconnu que Sora a encore des difficultés à reproduire des scènes complexes avec précision et à saisir les relations de cause à effet. Ces erreurs, bien que parfois captivantes, rendent les vidéos souvent irréalistes. Par exemple, dans une vidéo où un chat réveille son propriétaire, le corps de ce dernier fusionne avec le lit, tandis qu’une main surgit là où elle ne devrait pas être. Ces types de problèmes résonnent également dans d’autres modèles d’IA.
L’avenir de l’IA Vidéo
Bien que Sora ne soit pas encore ouvert au public, elle est testée par un groupe d’artistes visuels et de cinéastes pour recueillir des retours. OpenAI a indiqué vouloir partager ses avancées en temps réel pour donner au public un aperçu des possibilités futures de l’IA.
Pour le moment, il est difficile d’imaginer Sora produire des films ou des animations pleinement cohérents qui ne semblent pas être des rêves fiévreux. Beaucoup pensent que les problèmes de corps déformés et d’objets flottants évoquent des défis loin d’être résolus.
Réflexions des Professionnels
Des professionnels, comme l’animateur Owen Fern, ont exprimé leur confiance face aux produits de Sora : ils considèrent que l’animation reste un processus d’itération, où les erreurs peuvent être corrigées par un humain, tandis qu’AI aurait besoin de tout redémarrer. Cette attitude ouverte indique que les designers et réalisateurs sont prêts à évaluer ces outils avec un regard critique.
Bien que des entreprises comme Runway aient attiré l’attention avec leurs services de création de vidéos par IA, la prudence est de mise concernant une utilisation généralisée de ces systèmes dans les studios de cinéma, malgré leur intérêt croissant.
FAQ
Quels types de contenus peuvent être générés par Sora ?
Sora peut créer des vidéos animées basées sur des descriptions textuelles, mais les résultats peuvent varier en précision et en réalisme.
Quand le public pourra-t-il accéder à Sora ?
Actuellement, Sora est testée par un groupe d’artistes et de créateurs. Une date de lancement publique n’a pas encore été annoncée.
Quelles industries sont susceptibles d’adopter cette technologie ?
Les studios de cinéma et de production, ainsi que les agences de publicité, montrent un intérêt notable dans l’IA vidéo pour la réduction des coûts et l’optimisation des processus créatifs.
Quelles sont les principales limites identifiées pour Sora jusqu’à présent ?
Les problèmes incluent des incohérences visuelles, une difficulté à représenter fidèlement la physique, ainsi que des déformations d’objets et de corps.
Quelles précautions prennent les experts face à cette technologie ?
Les professionnels de l’animation et de l’art numérique observent les avancées de Sora avec prudence, soulignant que l’itération humaine est essentielle pour produire des résultats de qualité.
