Stable Video Diffusion a la capacité de produire jusqu’à 25 images à partir d’une simple image fixe. N’est-ce pas impressionnant ce qu’on peut réaliser avec une seule image ?
Tl;dr
- Stability AI a annoncé l’animation de son art génératif.
- L’outil a des limitations, mais produit des vidéos de qualité relativement élevée.
- Le produit n’est actuellement disponible que pour la recherche, et non pour des applications commerciales.
- Il suscite des préoccupations en matière d’utilisations abusives potentielles et de droits d’auteur.
Stability AI révolutionne l’art génératif
Stability AI, développeur renommé, a récemment annoncé une avancée notable dans le domaine de l’art génératif : l’animation. Cette étape significative dans la démocratisation des modèles de vidéos générées par AI a été marquée par l’introduction d’un produit innovant appelé Stable Video Diffusion. Cette “innovation de pointe”, selon l’entreprise, ouvre la voie à la création de vidéos à partir d’une seule image.
Deux modèles uniques ont été lancés
Ce tout nouvel outil est constitué de deux modèles image-vidéo capables de générer des clips de 14 à 25 images à des vitesses variant de 3 à 30 images par seconde. Il offre même la possibilité de réaliser une synthèse multi-vues à partir d’une seule image, avec un affinement sur des ensembles de données multi-vues.
Limitations et implications potentielles
Malgré sa haute qualité, Stable Video Diffusion présente certaines limites. L’outil génère des vidéos courtes (moins de 4 secondes), manque de photoréalisme parfait, ne peut pas faire de mouvements de caméra autres que de lents panoramiques, ne peut pas produire de texte lisible et peut avoir des difficultés à générer correctement des personnes et des visages. Malgré tout, il s’agit d’une avancée très attendue dans le domaine de l’IA.
Malheureusement, cette nouvelle technologie peut également être utilisée à mauvais escient via les deepfakes, les violations des droits d’auteur et autres, comme le souligne le départ récent du vice-président audio de Stability AI, Ed Newton-Rex, en raison de l’utilisation de contenu protégé par des droits d’auteur pour entraîner des modèles génératifs d’IA.
Source link