La prochaine version de Stable Diffusion génèrera des mains dignes de ce nom. Les améliorations sont assez impressionnantes.
La prochaine version du générateur d’image IA basé sur des invites textuelles, Stable Diffusion, produira des images davantage photoréalistes et sera notamment meilleure dans la génération des mains. SDXL 0.9, qui fait directement suite à Stable Diffusion XL, “produira des images et des détails de composition largement améliorés par rapport à ses prédécesseurs”, selon Stability AI. Cette annonce est apparue dans un post de blog depuis lors supprimé, signalé par Bloomberg.
La prochaine version de Stable Diffusion génèrera des mains dignes de ce nom
Stability AI décrit son nouveau modèle comme fournissant “un vrai bond dans les usages créatifs pour l’imagerie via IA générative”. Plusieurs exemples inclus dans le post montrent les avancées réalisées en utilisant les mêmes invites dans Stable Diffusion XL beta et SDWL 0.9. Les images générées avec le nouveau modèle – à droite dans les comparaisons incluses dans cet article – semblent proposer des détails plus fins et des mains plus convaincantes. Les mains étaient, jusqu’à l’arrivée de Midjourney v5, lancé en mars, un élément “simple” permettant de détecter une image générée par une IA.
“Alors qu’il peut fonctionner sur un ordinateur tout à fait conventionnel, SDXL 0.9 représente un vrai bond dans les usages créatifs pour l’imagerie via IA générative”, explique Stability AI. “La capacité de générer des créations hyper-réalistes pour le cinéma, la télévision, la musique ou des vidéos éducatives, ainsi que les avancées pour le design et une utilisation industrielle placent SDXL en première ligne des applications pour l’imagerie IA.”
Les améliorations sont assez impressionnantes
Stability AI écrit aussi que “l’augmentation significative du nombre de paramètres (la somme de tous les éléments utilisés par le réseau neuronal pour entraîner le modèle) [de ce nouveau modèle]” permet d’offrir ces résultats améliorés. Faire tourner SDXL 0.9 localement sur un PC nécessite d’avoir au moins 16 Go de RAM et une carte graphique GeForce RTX 20 (ou supérieure) avec 8 Go de VRAM. Windows 10, 11 et Linux sont actuellement supportés.
Selon le post de blog, ce modèle devrait être bientôt disponible sur l’outil web Clipdrop de Stability AI et sera ajouté prochainement à l’app DreamStudio de l’entreprise. La startup précise par ailleurs que la version open-source de SDXL 1.0 devrait arriver à la mi-juillet.
Source link