DALL-E 2 est un outil d’intelligence artificielle conçu par OpenAI qui permet de transformer de simples mots en images. Comment cela fonctionne ? Comment l’utiliser ? On vous dit tout.
L’intelligence artificielle a fait d’énormes progrès ces dernières années. Cela lui permet de s’exprimer dans de très nombreux domaines, et ce, de manière déjà très prometteuse. OpenAI travaille sur des projets très divers. Récemment, l’entreprise a fait l’actualité avec son algorithme DALL-E 2, qui permet de générer des images très complexes à partir de simples textes descriptifs. À la lecture de cet article, vous saurez tout ce qu’il y a à savoir sur le sujet.
Qu’est-ce que DALL-E 2 ?
DALL-E 2 et un produit d’OpenAI, une startup soutenue notamment par le géant américain Microsoft. C’est un modèle d’intelligence artificielle qui a la particularité de pouvoir convertir des descriptions purement textuelles en images. Les modèles d’IA de ce genre proviennent du logiciel Google Imagen. Les logiciels ont mis au point ces derniers à partir de collections de mots et d’images sur Internet ainsi que de photos publiées sur Flickr.
Pour découvrir les grandes lignes du fonctionnement ainsi que des exemples d’images créées par DALL-E 2, regardez la vidéo ci-dessous (en anglais) :
S’il fallait décrire en quelques mots DALL-E 2, nous pourrions dire qu’il s’agit d’un “nouveau système d’IA qui peut créer des images réalistes et de l’art à partir d’une description en langage naturel”. Insérez simplement des mots, une description textuelle quelconque de l’image que vous “voulez” et DALL-E va convertir le texte en image grâce à ses modèles d’IA.
Qui peut utiliser cette IA d’OpenAI ?
À l’heure actuelle, OpenAI, comme Google d’ailleurs, ne proposent pas cette technologie au grand public. Seule une communauté restreinte, via un système d’invitation, peut profiter de ce service vraiment impressionnant. Pour être dans la liste d’attente, l’utilisateur intéressé doit indiquer s’il est développeur, artiste professionnel, chercheur universitaire, journaliste ou créateur en ligne.
L’objectif de cette liste d’attente est multiple. Tout d’abord, il s’agit de limiter l’afflux de demandes, et les ressources utilisées, par extension. Lorsqu’il y a trop de demandes d’utilisation, une boîte de dialogue apparaît pour indiquer “Trop de trafic, veuillez réessayer”. Mais cela permet aussi d’éviter de mettre cette puissante technologie entre toutes les mains. Certains pourraient l’utiliser pour de mauvaises raisons.
Quoi qu’il en soit, selon Joan Jang d’OpenAI, “nous travaillons dur pour accélérer l’accès, mais il faudra probablement un certain temps pour atteindre tout le monde ; Au 15 juin, nous avions invité 10 217 personnes à essayer DALL-E.”
DALL-E 2 propose des interfaces simples. C’est là tout l’objectif du produit, finalement. Une zone de texte, un bouton pour lancer la génération et une zone pour afficher l’image créée. L’équipe a aussi ajouté des filigranes dans le coin inférieur droit des images pour indiquer la source pour DALL-E 2 et Imagen. Ceci pour éviter des dommages potentiels. D’ailleurs, un certain nombre de filtres ont été mis en place pour éviter le contenu violent, la nudité, les complots et autres personnalités. “Il y a un processus continu d’amélioration de la sécurité de ces systèmes”, explique Prafulla Dhariwal, chercheur d’OpenAI.
Comme l’intelligence artificielle de manière plus générale, ce genre de produit est très novateur. La qualité des résultats proposés est donc très variable. Ne vous étonnez donc pas d’avoir des images assez éloignées de ce que vous imaginiez.
Si vous souhaitez en savoir davantage, rendez-vous sur le site officiel de DALL-E 2 et pour pouvoir tester l’outil, il vous faudra remplir le formulaire sur cette page.
Source link