Avant de devenir accessible au grand public, son potentiel d’abus doit être correctement évalué.
Tl;dr
- OpenAI a annoncé jeudi la création de Sora, un nouveau modèle capable de produire des vidéos en haute définition à partir de textes.
- Sora n’est pas encore accessible au grand public, mais à un petit groupe de chercheurs pour évaluation.
- La montée des outils de conversion de texte en vidéo suscite des inquiétudes quant à leur potentiel d’abus.
- OpenAI collabore avec des experts pour tester l’outil et développe des moyens de détecter les vidéos générées par Sora .
OpenAI annonce la création de Sora
OpenAI, la prestigieuse entreprise d’intelligence artificielle, a dévoilé jeudi dernier son nouveau modèle de génération de vidéos basé sur des instructions textuelles. Baptisé Sora, qui signifie “ciel” en japonais, cette innovation ne sera toutefois pas accessible au grand public de sitôt.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Le fonctionnement de Sora
Selon la communication d’OpenAI, “Sora est capable de générer des scènes complexes avec plusieurs personnages, avec des mouvements spécifiques et des détails précis du sujet et du fond”. Le programme interprète non seulement les instructions textuelles, mais comprend également comment ces éléments interagissent dans le monde physique. Cependant, il n’est pas exempt de défauts. Par exemple, un essai montrant un Dalmatien regardant par la fenêtre a omis de représenter les personnes et les rues mentionnées dans la consigne.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Une innovation pas si nouvelle
Sora n’est pas le premier de sa catégorie. D’autres entreprises, comme Meta, Google et Runway, ont déjà présenté ou mis à disposition du grand public de tels outils. L’avantage de Sora réside dans sa capacité à produire des vidéos de 60 secondes en une seule fois, au lieu de les assembler image par image.
Les préoccupations suscitées par cette technologie
Si l’expansion des outils de conversion de texte en vidéo est une avancée considérable, elle soulève des préoccupations. Certains, comme Oren Etzioni, professeur en intelligence artificielle, s’inquiètent de l’usage détourné de cette technologie pour influencer des élections.
Dans ce contexte, OpenAI travaille avec des experts pour tester Sora avant une éventuelle mise en service grand public. L’entreprise développe également des outils pour détecter les vidéos générées par Sora et assurer une traçabilité accrue.