Le nouveau modèle de vidéo basé sur l’intelligence artificielle de Google présente une compréhension des lois de la physique nettement améliorée.
Tl;dr
- Google lance une nouvelle version de son outil vidéo Veo 2.
- Veo 2 comprend mieux la physique réelle et le mouvement humain.
- Google améliore également son modèle de texte-en-image Imagen 3.
Google présente Veo 2 et une amélioration d’Imagen 3
L’entreprise technologique de renom, Google, a récemment commencé à déployer son IA générative Veo auprès de ses clients professionnels. Aujourd’hui, Google ne perd pas de temps et présente une nouvelle version de son outil vidéo, Veo 2, aux premiers testeurs.
Comprendre le langage de la cinématographie
Selon Google, Veo 2 « comprend le langage de la cinématographie ». En pratique, cela signifie que vous pouvez faire référence à un genre de film spécifique, un effet cinématographique ou une lentille lors de la sollicitation du modèle.
Une meilleure compréhension de la physique et du mouvement humain
De plus, Google affirme que ce nouveau modèle a une meilleure compréhension des lois physiques du monde réel et du mouvement humain. La modélisation correcte des humains en mouvement est un défi pour tous les modèles génératifs. De ce fait, l’affirmation de Google selon laquelle Veo 2 est plus performant face à ces deux défis est notable. Cependant, les échantillons fournis par l’entreprise ne sont pas suffisants pour tirer des conclusions définitives ; le véritable test des capacités de Veo 2 viendra lorsqu’on lui demandera de générer une vidéo d’une routine de gymnaste.
Améliorations parallèles d’Imagen 3
Par ailleurs, Google déploie simultanément des améliorations à Imagen 3, son modèle de texte-en-image. L’entreprise affirme que la dernière version génère des images plus lumineuses et mieux composées. De plus, elle peut reproduire une plus grande diversité de styles artistiques avec une plus grande précision. En même temps, elle est également plus efficace pour suivre les sollicitations de manière plus fidèle.
Ces avancées technologiques de Google s’inscrivent dans le cadre de sa volonté constante d’améliorer ses modèles d’IA et de proposer des outils toujours plus performants à ses utilisateurs. Le déploiement progressif de Veo 2 aux utilisateurs de Google Labs aux États-Unis et les améliorations apportées à Imagen 3, disponibles dans plus de 100 pays, en sont des exemples concrets.
Source link