HIGH TECHJeuxJEUX VIDEOTECH & NETWEB

Découvrez Mochi-1, le dernier modèle de vidéo IA gratuit et open-source

Découvrez Mochi-1, le dernier modèle de vidéo IA gratuit et open-source.

Tl;dr

  • Genmo lance son modèle de génération vidéo Mochi-1.
  • Mochi-1 est un modèle open-source avec une licence Apache 2.0.
  • Le modèle se distingue par son attention à la motion et l’adhésion aux instructions.

Genmo dévoile Mochi-1, son modèle de génération vidéo

Dans une ère où l’IA générative est en pleine effervescence, Genmo fait une entrée remarquée avec son modèle de génération vidéo, baptisé Mochi-1. Cette entreprise innovante apporte une approche différente sur le champ de bataille de la vidéo générative.

Un modèle open-source sous licence Apache 2.0

Le modèle Mochi-1 est présenté comme une « prévisualisation de recherche ». Le grand avantage de ce modèle est qu’il est sous licence Apache 2.0, ce qui le rend open-source. Cela signifie qu’il est libre d’accès, peut être démonté et remonté à volonté. L’aspect open-source de Mochi-1 permettra également sa disponibilité sur toutes les plateformes d’IA générative habituelles à l’avenir. Il pourrait même être exécuté un jour sur un bon PC de jeu.

Une attention particulière portée à la motion

Pourquoi préférer le modèle de Genmo à d’autres actuellement disponibles sur le marché ? La réponse est simple : la motion. Paras Jain, PDG de Genmo, explique que la motion est un indicateur clé lors de l’évaluation des modèles. « Je pense que pendant très longtemps, la seule vidéo inintéressante est celle qui ne bouge pas. Et j’avais l’impression que beaucoup de vidéos d’IA souffraient de cet ‘effet photo en direct’ », explique-t-il. « Je pense que nos modèles historiques avaient cela, c’était ainsi que la technologie devait évoluer. Mais les vidéos sur la motion étaient l’investissement le plus important que nous avons fait, avant tout. »

Un modèle optimisé pour une meilleure compréhension de la physique

Cette première version est un modèle de diffusion de transformateur de 10 milliards de paramètres qui utilise une nouvelle approche asynchrone pour offrir plus de puissance dans un petit format. Jain a déclaré qu’ils ont formé Mochi-1 exclusivement sur la vidéo, plutôt que sur l’approche mixte vidéo, image et texte plus traditionnelle. Cela lui a donné une meilleure compréhension de la physique.

Genmo espère que Mochi-1 peut offrir la meilleure génération de vidéos open-source de sa catégorie. Actuellement, les vidéos sont limitées à 480p dans le cadre de la nouvelle prévisualisation de recherche lancée aujourd’hui. Genmo a également mis l’accent sur l’adhérence aux instructions et la reconnaissance.


Source link

Afficher plus

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page

Adblock détecté

S'il vous plaît envisager de nous soutenir en désactivant votre bloqueur de publicité