Meta dévoile le générateur AI de texte à vidéo “Make-A-Video” : Tous les détails

Meta a dévoilé un nouveau système d’intelligence artificielle appelé “Make-A-Video” qui permettra aux utilisateurs de générer de courts clips vidéo en entrant une description textuelle de la scène souhaitée. L’annonce fait suite aux récentes avancées de la société dans la recherche sur la technologie générative, qui vise à donner aux créateurs un contrôle plus créatif sur la génération d’images artificiellement intelligentes. Avec cette annonce, Meta a poussé la technologie un peu plus loin en incluant des capacités de génération de texte-vidéo en plus du texte-image. Cependant, la société n’a pas encore donné accès aux utilisateurs pour le modèle.

Les vidéos générées par les invites sont d’une durée de cinq secondes ou moins et ne contiennent pas de son. Cependant, Meta affirme qu’une large gamme d’invites est prise en charge par le modèle.

Meta, tout en faisant l’annonce par le biais d’un billet de blog, a déclaré que, dans un engagement de “science ouverte”, il partagera les détails de la recherche derrière la dernière technologie générative d’intelligence artificielle, tout en confirmant également ses plans de publier une expérience de démonstration pour les utilisateurs.

La recherche sur l’intelligence artificielle générative fait avancer l’expression créative en donnant aux gens des outils pour créer rapidement et facilement du nouveau contenu”, a déclaré Meta dans un billet de blog annonçant le travail. “Avec seulement quelques mots ou lignes de texte, Make-A-Video peut donner vie à l’imagination et créer des vidéos uniques en leur genre, pleines de couleurs vives et de paysages”, a ajouté la société mère de Facebook et Instagram.

Dans le document de recherche décrivant le modèle à l’œuvre, la société note que le modèle de démonstration “Make-A-Video” utilise des paires d’images, de légendes et de séquences vidéo non étiquetées provenant des ensembles de données WebVid-10M et HD-VILA-100M, qui comprennent des séquences vidéo de stock créées par des sites comme Shutterstock et extraites du Web, et qui couvrent ensemble des centaines de milliers d’heures de séquences.

Mark Zuckerberg, PDG de Meta, s’est rendu sur Facebook pour décrire ce travail comme un “progrès incroyable”, tout en ajoutant qu'”il est beaucoup plus difficile de générer des vidéos que des photos, car au-delà de la génération correcte de chaque pixel, le système doit également prédire comment ils vont changer au fil du temps.”

Cependant, des questions préoccupantes ont été soulevées autour des médias générateurs d’IA, certains suggérant qu’ils pourraient conduire à une augmentation de la désinformation, de la propagande et de la pornographie non consensuelle, comme on l’a vu dans le cas des systèmes générateurs d’images d’IA et des deepfakes, selon un rapport du Washington Post. Meta affirme vouloir être “réfléchi” quant à la manière de construire ces modèles génératifs et prévoit donc d’en limiter l’accès. Cependant, le calendrier de l’expérience de démonstration et la clarté sur la façon dont l’accès serait limité ne sont pas encore connus.


Des liens d’affiliation peuvent être générés automatiquement – voir notre déclaration d’éthique pour plus de détails.
Related Posts