أعلنت ميتا عن مولد فيديوات جديد يمكنه تحويل النص إلى فيديو مع إضافة مؤثرات صوتية مناسبة، ويأتي هذا النموذج بعد عام حافل بمولدات الفيديو التي قدمتها شركات رائدة مثل OpenAI و RunWay و غوغل.
ويقوم النموذج الجديد المسمى Movie Gen (موفي جن) بتوليد فيديوات تبلغ مدتها 16 ثانية وبدقة عالية 1080 بيسكل وبنسب مختلفة، وقد عرضت عدة مقاطع فيديو تظهر قدرات النموذج على توليد فيديوات متناسقة.
كما يمكن له أن يقوم بتعديل فيديو بواسطة النص وإضافة مؤثرات صوتية عليه عبر كتابة وصف مناسب عنها، ويمكن أن يتم استخدام صورة وتحويلها لفيديو وجعلها تقوم بالأفعال الموصوفة.
وقالت ميتا أنها دربته على مجموعة من البيانات المرخصة والمتاحة للجمهور لكنها لم تحدد ماهي هذه المجموعة، وسط اتهامات متزايدة لشركات الذكاء الاصطناعي باستغلال أفلام وفيديوات عليها حقوق ملكية في تدريب نماذجهم.
وهذا النموذج غير متاح للاستخدام حالياً، فمازالت تكلفة توليد الفيديوات مرتفعة كما أنها تتطلب وقت طويل.