أطلقت Stability AI نموذج ذكاء اصطناعي توليدي جديد اسمه Stable Video 4D، يقوم بتحويل فيديو قصير إلى 8 فيديوات كل منها ينظر إلى المشهد من زاوية مختلفة.
يأخذ النموذج حالياً فيديو من بضع ثواني لغرض واحد فقط مثل سمكة ويقوم بتوليد 8 مقاطع فيديو لها من 8 زوايا مختلفة.
النموذج متاح للتجريب والتقييم بغرض البحث والتطوير على منصة Hugging Face ولم تعلن الشركة عن خطة لإطلاقه تجارياً.
يتميز النموذج بتصميم جديد لآلية الانتباه، فعند توليد كل إطار يأخذ بالاعتبار كل الإطارات المجاورة وفي كل الزوايا، مما يجعل الإطارات المولدة أكثر انسجاماً واتساقاً من حيث الشكل وانسيابية الحركة.
رغم أن اسمه 4D لكنه يولد فيديوات ديناميكية ثلاثية الأبعاد، ويأتي الاسم لتمييزه عن النموذج السابق Stable Video 3D الذي يحول صورة أو نص إلى فيديو ثلاثي الأبعاد، ويتميز رباعي الأبعاد هذا بأنه يولد فيديوات ديناميكية من زوايا مختلفة فقد أضاف مكان الكاميرا إلى اعتباره وليس فقط الشكل والمظهر ثلاثي الأبعاد.
يمكن لهذا النموذج أن يستخدم في صناعة الأفلام لإضافة تأثيرات بصرية، كما يمكن أن يستخدمه مطوري الألعاب لعرض الأغراض من زوايا مختلفة ويمكن أن يفيد في إنشاء العوالم الافتراضية.
تعمل الشركة على زيادة فعالية النموذج لتوليد مقاطع فيديو أطول وتحتوي مشاهد أكثر تعقيداً من غرض واحد.