توليد الفيديو بالذكاء الاصطناعي: سورا مقابل فيو 2

بقلم:   تامر كرم           |  Dec. 23, 2024

sora-veo

يُعتبر إنشاء مقاطع فيديو من خلال وصف نصي بسيط لها أحد أكثر تطبيقات الذكاء الاصطناعي إثارة، فهذا ينطوي على قدرة كبيرة على فهم النص وفهم فيزياء العالم الحقيقي لتوليد فيديو متسق.

وتعتبر شركتي غوغل و OpenAI أبرز لاعبين في هذا المجال، وقد أصدرتا مؤخراً خلال نفس الشهر نموذجين: هما Sora (سورا) من OpenAI و Veo 2 (فيو 2) من جوجل، وقد حظي كلا النموذجين باهتمام كبير لقدراتهما الرائعة. لكن أيهما أفضل؟

من حيث جودة الفيديو ودقته

يتفوق نموذج جوجل (Veo 2) على سورا إذ ينتج فيديوهات بدقة قدرها 4K، أي تبلغ 3840 × 2160 بكسل، وهذا أعلى بكثير من دقة فيديوهات (Sora)، والتي تبلغ 1080 بكسل فقط.

يدعم النموذجان مجموعة متنوعة من نسب عرض الفيديو، بما فيها: الشاشة العريضة (16:9)، والرأسية (9:16)، والمربعة (1:1).

تعتبر دقة سورا كافية للمحتوى الموجه لمنصات التواصل الاجتماعي، لكنه ليس كافياً للأفلام أو المحتوى الموجه للشاشات الكبيرة إذ ينقصه مزيد من الجودة في تقديم صورة أدق بتفاصيل أوضح.

من حيث مدة الفيديو واتساقه

ينتج فيو-2 (Veo 2) فيديوهات أطول تصل إلى دقيقتين، بينما مقاطع سورا (Sora) تصل إلى 20 ثانية فقط.

كما أن مقاطع فيو-2 أكثر اتساقاً وإبداعية، فهو يتمتع بفهم أوسع للفيزياء وكيفية تفاعل الأشياء مع بعضها في العالم الحقيقي، مما يجعل مقاطعه أكثر إقناعاً و قرباً للواقع.

كما يفهم فيو-2 لغة التصوير السينمائي، إذ يمكن للمستخدم توجيهه باستخدام مصطلحات سينمائية محددة، كتحديد نوع اللقطة ( لقطة قريبة، أو لقطة بعيدة، أو لقطة علوية)، وتحديد نوع العدسة المستخدمة (مثل عدسة قدرها 18 مم، أو عدسة قدرها 50 مم)، واقتراح تأثيرات سينمائية محددة.

فيديو يعرض بعض الأمثلة من النموذجين.

في النهاية يتمتع كلا النموذجين بنقاط قوة كبيرة. لكن من الواضح أن فيو-2 يتفوق على سورا في إنتاج فيديو أكثر واقعية وأعلى دقة وأطول مدة. لكن لاشيء يمنع أن تقلب سورا الموازين في إصدارها القادم.



مشاركة