في يوم واحد: جوجل تطلق جيميناي 1.5 و OpenAI تطلق Sora

بقلم:   جاد طرابيشي           |  Feb. 16, 2024

sora_gemini

أعلنت جوجل عن تطوير جديد لنموذج الذكاء الاصطناعي جيميناي Gemini وأصدرت النسخة 1.5 منه بعد النسخة 1.0 وتشمل تحسينات كبيرة في الأداء والسرعة وكذلك في حجم السياق الذي يمكنه معالجته؛ الأمر الذي جعله لأول مرة يبدو تهديداً حقيقيا لريادة ChatGPT.

لم تلتزم OpenAI الصمت ولم يقم سام ألتمان بصناعة فيديو من أربع دقائق ليقول أن ChatGPT يبقى الأفضل كما فعل زوكربيرغ مع فيجن برو؛ لكن بعدها مباشرة أعلنت OpenAI عن نموذج جديد متميز لتوليد الفيديو من وصف نصي؛ الذي خفف من أثر جيميناي 1.5 وبيَّن أن OpenAI مازالت الشركة الرائدة والسباقة في مجال الذكاء الاصطناعي.

يمكن لجيميناي 1.5 معالجة كميات هائلة من المعلومات دفعة واحدة - بما في ذلك -11 ساعة من الصوت، و أكثر من 700,000 كلمة؛ و ساعة واحدة من الفيديو، ثم يمكن سؤاله أي سؤال عما عالجه كأن نطلب منه إيجاد مقطع من الفيديو الذي يتكلم عن موضوع معين أو الذي يعبر عن فكرة معينة نقوم برسم تخطيطي بسيط لها.

وبينت نتائج الاختبارات -التي نشرت فيها غوغل شرحاً تفصيلياً- أن الإصدار Gemini Pro 1.5 يعادل بقوته الإصدار Ultra 1.0 والذي كان أفضل نموذج قدمته جوجل حتى الآن.

ماذا عن Sora؟

أما ردة فعل OpenAI فكانت إطلاق نموذجها الجديد لتحويل النص إلى فيديو وسمته Sora (سورا وتعني سماء باليابانية)؛ و الذي يمتلك القدرة على توليد مقطع فيديو مليء بالتفاصيل والواقعية تصل مدته كحد أقصى إلى 60 ثانية وبدقة عالية الجودة FHD.

عرضت الشركة فيديوهات مختارة بعناية توضح فيها نتائج النموذج الذي يبدو أنه يتفوق فيها على كل ما شاهدناه سابقاً ربما باستثناء نموذج Gen-2 من شركة RunWay.

يتميز النموذج بتوليد مقاطع فيديو منسجمة و تعبر مباشرة عن النص وتحتوي عدة شخصيات يمكن تحريكها باتجاهات مختلفة مع مراعاة تموضع الأشياء في الفيديو بطريقة منطقية؛ أي أن للنموذج بعض الفهم لفيزياء حركة الأشياء في العالم المادي.

لكن رغم ذلك تقر الشركة بأن Sora قد لايعطي دائماً نتائج كما هو متوقع منه و يرتكب حماقات غريبة في بعض الأحيان وتبين بعض الأمثلة على ذلك: كأن ينفخ شخص على شمعة لا تنطفئ أو يقضم قطعة حلوى فلا تظهر آثار القضم.

يبدو أن سنة 2024 ستكون سنة مثيرة للذكاء الاصطناعي؛ فحتى الآن وفي يوم واحد تم إصدار أفضل نموذج لغوي و أفضل نموذج توليد فيديو. فماذا بعد؟



مشاركة