تصور أنك تريد أن تنشر صورة لرائد فضاء يركب حصان على سطح القمر وترفقه مع بوست لك على الفيسبوك. إن كنت تتقن تصميم الصور سيأخذ معك العمل ساعات وإن كنت لاتتقنه فما كان عليك إلا انتظار DALL.E 2 - دالي 2 ليرسمها لك.
مجرد أن تكتب وصفاً نصياً لما تريد أن ترسمه يقوم نظام الذكاء الاصطناعي دالي 2 برسم هذه الصورة خلال ثواني. فالصورة التي تراها في الأعلى مولدة من هذه النظام. ولنرى مثالاً آخراً فإن كتبنا: "صحن من الشوربة يبدو كبوابة للدخول لعالم آخر" سيولد دالي 2 الصورة التالية:
للوهلة الأولى قد نصاب بصدمة لقدرته الفائقة على التعبير عما نريده بطريقة فنية جميلة لكن في معظم الأحيان الصور الناتجة ليست مثالية وبمزيد من الفحص الدقيق ستلاحظ بعض التشوهات الغريبة لكنها غير واضحة بما يكفي لملاحظتها من الوهلة الأولى. لكن إن كان دالي 2 بهذه الكفاءة فلك أن تتصور دالي 10 كيف سيكون.
فكيف يعمل هذا النظام وكيف وصلنا إلى هنا؟
في أبريل-نيسان 2022 خرج نظام دالي 2 الذي يولد صور تبدو حقيقة من نص نكتبه. إنه من شركة OpenAI التي طورت نظام دالي1 قبل عام لكنه كان أقل دقة وأكثر بطئاً. فمن الواضح أن دالي 2 -واسمه مستوحى من الفنان سلفادور دالي- متطور بما فيه الكفاية ليفهم ماذا نكتب ثم يربط ما في النص من مسميات الأشياء بصور لها ثم يرتبها بطريقة تدل أنه يفهم أيضاً معنى الجملة كاملة. فهو يحتاج مكون لفهم اللغة ومكون آخر للرسم. ولذا يتضمن تقنيتين هما:
- شبكة فهم النص Clip
وهو عبارة عن شبكة تعلم عميق تولد تمثيلاً للنص ويتم تدريب هذه الشبكة على صور مرفقة بوصف نصي لها. وبعد عملية التدريب يصبح النظام قادر أن يولد تمثيلاً للنص يشابه تمثيل الصورة التي يصفها. لتأتي المرحلة الثانية التي تعتمد على هذا التمثيل.
- شبكة توليد الصورة Diffusion
وهي أيضا شبكة تعلم عميق تقوم بتوليد صورة من خلال التمثيل الذي حصلنا عليه في المرحلة الأولى. ويتم تدريبها على إنشاء صور معتمدة على النص. فتبدأ من إنشاء صور عشوائية ومع تدريب الشبكة بملايين الصور والنصوص المرافقة تتعلم أن تحول الصور العشوائية الى صور تعبر عن النص المعتمدة عليه.
بدمج هذين المكونين يصبح دالي 2 قادر على توليد صورة حقيقية من وصف نصي. فإذا كنت تريد تجربته بنفسك وتتوقف عن إهدار وقتك بصناعة صور لفيديوهاتك وبوستاتك فيؤسفنا إخبارك أنه في الوقت الحالي غير متاح إلا لعدد محدود من المستخدمين الذين اشتركوا في قائمة انتظار OpenAI. فالشركة تبدو حريصة على عدم إتاحته للجميع فقد قالوا أنه يمكن أن يتم استخدامه لإنتاج صور مزيفة عميقة، أو إطلاق حملات تضليل.
يمكنك زيارة دالي2 على موقع الشركة DALL.E 2