منصة "بلاك ويل" من إنفيديا تستهل عصر مصانع الذكاء الاصطناعي

بقلم:   تامر كرم           |  March 20, 2024

b200

إنفيديا التي تجاوزت قيمتها السوقية 2 تريليون دولار مؤخراً بفضل شرائح الذكاء الاصطناعي التي تطورها ولاسيما شريحة H100. تستمر بالتفوق على نفسها إذ قدمت في مؤتمر GTC 2024 معمارية وحدة معالجة جديدة مُحسّنة للذكاء الاصطناعي، والتي سُميت بلاك ويل Blackwell تكريماً لعالم الرياضيات ديفيد بلاكويل. وهي خليفة معمارية هوبر Hopper، التي تم إطلاقها في عام 2022 وتعتمد عليها شريحة H100.

وأكدت الشركة أن بلاك ويل ليس شريحة فقط بل منصة إذ قال رئيس الشركة جونسون هوانغ: "إن بلاك ويل ليست شريحة، بل هي اسم منصة". "إن هوبر Hopper رائعة، ولكننا بحاجة إلى وحدة معالجة رسومية أكبر."

1- الشريحة الأكبر والأكثر فعالية B200

لم ينجح المنافسون بالإطاحة بشريحة H100 فقررت إنفيديا أن تقوم بذلك بنفسها. B200 ليست شريحة واحدة بل هي تجميع لشريحتين تشكلان معاً وحدة معالجة رسومية واحدة؛ ترتبطان باتصال فائق السرعة NV-HBI تصل إلى 10 تيرابايت في الثانية مما يجعلهما تعملان تماماً كشريحة واحدة وبهذا الدمج تتخطى إنفيديا الحدود الحالية لتصنيع شريحة كبيرة واحدة.

b200

قامت الشركة التايوانية TSMC يتصنيع B200 بدقة 4NP مخصصة لانفيديا. تحتوي على إجمالي 208 مليار ترانزستور ، وهو ما يزيد 2.5 مرة عن H100 ( لكن باعتبار أنها مكونة من شريحتين فكل واحدة تحتوي 104 بزيادة حوالي 25% عن H100 التي تحتوي 80 مليار ترانزستور ). وتستخدم 192 جيجابايت من ذاكرة HBM3E (بعرض نطاق ترددي 8 تيرابايت/ثانية). كل هذا يسمح لها بأن تكون أسرع 2.5 مرة في دقة FP8 ( 20 بيتافلوب من قوة الحوسبة)، وأسرع 5 مرات عند استخدام دقة أقل FP4 حيث تصل قوتها إلى 40 بيتافلوب.

2- الشريحة الفائقة GB200

كشفت Nvidia النقاب عن تصميم للرقاقة الفائقة GB200. يجمع هذا التصميم بين وحدتي معالجة الرسومات B200 ووحدة المعالجة المركزية Grace. تعمل تقنية NVLink-C2C على ربط وحدات معالجة الرسومات هذه مع وحدة المعالجة المركزية بنطاق ترددي عالٍ يصل إلى 900 جيجابايت/ثانية، بينما يستخدم النظام 384 جيجابايت من ذاكرة HBM3E.

والنتيجة هي أن شريحة Grace Blackwell GB200، الموضح أدناه، يتمتع بقوة حسابية تبلغ 40 بيتافلوب وذاكرة سريعة تبلغ 846 جيجابايت. يوفر هذا التصميم أداءً فائقًا، خاصة في عملية الاستدلال لنماذج اللغات الكبيرة مثل ChatGPT. بالمقارنة مع شريحة H100، توفر شريحة B200 في GB200 تسريعاً بمعدل 30 ضعف في الاستدلال وتسريعاً بمعدل 4 أضعاف في التدريب، كل ذلك مع تحقيق انخفاض كبير في استهلاك الطاقة - أقل بما يصل إلى 25 مرة.

gb200

3- الكمبيوتر الفائق DGX GB200 NVL72

للتعامل مع مهام الذكاء الاصطناعي المعقدة تقوم إنفيديا بدمج Grace Blackwell Superchips (GB200) في أنظمة أكبر مثل DGX GB200 NVL72. يحتوي هذا الكمبيوتر الفائق على 36 وحدة معالجة مركزية Grace و72 وحدة معالجة رسوميات B200 في حامل واحد مبرد بالسوائل. يحتوي كل درج داخل الحامل إما على شريحتي GB200 أو محولي NVLink، حيث 18 درج يحتوي على شرائح GB200 و9 مجهزة بمحولات NVLink.

SuperComputer: DGX GB200 NVL72

يتميز نظام GB200 NVL72 بأداء تدريبي يصل إلى 720 بيتافلوب و1.4 إكسافلوب لأداء الاستدلال. يضم ما يقرب من ميلين من الكابلات، ويحتوي على 5000 كابل فردي. يحتوي على ذاكرة تبلغ 30 تيرابايت ويعمل كوحدة معالجة رسومات عملاقة لتشغيل وتدريب نماذج الذكاء الاصطناعي التي تحتوي على تريليونات من المعلمات. بينما تزعم الشائعات أن GPT-4 يحتوي على 1.76 تريليون معلمة، يمكن لـ GB200 NVL72 دعم النماذج التي تحتوي على 27 تريليون معلمة.

4- مجموعة كمبيوترات فائقة DGX Superpod

ثمانية من هذه الحواسيب العملاقة تتجمع معا لإنشاء آلة عملاقة تُعرف باسم DGX Superpod. كما هو موضح في الصورة، يتم تبريد هذه الـ Superpods بالسوائل وتحتوي على 576 وحدة معالجة رسوميات و288 وحدة معالجة مركزية و240 تيرابايت من الذاكرة.

هذا يوفر قوة أداء مشتركة تبلغ 11.5 إكسافلوب في FP4، مما يجعلها مثالية للتعامل مع مهام الذكاء الاصطناعي الضخمة.

dgx superpod

5- مصانع الذكاء الاصطناعي

يمكن أن تصل أنظمة إنفيديا إلى عشرات الآلاف من شرائح GB200 الفائقة المتصلة معاً بشبكات عالية السرعة. وتشكل هذه الأنظمة الضخمة كما يحب جونسون هوانغ أن يسميها "مصانع الذكاء الاصطناعي" وليس مراكز بيانات.

ويرى هوانغ أن ما يحدث في هذه المصانع حدث في الثورة الصناعية السابقة إذ كان يدخل الماء للمولدات ليخرج منها الكهرباء. والآن في الثورة الصناعية الجديدة يدخل إلى هذه المصانع البيانات والكهرباء ويخرج منها رموز هذه الرموز عالية القيمة. إذ يمكن أن تكون نصوص أو صور أو أوامر لتحريك روبوت أو قيادة سيارة الخ.

ai_factory

وعرضت انفيديا في مؤتمر GTC 2024 محاكاة لبناء مصنع ذكاء اصطناعي يحتوي على 32 ألف شريحة فائقة GB200 بقوة حسابية تصل 645 إكسافلوب وذاكرة سريعة 13 بيتابايت. وهذه لم تكن محاكاة فقط بل توأم رقمي لأول مركز بيانات تبنيه الشركة لصالح خدمة الحوسبة السحابية في أمازون.

أكثر من 40 شركة بدأت تستعد لكي تقوم بالاستفادة من منصة بلاك ويل لحوسبة الذكاء الاصطناعي وكل مزودات خدمة الحوسبة السحابية من أمازون وغوغل ومايكروسوفت وأوراكل تخطط لتقديم وحدات المعالجة GB200 في خدماتها.



مشاركة