روبوت غوغل ديب-مايند يتغلب على لاعبي تنس الطاولة غير المحترفين

بقلم:   تامر كرم           |  Aug. 9, 2024

deepmind-tennis

المباريات الرياضية بين الروبوتات والبشر ساحة قيمة لتقييم قدرات الروبوتات والمستوى الذي وصلوا إليه، فهي لاتقيم قدراته على القدرة على تنفيذ المهمة فقط كما الحال عندما يقوم روبوت بطي قطعة ملابس أو تحضير فنجان قهوة، بل أيضاً تقيم القدرة على تنفيذها بكفاءة وسرعة وإتقان بشكل مماثل أو يفوق مستوى البشر.

تنس الطاولة لعبة تختبر إمكانيات الروبوت من جوانب متعددة، فهي تختبر قدرة حساساته على التقاط أدق التفاصيل التي تحدث (كموقع الكرة في كل لحظة)، كما تختبر قدرة أنظمته الذكية على تحليل هذه المعلومات وفهم مستوى الخصم وتحديد الاستجابة المناسبة له في الزمن الحقيقي، ثم تختبر قدرة الروبوت الفيزيائية على الحركة والاستجابة السريعة لتأدية الحركة المحددة في اللحظة المناسبة. و أي خلل في عمل أحد هذه الأنظمة أو حتى تأخر زمني طفيف في عملها سيؤدي إلى فشل الروبوت وخسارته اللعبة.

نشرت غوغل ديب-مايند ورقة بحثية مع فيديوهات لروبوت يلعب تنس الطاولة بمستوى متوسط، فقد تمكن من الفوز في 13 مباراة من أصل 29. وقد لعب مع لاعبين من مستويات مختلفة وتغلب على كل اللاعبين المبتدئين (100% فوز) وعلى 55% من المتوسطين وخسر أمام كل اللاعبين المتقدمين (0% فوز).

ويعتمد الروبوت على سياسة هرمية، مكونة من مجموعة من المهارات منخفضة المستوى مثل الضربة الأمامية العلوية، أو استهداف الضربة الخلفية، أو الإرسال الأمامي.. ثم وحدة تحكم فوقها تقوم بفهم حالة اللعبة ومستوى اللاعب وماذا حدث سابقاً وتختار المهارة التي يجب أن ينفذها الروبوت، وهذه المهارة المختارة قد لاتكون الأمثلية لكنها هي الأفضل للروبوت بناءاً على قدراته الحركية ونسبة نجاحه في تنفيذها.

وقد تم تدريب الروبوت في محاكاة باستخدام التعلم المعزز، فبعد استخدام مجموعة من المباريات بين البشر كنقطة انطلاق، يتم تحسين النماذج من خلال تدريبه في المحاكاة، ثم يتم نقل الخبرة التي اكتسبها في المحاكاة للروبوت المادي، بعدها يقوم باللعب مع البشر لتحسين عمله والحصول على أمثلة إضافية لتحسين تدريبه من جديد عبر المحاكاة.

أثبتت نتائج المباريات مع البشر على تمكن الروبوت من اللعب بمستوى لاعب متوسط، وقد تمكن اللاعبون المحترفون من اكتشاف نقاط ضعفه بسرعه، فقد لاحظوا أنه لم يكن جيداً في التعامل مع الدوران السفلي. ويرجع هذا إلى صعوبة التعامل مع الكرات المنخفضة لتجنب الاصطدام بالطاولة وإلى صعوبة تحديد دوران الكرة في الوقت الفعلي.

بالاستفادة من هذه الملاحظات وغيرها، يمكن تحسين عمله باستمرار حتى يصل لمرحلة يمكن له أن ينافس اللاعبون المحترفون.



مشاركة