يحاول التعلم الآلي جعل برامج الكمبيوتر تتعلم من البيانات من تلقاء نفسها. ففي البرمجة التقليدية إذا كنا نريد أن نصنع برنامجاً يصنف الصور إنْ كانت صور قطط أمْ صور كلاب؛ سنقوم بكتابة توصيف لشكل الكلب وآخر لشكل القطة؛ ثم إذا وجد البرنامج أحد التوصيفين في الصورة يصنفها حسب القواعد التي كتبناها له.لكن تخيل كم من الصعب أن تصف كيف سيكون شكل قطة والقطط أنواع متعددة و أشكالها وأحجامها و أوضاعها المختلفة تجعل كتابة توصيف دقيق لها أمر مستحيل لا يمكننا القيام به.
لذا كان لابد من اختراع التعلم الآلي لنُوكِل مهمة اكتشاف توصيفات القطط والكلاب في المثال السابق للخوارزميات؛ التي تقوم بتدريب نموذج على بيانات هي عبارة عن صور مع أصنافها التي تشير إن كانت قطة أمْ كلب. يقوم النموذج بالتعلم من البيانات المتاحة ويبني قواعد ليُميز بين صور الكلاب والقطط. وبهذا تتعلم الآلة كيف تميز الصور دون أن نتدخل و ننهك أنفسنا في وضع توصيفات لأشكال القطط والكلاب.
وهناك ثلاثة أنواع رئيسية للتعلم الآلي:
1- التعلم الخاضع للإشراف Supervised
في هذا النوع من التعلم الآلي نأتي بالبيانات مع تصنيفاتها أو علاماتها التي نريد التنبؤ بها. فإذا أردنا التنبوء إن كانت الصور لكلاب أو لقطط نأتي بصور موسومة بهذين الصنفين. ثم نقدم الصور مع علاماتها لخوارزمية التعلم الآلي التي تحاول من خلال ما لديها من بيانات موسومة إيجاد علاقة بين الصور وعلاماتها. وبعدها يمكن استخدام هذا النموذج للتنبؤ بأصناف الصور الجديدة.
يمكن التمييز هنا بين نوعين من التعلم الخاضع للإشراف. التصنيف Classification كما في الحالة السابقة فالنموذج يتنبأ بمخرجات هي أصناف. والانحدار Regression وهنا النموذج يتنبأ بمخرجات عددية مثل درجة الحرارة أو سعر سهم شركة أو سعر عقار.
ومن أشهر خوارزميات هذا النوع SVM و الشبكات العصبونية و Logistic & Linear Regression.
2- التعلم غير الخاضع للإشراف UnSupervised
وهنا يكون لدينا بيانات غير موسومة بعلامات أو أصناف. ففي المثال السابق يكون لدينا فقط صور فيها كلاب وقطط. وتقوم الخوارزمية الغير خاضعة للإشراف بمحاولة تجميع الصور المتشابهة في أصناف منفردة؛ فقد ينتج مثلا من نفس البيانات 4 أصناف وإذا لاحظنا هذه الأصناف فقد نجد أن هناك صنف يحوي صور القطط والكلاب في الشارع فوجه الشبه هو وجودها في الشارع؛ وصنف ثاني يحوي صور الكلاب في البحر ؛ وصنف ثالث يحوي صور كلاب منزلية أليفة؛ ورابع للقطط التي تشرب الماء. ففي هذه الحالة نحن لا نعرف ماهي المخرجات لكن بملاحظة النتائج يمكن أن نخرج بتوصيف لكل صنف. ويفيد هذا في تقليل حجم البيانات وإيجاد أوجه الشبه التي قد لا نتصور وجودها؛ فتساعدنا الخوارزميات على فهم البيانات وأوجه التشابه المخفية فيها.
ومن أشهر خوارزميات هذا النوع خوارزمية التجميع K-means ونموذج المواضيع LDA.
3- التعلم المعزز Reinforcement
وهنا ليس لدينا بيانات. لدينا فقط برنامج يعمل كوكيل يتعامل مع البيئة المحيطة به لتحقيق هدف محدد؛ تقوم خوارزمية التعلم المعزز بمكافأة الوكيل إذا قام بفعل جيد يساهم في تحقيق الهدف ومعاقبته إذا قام بفعل سيء يبعده عن تحقيق الهدف. ومع التجربة والتكرار يتعلم الوكيل ما هو الإجراء الأفضل الذي عليه اتخاذه في كل مرحلة بغية الحصول على أكبر قدر من المكافآت.
فتخيل مثلا لعبة الشطرنج؛ هنا يتم مكافأة الوكيل على كل خطوة قام بها أدت إلى الربح ويُعاقَب على كل خطوة أدت للخسارة. و بتكرار اللعب عشرات آلاف المرات يتمكن البرنامج من تعلم إجراء الحركات التي تؤدي إلى الربح مهما كانت الحالة. ومن أشهر خوارزميات هذا النوع Q-learning .
هناك العديد من طرق التعلم الأخرى التي تستخدم مزيج من الطرق السابقة كالتعلم شبه الخاضع للإشراف؛ و تعلم التمثيل الذي يهدف لتعلم تمثيل أكثر غنى للبيانات؛ والتعلم الفعال الذي هو نوع من التعلم الخاضع للإشراف. ستكون هذه المواضيع محور مقالات أخرى.