ماهي البيانات الضخمة Big Data وكيف تستخدمها الشركات

بقلم:   تامر كرم           |  May 26, 2022

Big Data

تنتج البشرية في كل ثانية كميات ضخمة من البيانات, بعضها عبارة عن محتوى كالذي نكتبه على الفيسبوك أو الفيديوهات على اليوتيوب أو المقالات, وجزء كبير منها يتولد من خلال تفاعلنا مع العالم الرقمي وكل مانقوم به من تصفح ومشاهدات وكل ما تنتجه الرادارات والأجهزة الرقمية في هذا العالم.

لكن يبقى السؤال المحير: إذا كان لديك نظام لتخزين ومعالجة البيانات متى تُسمى بياناتك بيانات ضخمة؟

البيانات الضخمة هي ليست فقط كميات كبيرة من البيانات بل أيضاً لابد أنها تحتاج للمعالجة بسرعة أكبر من قدرة جهاز حاسوبي واحد. فلو كان لديك كميات كبيرة من المعطيات ولاتريد معالجتها كأن تخزن آلاف الساعات من التصوير دون أن تحتاج معالجته, فعلى الأغلب بياناتك ستكون كبيرة جداً ولكنها ليست ضخمة لأن الضخامة تشير أكثر إلى الحاجة إلى تقنيات لمعالجتها لا تكفي لها التقنيات العادية.

غالباً ماتكون هذه التقنيات موزعة أي تستخدم أكثر من جهاز حاسوبي لمعالجة وتخزين البيانات الضخمة وتم تطوير العديد من التقنبات منذ عام 2000 مثل Hadoop ثم Spark لاحقاً.

وللبيانات الضخمة أهمية كبيرة فهي تساعد الشركات والمدراء على اتخاذ القرارات التي تضمن نجاح أعمالهم وشركاتهم. فمثلا يوتيوب ونتفليكس تعالج الكميات الضخمة من البيانات التي تأتيها عن سلوك المستخدمين على منصاتها في كل لحظة كي تتنبأ بالفيديوهات والأفلام التي تناسب كل مستخدم فتقدمها له كاقتراحات.

و فيسبوك يقوم بتحليل بيانات المستخدمين ليعرض لهم الاعلانات التي يمكن أن تنال اهتمامهم وبالتالي يتجنب عرض الاعلانات العشوائية كما تفعل شاشات التلفزة ويعرض لكل شخص مايناسبه. وهذا ما أدى إلى النجاح الكبير في جذب المعلنين إلى منصاته.

فالبيانات الضخمة أساسية في عمل شركات اليوم, وكل شركة لا تستفيد من بيانتها مصيرها حتماً الفشل. وجوهر البيانات الضخمة هو معالجتها للاستفادة منها في الحصول على أفكار ورؤى تساعدنا في اتخاذ القرارات التي تسهم في تطوير الأعمال والشركات.

واليوم تعتبر تقنيات التعلم العميق والذكاء الاصطناعي حجراً أساسياً في معالجة البيانات الضخمة فكل نظم الافتراحات وخورازميات فيسبوك وغوغل وأمازون ونتفلكس تعتمد على التعلم العميق لتحقيق أكبر استفادة من البيانات التي تملكها.

ويبقى السؤال ماذا عن الشركات الناشئة التي لا تمتلك هذه البيانات وكيف ستنجح في تطوير أعمالها في عالم يعتمد فيه صحة القرار على البيانات الضخمة.



مشاركة