يعتبر مصطلح “البيانات الضخمة” أو Big Data من أكثر المصطلحات استخداما اليوم لتسويق الخدمات والمنتجات التقنية. لقد أصبح هذا المصطلح جزء أساسي من أي خطاب في أي مؤتمر تقني أو إعلان لأي شركة. حتى لقد أفقد تكراره المعنى ولم نعد نعرف تماما ما هو المقصود بالبيانات الضخمة على وجه الدقة.
البيانات الضخمة وتحليل البيانات؟
البيانات الضخمة ليست علما حديثا فتحليل البيانات واستخراج المعرفة الكامنة فيها كان دائما الشغل الشاغل لكل الأعمال. فلقد كانت أنظمة ذكاء الأعمال Business Intelligence أحد أهم منابع المعرفة في مؤسسات الأعمال خلال العقدين الأخيرين حيث أنها ساهمت بشكل كبير في اتخاذ القرارات والتنبؤ بالأحداث وذلك بالاعتماد على تحليل العمليات التي تتم داخل منشأة الأعمال من بيع وشراء ونحوه وعلى مدى فترة زمنية طويلة نسبيا. فطريقة اتخاذ القرار على اختلاف انواعه في أي شركة تعتمد بشكل أساسي على معلومات مجمعة يتم التعامل معها (معالجتها) لنصل الى ناتج وهو القرار وعلى ذلك فإن عدم وجود المعلومات الكافية، الدقيقة والصحيحة قد تؤدي الى قرارات إن لم تكن فاشلة فإنها قد تكون اشبه بالعشوائية الغير مضمونة النتائج.
لكن تختلف تقنيات البيانات الضخمة عن ذكاء الأعمال بأن البيانات الضخمة تتعامل مع مصادر مختلفة وحجم أكبر من البيانات المنظمة وغير المنظمة والموزعة على أجهزة كثيرة عبر الإنترنت وليست محصورة بعدد محدد من الأنظمة وقواعد البيانات الموجودة في مكان واحد كما هو الحال في منشآت الأعمال. لكنها في ذات الوقت تستخدم ذات الأساليب التحليلية المعروفة في مجال ذكاء الأعمال ومستودعات البيانات، وعمليات التنقيب عن البيانات كالشبكات العصبية والخوارزميات والذكاء الاصطناعي والمنطق الغامض Fuzzy Logic والاستدلال الاستقرائي وأساليب التجميع Clustering وغيرها من الأساليب.
البيانات الضخمة هي عبارة عن مصطلح يستخدم لحزم البيانات الضخمة جداً والمعقدة لدرجة أنه يُصبح من الصعب معالجتها باستخدام أداة واحدة فقط من أدوات إدارة قواعد البيانات أو باستخدام تطبيقات معالجة البيانات التقليدية. حيث تشمل التحديات المرافقة لها تحديثات الحصول عليها، ومدتها، وعمليات التخزين، والبحث، والمشاركة، والنقل، والتحليل والعرض. يشير المصطلح عادة لاستخدام أساليب التحليلات التنبؤية وتحليل سلوك المستخدم أو أي تحليلات متقدمة للبيانات التي تساعد على استخراج قيمة ما من البيانات تساعد على اتخاذ القرارات أكثر دقة.
وتتكون الأدوات التي تتعامل مع البيانات الضخمة من ثلاثة أجزاء رئيسية وهي
- أدوات التنقيب عن البيانات Data mining والتي عادة تعمل على اكتشاف البيانات سواء المهيكلة (كحركات المستخدمين) أو غير المهيكلة (كالنصوص والصور) والتي تكون موزعة على أجهزة مختلفة عبر الويب. حيث تعمل أدوات برمجية على استخراج تلك البيانات ووضعها بشكل مناسب ليتم التعامل معها فيما بعد.
- أدوات التحليل Data Analysis التي تعمل على تحليل البيانات التي تم اكتشافها من خلال استخدام المقارنة والتصنيف والمقاربة والربط وغيرها من الأدوات التحليلية والتنظيمية وذلك بهدف الخروج بالنتائج المطلوبة والتي تم تحديد أهدافها مسبقا.
- أدوات عرض النتائج Dashboard والتي تعرض بشكل مرئي ورسومي وأني النتائج النهائية للتحليل وفقا لما تم تحديده كهدف للتحليل مسبقا.
البيانات الضخمة….لماذا؟
لقد أدى تضخم البيانات بشكل كبير خلال السنوات الماضية الى تطور علم البيانات أو البيانات الضخمة. فكل حركة تقوم بها على شبكة الإنترنت هي جزء من هذه البيانات وكل معلومة تضاف أو فيديو يتم رفعه أو تغريدة يتم إرسالها أو حالة يتم تغيرها في وسائل التواصل الاجتماعي هي في النهاية تصب في ذلك المستودع الضخم من البيانات التي يتم فحصها وتحليلها للاستفادة منها لأغراض التسويق أو التطوير أو معالجة الأمراض أو تحسين التعليم أو توفير الرفاهية وهكذا. يشارك في صنع هذا المستودع الضخم من البيانات جميع شركات الاتصالات والحكومات ومنصات التواصل الاجتماعي ومحركات البحث ومستعرضات الإنترنت وتطبيقات الموبايل ومواقع التجارة الإلكترونية ومزودي الخدمات التعليمية والصحية وموفري خدمات الدفع بمختلف أشكالها.
فمن خلال حركاتك عبر وسائل التواصل الاجتماعي مثلا فإن الفيسبوك يعلم عنك أكثر مما تعلم أنت عن نفسك. حيث يمكن من خلال تحليل تحركاتك وما تقرأه أو تكتبه أو تشاهده أن يعرف ما تحب وما تكره ومتى تنام ومتى تصحو من النوم فيوجه لك الإعلانات التي تتناسب مع تلك الميول والرغبات والسلوكيات. وهكذا الحال مع متصفح الإنترنت حيث يعلم من خلال تحليل زياراتك للمواقع الإلكترونية ما الذي يثير اهتمامك أو يعجبك فيقدمه لك كمقترح عبر الإعلانات.
كيف يمكن استخدام البيانات الضخمة؟
لا يمكن حصر استخدامات البيانات الضخمة اليوم فالكل قادر على الاستفادة منها بشكل أو بأخر سواء الشركات أو الأفراد أو الهيئات والمنظمات الحكومية أو شبه الحكومية. فالكل قادر اليوم على قراءة ودراسة البيانات وتحليلها ولو بشكل مبسط ليتمكن وفقا لها من اتخاذ قرارات مختلفة حسب الحاجة. محلل جوجل والتحليلات التي تأتي من منصات التواصل مثال واضح لذلك فهي أدوات متاحة للجميع وبالتالي لم تعد العملية حكرا على أحد.
لقد أصبح بإمكان الشركات والمؤسسات والهيئات اليوم على اختلاف أنواعها تحليل حركات العملاء من شراء وبيع ونحوه بدقة أكبر ليتمكنوا وفقا لذلك من معرفة السلع الأكثر طلبا أو تلك الراكدة ويقترحوا على عملائهم سلع معينة وفقا لعمليات الشراء التي تتم. كما أصبح لديهم القدرة على فهم سلوك العملاء بشكل أكثر دقة وتحديد المميزين منهم ومن هم بحاجة لمساعدة أو لتحديد توجهاتهم أو مراقبة أدائهم. هذا الأمر ليس فقط لمراكز البيع التقليدية بل يشمل الأن أيضا المتاجر الإلكترونية على شبكة الإنترنت وعلى نطاق أوسع.
ولم يعد الأمر أيضا محصورا بالبيانات القادمة من عملاء الشركة فقط بل أصبح بإمكان الشركات اليوم الاعتماد على البيانات القادمة من الإنترنت لدراسة سلوك المستهلكين بشكل عام وتقييم منتجاتهم وخدماتهم وفقا لها. لقد أصبح هذا المستودع الضخم من البيانات متاحا للجميع ليستفيدوا منه في تطوير منتجات وخدمات أفضل تلائم سلوك المستهلك الحقيقي بعد أن كانت عمليات التطوير تتم سابقا على عينة فقط من المستهلكين. لقد أصبحت مهمة من يعمل في التسويق اليوم عي قراءة تلك البيانات ودراستها ليصل الى المستهلك بشكل أفضل وأكثر ملائمة.
أعتقد أن البيانات الضخمة ستغير من مفهوم العينات المستخدمة في الدراسات الإحصائية فما دام بإمكاني دراسة السوق بأكمله فلماذا أعتمد على عينة منه.
ولا يقف الأمر عند العمل التجاري بل أن هذه البيانات متاحة أيضا في مجال التعليم بافتراض أن الطلاب هم العملاء وأن المناهج هي المنتجات. فلو تم استخدام تقنيات البيانات الضخمة لدراسة سلوك الطلاب في المدارس والجامعات لتمكنا من تطوير منظومة تعليمية ومناهج تلائم هؤلاء الطلاب. هذا يمكن أن يتم على مستوى البيانات القادمة من جميع المدارس على مستوى الوطن أو مستوى منطقة جغرافية معينة وحتى على مستوى مدرسة أو جامعة أو حتى مقرر دراسي إلكتروني أو تقليدي. كما يمكن استخدام تقنيات البيانات الضخمة لتقويم الطلاب بشكل حقيقي وفقا لتحركاتهم والنشاطات التي يقومون بها بدلا من استخدام الاختبارات التقليدية.
لقد أصبح بإمكان صاحب المقرر الإلكتروني الحصول بسهولة على تحليل لبيانات طلابه وتحركاتهم مما يمكنه من التغيير والتطوير على المقرر أنيا وفقا لما يأتيه من معلومات دون أن يضطر الى الانتظار لحين إجراء تقويم ما والحصول على تغذية راجعة منه.
وحتى في المجال الصحي فقد بات بإمكان المستشفيات والمراكز الطبية وحتى الأطباء الاستفادة من البيانات الضخمة في دراسة سلوكيات المرضى عبر تحليل ملفاتهم الطبية والزيارات التي قاموا بها للعلاج مما قد يساعدهم على تقديم خدمة طبية أفضل. بل أصبح بالإمكان اليوم لمراكز الأبحاث والمراكز الطبية تحليل البيانات القادمة من أجهزة الجوال وبرمجيات الصحة التي انتشرت مؤخرا والمساعدة بالتنبؤ بالأمراض واستنباط السلوكيات الصحية الجيدة أو السيئة في مجتمع ما وذلك بشكل أني دون الحاجة لانتظار نتائج الأبحاث العلمية.
حتى أنت أصبح بإمكانك أن تستفيد من البيانات الضخمة لتتواصل مع الأخرين بشكل أفضل في حال قمت بتفحص تلك البيانات التحليلية التي توفرها لك منصات التواصل الاجتماعي مع كل منشور ترسله. فمعرفة نسبة من تفاعل مع منشورك من اجمالي من شاهده مثلا سيعطيك مؤشر على مدى قدرتك على إيصال رسالتك للآخرين فتعدل وتطور في أسلوبك وفقا لذلك. فقط عليك أن تنتبه لتك البيانات وتكون يقظا لها وهذا ما لا يفعله الكثيرون.
الخصوصية وعلاقتها بالبيانات الكبيرة
هناك علاقة وطيدة بين البيانات الضخمة والخصوصية فبياناتك اليوم لم تعد جزء من خصوصيتك. صحيح إن تقنيات البيانات الضخمة لا تتعامل مع البيانات التفصيلية لكل واحد فينا بل هي تتعامل مع البيانات المجمعة عن الحركات التي نقوم بها لكن هذا لا ينفي من أن تلك البيانات التفصيلية موجودة بالفعل ويمكن الاطلاع عليها.
فيمكن اليوم لأي أحد أن يعرف أنك اشتريت سلعة ما في ذلك التاريخ وبعدها قمت بتناول كوب من القهوة في مكان ما ثم تعطلت سيارتك فأرسلتها للتصليح واستخدمت أحد خدمات النقل لتصل الى بيتك فتجد أن أحد افراد العائلة بحاجة الى مستشفى فقمت باستخدام خدمة النقل مرة اخرى لتصل الى المستشفى للعلاج ثم تتفاجئ بعد ذلك بإعلان يصل على هاتفك النقال من إحدى وكالات السيارات تعرض عليك استبدال سيارتك!!!!.
ان كنت تعتبر أن تلك المعلومات هي خصوصية لك فاعلم أنها لم تعد كذلك في عالم الإنترنت اليوم. هذه البيانات معلنة ومسجلة عبر تطبيق خدمات النقل وبطاقة الائتمان وسجلات المستشفى وسجلات وكيل سيارتك وبالتالي هي ليست سرا وبما أن هناك أطراف على علم بها ولو كانوا قلة فهي من خلال الإنترنت أصبحت معلنة ولا يمكن اخفائها أو اعتبارها خصوصية حتى لو ادعت كل قوانين العالم عكس ذلك.
جميع التطبيقات المجانية بلا استثناء تعتمد على استخدام البيانات التي يتم تجميعها من المستخدمين للاستفادة منها تسويقيا وذلك ربما بالشراكة مع أطراف أخرى. فلا يمكن لأي تطبيق في عالم الإنترنت أن يكون مجانيا بالفعل والا كيف سيستمر ويحقق الأرباح.
الخصوصية اليوم هي ما تقوم به أو تقوله خارج نطاق عالم الإنترنت لذلك أحرص على ألا تصطحب جهاز التلفون معك الى غرفة النوم والا لأصبحت خارج خصوصيتك هي الأخرى. إن تلقيك خدمات مجانية وذات قيمة عبر الإنترنت يجبرك على دفع ثمن مقابل ذلك وهو على الأقل تلك البيانات التر ترسلها عبر حركاتك على الإنترنت. فاذا أردت أن يكون لك خصوصيتك فعلا فلا تستخدم الإنترنت.
لكن هناك جانب مشرق هنا، فأنت تحصل نتيجة تحليل بياناتك تلك على إعلانات وخدمات ومنتجات تناسبك وتلائم احتياجاتك بشكل أدق بعيدا عن العشوائية التي كان عليها الأمر سابقا. لقد أصبحت الشركات قادرة على توفير منتجات وخدمات ملائمة لك أكثر وتحل مشاكلك التي تعاني منها كل يوم. وبدأت الإعلانات المزعجة التي لا علاقة لك بها تختفي من حياتك لأن المسوفين أصبحوا يفهمونك أكثر وقادرين على إيصال إعلانات ملائمة لك. وستصبح الخدمات الحكومية والتعليمية قريبا فضل هي الأخرى لأنهم سيعرفون عن احتياجاتك دون أن تضطر للشكوى أو التململ.
ترى ما هو رأيكم في ذلك؟؟ هل تتفقون مع هذا الرأي؟
ختاما…….حرب البيانات قادمة
الحروب القادمة ستكون حروب بيانات فمن لديه القدرة على الوصول للبيانات وتحليلها سيكون له القدرة على اتخاذ القرارات الصحيحة والمناسبة. إذا كان لديك أي تعقيب أو سؤال عن البيانات الضخمة فيمكنك التواصل معنا أو ترك تعقيبك أو طرح سؤالك.
العالم الرقمي يتغير باستمرار ونحن بحاجة لأن نكون على اطلاع دائم فاشترك معنا ليصلك كل ما يمكن أن يساعدك في رحلتك نحو التحول الرقمي سواء في العمل أو التعليم أو التواصل.
نعم…ان للبيانات الضخمة وتحليلاتها فوائد كبيرة وبنفس الوقت لها مخاطر وتحديات…
ولذلك قد عرفنا من خلال الدراسات والابحاث والمقالات والتعليقات التي اوضحت هذه الحقائق من وجهة عامة.
ولذلك نقول قد حصلنا على حقائق عامة للبيانات، ولكن ما ينقصنا في المنشورات او المقالات هو التعمق في تلك الحقائق من حيث التطرق في تفسير تلك الحقائق وتحديد اسبابها والعوامل التي تؤدي اليها…
ومن جانب اخر فإن حقيقة البيانات الضخمة وتحليلاتها دخلت في معظم الوظائف، وكان لها اثر عليها، ولكن ما زال تلك الاثر متوقع من خلال وجهات نظر في اي من تلك الوظائف.
ولو نظرنا الى وظيفة او مهنة المراجعة وتدقيق الحسابات والتي تقدم خدمات التأكيد والاستشارات للشركات والمنشأت، فعرفنا من خلال وجهات النظر والدراسات والمقالات والتي توصلت لحقيقة ان لموضوع البيانات الضخمة وتحليلاتها أثر على هذه المهنة وعلى جميع متغيراتها المرتبطة بها.
ولكنها لم تدرس او تفسر تلك الحقيقة او تختبرها من حيث المسببات والعوامل ، لتأكيد ذلك.
لذلك، ما نريد ان نستفهمه منكم هو ما هي اهم الجوانب المناسبة التي يمكن ان نتطرق لها في تفسير حقيقة اثر البيانات الضخمة وتحليلاتها في خدمات او مراجعة وتدقيق حسابات ومعلومات الشركات.
وشكر الله سعيكم…وجزاكم الله إحسانا…