د.جهاد عودة
إن النمـو السـريع في تطبيـق علـم البيانـات في الحكومة والأعمـال ليـس أمـرا مفاجئـا نظـرا لقـوة الاعتبـارات السياسية والاقتصاديـة والاجتماعية للعولمة. ويمكن القول باسـتخدام البيانـات الضخمـة يتم تحديـد ملامح المسـتهلكين سواء فى السياسة او الاقتصاد او المجتمع .
تقضـي البيانـات الضخمـة علـى التحيـزات الناجمـة عـن القـرارات التـي يتخذهـا النـاس علـى أسـاس معلومـات محـدودة. وأدى هـذا النقـص في البيانـات الفرديـة الدقيقـة إلى الرفـض التمييـزي لطلبـات الحصـول علـى قـروض، وهـي ممارسـة يعـود تاريخهـا إلى ثلاثينـات القـرن الماضـي. فيرسـم مقرضـو الرهـون العقاريـة خطوطـا حمـراء حـول مناطـق علـى الخريطـة للإشـارة إلى أنهـم لـن يقدمـوا قروضـا فيهـا بسـبب التكويـن العنصـري أو العرقـي لسـكانها.
وحالـت ممارسـة التنميـط هـذه دون منـح الائتمـان لشـرائح كاملـة مـن المجتمـع وعلـى العكـس، تلغـي البيانـات الضخمـة التنميـط. فيمكـن الآن اسـتبدال البيانـات الشـخصية غيـر الدقيقـة ببيانـات أكثـر دقـة وأكثـر صلـة بالفـرد، حيث تسـتغل شـركات قيـاس الجـدارة الائتمانيـة عـدم التجانـس الـذي تكشـف عنـه التفاعـلات بيـن النـاس في وسـائط التواصـل الاجتماعـي، وتدفقـات الرسـائل النصيـة، والمدونـات الصغيـرة، وأنمـاط بطاقـات الائتمـان، وبيانـات تحديـد الملامح ، بالإضافـة إلى البيانـات الديمغرافيـة النمطيـة مثـل الدخـل، والعمـر، والموقـع .
وييسـر اسـتخدام البيانـات الأكثـر دقـة تصنيـف الأفـراد بشـكل تغيـر التنبـؤ الاقتصـادي تغيـرا هائلا نتيجـة أسـاليب علـوم البيانـات . ففـي التنبـؤ التقليـدي، حيث تتوافـر الإحصـاءات الرئيسـية عـن الاقتصـاد ،مثـل التقريـر ربـع السـنوي لإجمـالي النـاتج المحلـي، إلا بعـد فتـرة تأخيـر طويلـة ، ويمكـن لعلـوم البيانـات تجنـب هـذه التأخيـرات عـن طريـق الاعتمـاد علـى المعلومـات المبلـغ عنهـا بمعـدل أكثـر تواتـرا، مثـل معـدلات البطالـة، أو الطلبـات الصناعيـة، أو حتـى الشـعور السـائد إزاء الأخبـار ، للتنبـؤ بالمتغيـرات المبلـغ عنهـا بمعـدل أقـل تواتـرا وتُعـرف مجموعـة المناهـج المشـمولة في هـذا النشـاط باسـم «التنبـؤ الآني »— وتسـمى أيضـا بتنبـؤ الحاضـر — وحيث توفر القدره بشـكل أفضـل علـى أنهـا تنبـؤ في الوقـت الحقيقـي .
وتحقـق علـوم البيانـات نجاحـات أيضـا في مجـال تحليـل المخاطـر الماليـة النظاميـة. فقـد أصبـح العـالم أكثـر ترابطـا مـن أي وقـت مضـى ، ويبشـر قيـاس هـذه الروابـط برؤيـة جديـدة في عمليـة صنـع القـرارات الاقتصاديـة ويعتبـر النظـر إلى المخاطـر النظاميـة مـن خـلال عدسـة الشـبكات منهجـا قويـا.
ويسـتخدم أخصائيـو البيانـات الآن بيانـات غزيـرة لبنـاء صـور عـن التفاعلات فيمـا بيـن البنـوك، وشـركات التأميـن، والسماسـرة ،وغيرها. وينطبـق الشـيء نفسـه علـى المعلومـات المتعلقـة بالبنـوك الأكثـر تأثيـرا في السـوق، والتـي تُقـاس باسـتخدام أسـلوب يسـتند إلى القيـم الذاتيـة. وبعـد بنـاء هـذه الشـبكات، يمكـن أن يقيـس أخصائيـو البيانـات درجـة المخاطـر في النظـام المـالي، فضلـا عـن مسـاهمة فـرادى المؤسسـات الماليـة في المخاطـر الإجماليـة، ممـا يوفـر للمنظميـن طريقـة جديـدة لتحليـل المخاطـر النظاميـة — وإدارتهـا في نهايـة المطـاف.
تسـتند هـذه المناهـج بشـدة إلى رياضيـات الشـبكات الاجتماعيـة التـي تطـورت في مجـال علـم الاجتمـاع، والتـي تطبـق علـى الشـبكات الكبيـرة جـدا باسـتخدام نمـاذج متقدمـة لعلـوم الحاسـوب، وتبلـغ ذروتهـا بالاندمـاج المثمـر لعـدة مجـالات أكاديميـة عدة . وقـد تقـدم الشـبكات العصبيـة الكبيـرة للتعلـم المتعمـق قريبـا تنبـؤات وتحـدد علاقات بيـن المتغيـرات الاقتصاديـة والاجتماعيه والسياسيه بطريقـة أفضـل مـن الأسـاليب الإحصائيـة القياسـية، ولكـن هـذا العصـر الجديـد للبيانات قـد وصـل بالتأكيـد.
وكمـا أشـار كاتـب الخيـال العلمـي ويليام جيبسـون، «المسـتقبل موجـود هنـا بالفعـل؛ إلا أنـه غيـر مـوزع توزيعـا عـادلا». ومن عصر البيانات تم ميلاد عصر اكثر جرأه وهو عصر البيانات الضخمه.
البيانات الضخمة Big data هو مصطلح شامل لأي مجموعة بيانات ضخمة ومعقدة للغاية والتي من الصعوبة معالجتها باستخدام التطبيقات التقليدية لمعالجة البيانات.حيث تشمل التحديات الالتقاط، والمدة، والتخزين، والبحث، والمشاركة، والنقل، والتحليل والتصور. ويرجع الاتجاه إلي مجموعات البيانات الضخمة بسبب المعلومات الإضافية المشتقة من تحليل مجموعة واحدة كبيرة من البيانات ذات الصلة، بالمقارنة مع المجموعات المنفصلة الأصغر حجمًا مع نفس الحجم الإجمالي للبيانات، مما يسمح بوجود ارتباطات تكشف "الاتجاهات المحورية، وتحديد جودة البحث، وتحديد ظروف حركة تدفق البيانات في الوقت الحقيقي".
اعتبارًا من عام 2012، كانت الحدود المفروضة على حجم مجموعات البيانات الملائمة للمعالجة في مدة معقولة من الوقت خاضعة لوحدة قياس البيانات إكسابايت . عادة ما يواجه العلماء عددا من القيود بسبب مجموعات البيانات الضخمة الموجودة في العديد من المجالات، والتي تتضمن الأرصاد الجوية(علم الطقس)، وعلم الجينات(علم الجينوم) ، والمحاكاة الفيزيائية. المعقدة والبحوث البيولوجية والبيئية , وتؤثر القيود أيضًا علي بحث الانترنت(محرك بحث)، وتقنية الأعمال التجارية والتمويل.
وتنمو مجموعات البيانات في الحجم بشكل جزئي، ويرجع ذلك لأنها يتم جمعها بشكل متزايد عن طريق أجهزة استشعار المعلومات المتنقلة، والتقنيات الحسية الجوية (الاستشعار عن بعد) ، وسجلات البرامج، والكاميرات، والميكروفونات، وأجهزة تحديد ذبذبات الإرسال (تحديد الهوية باستخدام موجات الراديو) وشبكات استشعار اللاسلكية.
وتضاعفت القدرة التكنولوجية العالمية لتخزين المعلومات للفرد الواحد تقريبًا كل 40 شهرا من الثمانينات، واعتبارًا من عام 2012، ينشئ 2.5 كوينتيليون بايت ( 2.5 × 1018) من البيانات يوميا. والتحدي بالنسبة للشركات الكبيرة هو تحديد من يجب أن يمتلك مبادرات البيانات الضخمة التي تنتشر على المنظمة بأكملها.
البيانات الضخمة عادة ما تتضمن مجموعات بيانات ذات أحجام تتخطي قدرة البرامج التي يشيع استخدامها لالتقاط وإدارة ومعالجة البيانات في غضون فترة زمنية مقبولة. وبالنسبة لأحجام البيانات الضخمة فهي هدف متحرك باستمرار، فاعتبارًا من عام 2012، يتراوح حجمها بين بضع عشرات من تيرابايت إلي العديد من بيتابايت من البيانات في مجموعة واحدة فقط. ومع هذه الصعوبة، يتم تطوير منصات جديد من أدوات "البيانات الضخمة" للتعامل مع مختلف الجوانب الخاصة بالكميات الكبيرة من البيانات .
بدأت فى عام 2001 بتقرير بحثى ، وبتعريف تحديات نمو البيانات وفرصها كعنصر ثلاثي الأبعاد، بمعني زيادة الحجم (كمية البيانات)، السرعة (سرعة البيانات الصادرة والواردة) والتنوع (تنوع أنواع البيانات ومصادرها). بتحديث تعريفها ليصبح كالتالي: "البيانات الضخمة هي أصول معلومات كبيرة الحجم، عالية السرعة، و/أو عالية التنوع تتطلب أشكال جديدة من المعالجة لتعزيز عملية صنع القرار والفهم العميق وتحسين العملية". تعريف TBDI للبيانات الضخمة: البيانات الضخمة هو مصطلح ينطبق علي الأجسام الضخمة للبيانات التي تتنوع في طبيعتها سواء أكانت منظمة، غير منظمة أو شبه منظمة، بما في ذلك من المصادر الداخلية أو الخارجية للمنظمة، ويتم توليدها بدرجة عالية من السرعة مع نموذج مضطرب، والتي لا تتفق تمامًا مع مخازن البيانات التقليدية والمنظمة وتتطلب نظام إيكولوجي قوي ومعقد مع منصة حوسبة عالية الأداء وقدرات تحليلية للالتقاط ومعالجة وتحويل وكشف واستخلاص القيمة والرؤى العميقة في غضون وقت زمني مقبول".
في عام 2012، أعلنت إدارة أوباما عن مبادرة التنمية وبحوث البيانات الضخمة والتي تناولت كيفية استخدام البيانات الضخمة لمعالجة المشاكل الهامة التي تواجه الحكومة وقد تألفت المبادرة من 84 برنامج مختلف للبيانات الضخمة.
والجدير بالذكر، أن تحليل البيانات الضخمة قد لعب دورًا كبيرًا في حملة إعادة انتخاب باراك أوباما الناجحة عام 2012. وتمتلك الحكومة الاتحادية للولايات المتحدة 6 من أصل 10 أجهزة كمبيوتر تُعد الأكثر نفوذا في العالم.
نقلا عن صدى البلد