"البيانات الضخمة" بوصفها اللحظة الحاضرة للـ"ويب"

تعيش الإنترنت الآن مرحلة تتسارع فيها عملية رقمنة الأشياء كلها، ويعني ذلك أن كميات مذهلة من البيانات تتراكم عليها على مدار الساعة.

خشية علمية أصيلة من تراكم هائل للبيانات على إنترنت غير آمنة (موقع "ذي فيرج.كوم")

بالتزامن مع مرور ثلاثين عاماً على انطلاقة الـ"ويب"، أو بالأحرى "الشبكة العالميّة الواسعة" World Wide Web، أبدى مؤسس تلك الشبكة السير تيم بارنز لي، قَلَقَهُ حيال تبدّد آفاقها الإيجابيّة تحت وطأة سلبيات ضاربة، خصوصاً "الأخبار الكاذبة" وتفاقم اختراق المواقع والاستيلاء على بيانات الجمهور، ما يهدد الحرية والخصوصية وتبادل المعرفة عبر الشبكة.

وبأسى، أشار مبتكر تقنية "النص الفائق الترابط" التي أعطت الإنترنت شكلها الحاضر، إلى أنّ "شبكة الـ"ويب" لم تعد مكاناً آمناً للعمل وتبادل المعلومات". ويزيد من وقع تلك الحسرة أنّ الإنترنت دخلت حاضراً مرحلة نوعيّة، لعل أبرز ملامحها هو ظاهرة "البيانات الضخمة"Big Data. ويمكن إعطاء بعض الأرقام التي ربما تفيد في تكوين فكرة أوليّة عن مدى ضخامة البيانات التي تحتويها تلك الشبكة. وحاضراً، يبلغ جمهور الإنترنت قرابة 4.2 مليار شخص (أكثر من نصف سكان الكرة الأرضيّة) يتبادلون في الثانية الواحدة قرابة ملياري غيغابايت، أو اثنين إكزا بايت Exabyte، ما يعني أنهم يتبادلون قرابة 172.8 ألف إكزابايت في اليوم الواحد! ويجري ذلك التبادل عبر 1.7 مليار موقع شبكي. ولا يمثّل ذلك الحجم الهائل كل محتويات شبكة الإنترنت، بل يمثّل ما يجري تبادله عليها، فلا يشمل المعلومات والبيانات المخزنة على الكومبيوترات والخوادم في العالم أجمعه، خصوصاً التي تحتويها المواقع الأساس الكبرى مثل وكالة "ناسا" الفضائية، و"أرشيف الإنترنت" المرجعي، "وكالة الأمن القومي" الأميركيّة التي ترصد الاتصالات والتبادلات التي تجري في أنحاء الكرة الأرضيّة كلها وغيرها. ويقدّر أن عمليات الرقمنة عالميّاً تولّد قرابة 1.6 زيتابايت في السنة، ويساوي ذلك 1.6 تريليون غيغابايت سنويّاً، فيما قدّر حجم المعلومات المخزّنة عالميّاً في العام 2017 بقرابة 16 تريليون غيغابايت.

لنتابع مع لعبة الأرقام قليلاً. من المثير أيضاً أن كثيراً من هذه المعلومات بات مكتوباً بـ"لغة" واحدة: لغة الكومبيوتر. بقول آخر، يتوافر قسم كبير من هذه المعلومات على هيئة ملفات إلكترونيّة رقميّة مكتوبة على الكومبيوتر، تشمل الكتب والنصوص والجرائد والمجلات والمنشورات والدراسات والصور والخرائط والرسومات والأفلام والأغاني والموسيقى والرسائل وما يكتب يومياً على مواقع شبكات التواصل الاجتماعي ورسائل الخليوي. بات كل شيء يكتب ويوضع على الكومبيوتر، فيصبح جزءاً من ملفات رقميّة مكتوبة بلغة الإلكترونات التي تتألف من عددين هما صفر وواحد! لنتأمّل ثانيّة. صارت كل المعلومات قابلة لأن توصف وتخزّن وتُصنّف وتُبحث وترصف، عبر أداة واحدة هي الإلكترونات وملفاتها الرقميّة. يُطلَق على هذا الأمر تسمية "الرقمَنَة" Digitization، وهي من الملامح الأبرز لزمن البيانات الضخمة. لم تعش البشرية شيئاً كهذا من قبل، وهو أمر يجدر تذكّره كثيراً عند التفكير في البُعد المختلف لمسألة البيانات الضخمة في عصر المعلوماتيّة.

 

ثورة؟ ربما ولكن مهلاً...

إذاً، ما هي الخلاصة التي ينصحنا بها علماء عوالم المعلوماتيّة وتقدّمها، على غرار ما ورد في كتاب صدر أخيراً في أميركا بعنوان "البيانات الضخمة: ثورة تغيّر طريقة عيشنا وعملنا وتفكيرنا" Big Data: A revolution that would Change the Way we Live, Work & Think للبروفسور كينيث كروكر؟ ما هو الشيء الذي يرون أن يكسبه الفكر البشري الآن من الانتقال إلى "عصر البيانات الضخمة"، بمعنى ما هو الآثر المستفاد من هذا التدفّق الهائل في المعلومات؟ لا تتسرع في الإجابة، لأنها ربما تحمل كثيراً من الصدمة. ثمة 3 مسارات أساس (مهارات، طرق في التفكير، أساليب في التدبير: سمّها ما شئت) هي:

ضرورة هجران الدقّة لصالح التشديد على أهمية الخطأ ووجوده Get Rid of Accuracy. لا نكران للخطأ، بل الأهم وضعه دائماً في الاعتبار والتفكير بأنه موجود فعليّاً.

وضع الجهد باتجاه تجميع المعلومات والمزيد منها، ووضع المعلومات المتراكمة موضع الاستخدام اليومي والمستمر، Collect & Use a Lot of Data، خصوصاً مع تفتح آفاق واسعة في الحصول على المعلومات وتنويعها وتجميعها وتخزينها، وبكلفة تتدنى باستمرار.

التركيز على فهم العلاقات والروابط والميول بدل التشديد على البحث عن الأسباب والعلل Give Up On Causes- Accept Correlations! ربما لا يعجب كثير من العقول في عوالم العرب، الكلام هذا الذي يجدر ترجمته إلى اللغة العربيّة لأنه ينطق عن لحظة العيش الحاضر مع تلمّس جريء للمستقبل. ربما بدا غريباً لكثيرين أن يتّخذ التقدّم الأكثر قوّة ودقّة في العلم، مدخلاً للمناداة بالقول بضرورة... هجران الدقّة! لعل الكلام يبدو مؤلماً لمن يتخذ العلم ملاذاً ومهرباً، وليس لمن ينظر إليه باعتباره تجربةً فوّارةً وتحدّياً دائماً وتمرّداً لا يهدأ. لنترك جانباً أولئك الذين دأبوا على أن يكونوا "مأخوذين" بالعلم (على طريقة تذكّر الانجذاب الصوفي التقيّ، وهو أمر مفهوم دينياً)، بمعنى أن ينظروا إليه بوصفه شيئاً مُطلقاً ومتعاليّاً ومتساميّاً وغيره من الألفاظ التي تشي بنوع من إسقاط مطلقات دينيّة على العلوم، بدل احترام وقوفها ضمن حدود العقل الإنساني، وعدم إدعائها بأنها مقدّسة ولا مُطلقة.

 

الأخطاء ليست كارثة

في كتاب "البيانات الضخمة: ثورة تغيّر طريقة عيشنا وعملنا وتفكيرنا"، يذكّر كبار اختصاصيّي المعلوماتيّة في أميركا، بأنّ متوسط ما يملكه الفرد من المعلومات حاضراً، يفوق محتويات "مكتبة الإسكندريّة" في عزّها أيام الروماني الغابر، عندما نُظُر إليها على أنها المكان الذي يحتوي الفكر الإنساني كلّه، بعشرات المرّات!

ويشير هؤلاء العلماء إلى أن الملمح الثاني المهم في عصر "البيانات الضخمة"، يتمثّل في أن هذه المعلومات باتت كلها تكتب بـ"لغة" واحدة هي لغة الكومبيوتر الرقميّة المؤلّفة من ثنائي صفر وواحد. تكتب بلغة الكومبيوتر الرقميّة الإلكترونيّة الأشياء كلها: الكتب والنصوص والأفلام والفيديو والأغاني والموسيقى والخرائط والمكالمات والمحادثات والبريد ومحتويات شبكات الاتصالات وما يكتبه الناس على شبكات التواصل الاجتماعي وغيرها. إذاً، ما هو مكان الخطأ في هذه الصورة؟ هل يمكن تجنّبه؟ الأرجح أن لا. ليس الخطأ هو المهم، بل صار متوقّعاً أن يكون موجوداً في عوالم معرفة متحرّكة باستمرار، وتأتي من مصادر فائقة التنوّع، وهذه أشياء تضمن ثراءها. المهم هو التحسّب لئلا يُفسد الخطأ المنظومة الضخمة من المعلومات.

ويحرص الكتاب أيضاً على تحريض العقول على هجر تقاليد الإحصاءات الدقيقة المهجوسة بشغف التخلّص من مصادر الخطأ، لمصلحة عدم الخوف من الخطأ، بل التركيز على أوسع تنوّع من المعلومات، وأقصى درجات التعدّد، والحرص على الحصول على الثراء في المعلومات، والبحث عن الأصوات كافة. ويربط الكتاب بين هذا الأمر وإملاءات ربما لا يصعب التفكير بها، كالتحفيز على التفكير بالروابط بين الأشياء، وهو أمر متواضع وممكن، بدل محاولة الوصول إلى "تفسير شامل" للأمور بعللها وأسبابها ومنشئها. المهم هو الروابط والاتجاهات العامة للأشياء والعلاقات بين الظواهر التي تتوافر كميات ضخمة من البيانات الضخمة عنها.

المزيد من