Sorry, you need to enable JavaScript to visit this website.

الذكاء الاصطناعي التوليدي في أربعة أسئلة أساسية

العرب مطالبون بابتكار نموذج لغوي كبير للغتهم على إيقاع الزمن الجديد

استطاع النموذج اللغوي للذكاء الاصطناعي التوليدي صنع نصوص من ابتكاره الغامض حتى بالنسبة إلى من صنعوه ( نوروفلكس.نت)

ملخص

العرب مطالبون بابتكار نموذج لغوي كبير للغتهم على إيقاع الزمن الجديد

لنبتدأ بالأسئلة السهلة، لعلها توصل إلى نظيراتها الأكثر عمقاً، عن الذكاء الاصطناعي التوليدي. لماذ أثارت هذه التقنية في تعامل الآلات مع البشرية كل ذلك الضجيج غير المألوف منذ إطلاق نموذج روبوت الدردشة "تشات جي تي"  Chat GPT، وتلاه "جي بي تي"، على يد سام آلتمان، مدير شركة "أوبن إيه أي" Open ai؟ لماذا وصلت نبرات نقد تلك التقنية إلى   مستويات مرتفعة تماماً من التحذير، بل التوجس الكوارثي؟ أليس ملفتاً أن ذلك التفكير النقدي التحذيري صدرت من كبار صناع التقنية والمتعاملين معها؟ ألا يجدر التنبه إلى مدى تبني مؤسسات النظام الدولي للنقد التحذيري المرتفع حيال تلك التقنية، وقد وصل إلى حد صوغ مدونة سلوك حيالها من قِبَل الاتحاد الأوروبي، وإطلاق الأمم المتحدة مبادرة دولية للتوصل إلى عمل دولي منسق بشأنه، وانخراط البيت الأبيض في اجتماعات متوالية مع كبار قادة شركات المعلوماتية والاتصالات المتطورة، التي ترعى صنع وتطور الذكاء التوليدي، للتوصل إلى رؤية عن سبل للوقاية من مخاطره؟

وقبل السعي إلى تقصي مسارات قد توصل إلى إجابات، وربما تفشل في ذلك، يجدر البدء بسؤال أولي عن ما هو الذكاء الاصطناعي التوليدي؟ ما الجديد فيه الذي أثار كل ذلك الضجة الكبرى؟ كيف يعمل؟ هل إنه يفكر حقاً، أم أنه، وفق ما ذكر خبراء تعلّم الآلات في فيسبوك، ليس تغييراً أساسياً ولا ثورة تقنية؟  

قبل كل شيء، من الواضح أن تتبع تلك الأسئلة أمر لا يدركه مقال ولا حتى مجموعة كبيرة منها، لكن لا بأس من محاولة إلقاء بعض الأضواء الخاطفة على ملامح معينة في تلك التقنية التي أثارت الالتباسات والمخاوف، بالإضافة إلى التفاؤل باستمرار تطور العلاقة بين ذكاء البشر و"نظيره" لدى الآلات.

ذكاء توليدي؟ ماذا يعني ذلك؟

الأرجح أن كلمة توليدي Generative تشكل مكمن الفارق في التطور والمخاطر التي حملتها التقنية الجديدة. إذ يتداول مصطلح الذكاء الاصطناعي Artificial Intelligence في الإشارة إلى ذكاء الآلات، منذ أعمال العالِم الشهير الآن تورينغ (1912- 1954) قبيل منتصف القرن العشرين. منذها، توقع تورينغ أن ذكاء الآلات سيتطور كي "يحاكي" ذكاء البشر، لكن الفارق بين الإثنين سيبقى مستمراً. وطالب تورينغ بأن يستعد البشر لقبول ذلك الذكاء. المفارقة أنه وضع امتحاناً اعتُبِر محكاً حاسماً، لاختبار مدى التشابه بين الذكائين. طيلة عقود مديدة، لم يستطع ذكاء الآلات أن يجتاز بصورة فعلية "اختبار تورينغ" Turing Test. المفارقة أن الذكاء التوليدي استطاع اجتياز ذلك المحك، ما يعني أنه انتقل إلى مرحلة التطور باتجاه التقليد و"التشابه" مع ذكاء البشر. [بإمكان هواة السينما الرجوع إلى فيلم "لعبة التقليد" Imitation Game (2014) الذي قدم عملاً فنياً عن المبتكر تورينغ].

ما الذي مكّن الآلات من ذلك؟

لنتأمل في إسم التقنية الجديدة "جي بي تي"  GPT الذي يختصر عبارة "المحوّل التوليدي المُسبق التدريب" Generative Pre Trained Transformer. تشير كلمة توليد، باختزال سيء نسبياً، إلى ما يشبه إعادة الصياغة للنصوص، ويتضمن ذلك صنع نصٍ جديد يلخصها ويختزلها ويحافظ على أسلوبها ونسقها وترابطاتها. إنه مجال لغوي قديم وراسخ في التعليم بمستوياته كلها.

اقرأ المزيد

يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)

وفي الغرب، وُضِعَتْ أسسس نظرية لغوية عن "إعادة الصياغة" Paraphrase في كتاب حمل ذلك العنوان من تأليف العالِم دِزيدريوس إراسيموس في العام 1548. واندرجت تلك المُلكة اللغوية في التعليم المدرسي والجامعي، وتزايد التعمق في أساليبها وطرق صنعها وآليات التَمَرّس بها. وينطبق الوصف على التعليم الحديث للغات في معظم الدول.

هل يعني ذلك أن "جي بي تي" يمثل ذكاء اصطناعي تقليدي أضيفت إليه مُلكة إعادة صياغة للنصوص، مع ما تضمنه من تلخيص واختزال لها؟ لا، إذا أردنا إجابة شبه وافية، ونعم بصورة نسبية أيضاً، إذا أردنا وضع تصور عام عملي وفضفاض عنها.

قبل الاستمرار، سيجري التركيز على الذكاء الاصطناعي التوليدي المتصل باللغة لأنه شكّل الهيكل الأساسي، بالأحرى النموذج بالتعبير التقني، الذي يجري الآن العمل على تطويره كي يشكل نماذج اخرى.

كيف تتدرب الآلات على علوم اللغة؟

بالعودة إلى اللغة، ليس إعادة الصياغة هي وحدها التي صنعت الفارق بالنسبة إلى "جي بي تي"، لكنها جاءت في وقت تطور فيه تعلّم الآلات في مجال اللغة إلى مرحلة متطورة، سيجري توضيحها بعد بضعة سطور.

إذا أخذت الآلات تتمرس في إعداد النصوص اللغوية، بعد أن "نُقِلَتْ" إليها المعارف والأساليب البشرية في التعامل معها.

ماذا يعني أن علوم اللغة "نُقِلَتْ" إلى الآلات الذكية؟ ثمة علم كامل في مجال الحوسبة الرقمية يسمّى "ألسنيات الكمبيوتر"Computer Linguistics، يتناول الشطر الأكبر من ذلك المسار.

وبإجياز مفرط، من المستطاع الإشارة إلى أن علوم اللغة قد تطوّرت في الغرب، خصوصاً مع تبلور ما يُشار إليه بمصطلح "السيميائية"  Semiotic.

باختصار، تتضمن السيميائية ثلاثة فروع في علوم اللغة هي التداولية  Pragmatics، والدلالية "سيمانطيقي" Semantic، والإشارية أو "سينتاكس"  Syntax التي تعني بنية الإشارات في اللغة. وتتعامل التداولية مع طريقة استخدام اللغة في المجتمعات، بما في ذلك القواعد والنحو والصرف، وكيفية تطور معاني الكلمات مع الزمن، وكذلك كيف تكتسب الجمل معانيها من خلال الاستخدام الاجتماعي والزماني. وتدرس الدلالية معنى الكلمات في الجمل، بمعنى دراسة علاقة الأشكال اللغوية المختلفة مع المعاني الذهنية، بالأحرى التمثّلات العقلية. وبالتالي، تُمكِّن العلوم الدلالية من فهم كيفية فهم العبارات بالنسبة إلى أصحاب لغة معينة، وتطور ذلك عبر الزمن.

ويتعامل علم الـ"سينتاكس" مع اللغة باعتبارها رموز صرفة، ترتصف وفق صيغ لها مواصفات تشبه الطريقة التي تكوّن فيها الأعداد الأرقام والحساب والأنواع الاخرى من الرياضيات.  

للأسف، لا يوجد مثل هذا الخط من التطور في اللغة العربية. ومن الكتب القليلة عربياً عن تلك العلوم اللغوية الحديثة، يبرز كتاب توين فان دايك "النص والسياق، استقصاء البحث في الخطاب الدلالي والتداولي" ، وقد ترجمه الزميل عبد القادر قنيني في عام 2000.  

ولأسباب شتى، ركّز ذلك التطور في علوم اللغة غرباً منذ ثمانينيات القرن العشرين وتسعينياته، على صوغ علوم السيميائية في معادلات رياضية واضحة. ولأن الآلات الإلكترونية والحوسبة الرقمية تعمل بواسطة معادلات رياضية، توصف بمصطلح الخوارزميات Algorithms، تمكن علماء الحواسيب من إعطاء تلك الآلات قدرات متنوعة في التعامل مع اللغة. ولربما قدت السطور السابقة شرحاً عن سبب الإكثار من ترداد مصطلح خوارزميات في النقاش عن الذكاء الاصطناعي، خصوصاً التوليدي منه.

 

كيف تُصنع النماذج اللغوية الكبيرة والأساسية؟

إذاً، "تستعمل" الآلات الذكية علوم اللغة الحديثة، السيميائية بفروعها التداولية والدلالية والإشارية، في التعامل مع النصوص اللغوية، بداية من الكلمة المفردة، ووصولاً إلى الجمل والمقاطع وضوابطها في القواعد والنحو والصرف، وكذلك البنى الإشارية التي تُقدّم اللغة مباشرة بوصفها إشارات مجردة تشبه الأعداد الصرفة.

ما الذي يعنيه القول بأن الآلات الذكية "تستعمل" علوم اللغة الحديثة؟ بالإضافة إلى أن تلك العلوم تصوغ اللغة في معادلات/ خوارزميات رياضية، فإنها تستفيد من تطور أسلوبين تقنيين ظهرا في سياق تعليم الآلات الذي يشكل القلب الأساسي للذكاء الاصطناعي المتطور. ويتجسد الأسلوبين التقنيين في تقدّم صيغ المعادلات الرياضية التي تصف العلاقات والروابط بين الأشياء المختلفة، وكذلك الحال بالنسبة إلى الخوارزميات التي تُمكّن من التعرف إلى النسق  Pattern Recognition، أي أن تلتقط ما يتكرر ويتشابه ويتقارب ويحدث في تسلسل معين، ثم تستند إليه في أداء المهمات.

وبفضل الذاكرة الضخمة للحواسيب، والقوة المتزايدة للرقاقات الإلكترونية، درّب العلماء الحواسيب على نصوص اللغة، باستخدام الخوارزميات المتعلقة بالتعرف على النسق والتقاط الروابط، بالاستناد إلى علوم السيميائية الثلاثة.

واستناداً إلى تلك التقنيات والعلوم اللغوية، بالإضافة إلى أدوات اخرى على غرار إعادة الصياغة، درب العلماء الآلات أيضاً على صنع قوالب أو هياكل أو تمثيلات أولية، كي تتمكن من صنع نصوصها الخاصة، بالأحرى إعادة صياغة واختزال وتكثيف النصوص الموجودة في مليارات الكتب والمطبوعات والمنشورات، كي تولّد قوالب تستند إليها حينما تعطي إجابات عن الأسئلة التي توجه إليها.

يعطي ذلك الوصف السابق كله تفسيراً لمعنى صنع النماذج اللغوية الكبيرة Large Language Model التي تعتبر الهيكل الأساسي لنموذج "جي بي تي" الذي لا يصبح نموذجاً لغوياً أساسياً كبيراً إلا إذا تدرب على التعامل مع اللغة اليومية السارية لدى البشر. والأرجح أنه بات مألوفاً للجمهور منذ سنوات أن يروا الأجهزة الذكية التي بين أيديهم، وهي تُكمل الجمل وتعطيهم خيارات عن الكلمات التي يتكرر استعمالها ضمن سياق محدد كعبارات التهنئة بالأعياد أو الاطمئنان على الصحة أو المجاملات في المناسبات العامة والخاصة وغيرها.

وللتوصل إلى صنع النموذج الأساسي الكبير، يجري تدريب النماذج الأولية للذكاء الاصطناعي التوليدي على الحوارات والكتابات والأسئلة والردود، بل حتى المكالمات الهاتفية بعد تحويلها نصوصاً مكتوبة. وقد جرت الاستفادة على نحو بارز من كتابات الجمهور على منصات التواصل الاجتماعي في تدريب الآلات الذكية وصنع النماذج اللغوية الأساسية الكبيرة.

وطري في الذاكرة أن استخدام كتابات الجمهور وتدويناته وتغريداته، من دون أدنى إذن منه، حركت جدالات لا تزال مستمرة.

وبغية استكمال الوصف الوارد أعلاه، فبعد صنع إلى النماذج اللغوية الأساسية الكبيرة، توضع تلك النماذج على كومبيوترات فائقة القوة في الحوسبة، بمعنى الذاكرة الضخمة والرقاقات المتطورة في سرعة إجراء الحسابات والتعامل مع الخوارزميات، كي يُصار إلى صنع نماذج كبيرة  Large Models. إن صنع النماذج الكبرى الأساسية يتطلب تملك العقول المتمرسة في الحوسبة التي تتولى تدريب الآلات وتعليمها، بالإضافة إلى حواسيب فائقة القدرات. ويكلف كل نموذج أساسي كبير ما يفوق بليون دولار. وفي المقابل، يتطلب صنع النماذج الأساسية بضع عشرات الملايين من الدولارات، ووجود كمبيوترات متقدمة وقوية، لكن من دون الحاجة إلى العقول البشرية التي تعمل على تدريب الآلات، وهي قليلة عالمياً، ويجري صراع ضخم عليها.

 

ما الذي يدور في عتمة الآلات؟

ثمة ملمح اخر، يعتبر واحد من أبرز مصادر القلق بشأن الذكاء الاصطناعي التوليدي، وهو أنه من غير المعروف كيف يعمل ذلك الذكاء فعلياً، ولا كيف يتطور، كيف يطور نفسه.

من الوصف السابق، يتضح أن الذكاء الاصطناعي التوليدي لا يعرف المعاني والمحتوى في النصوص بحد ذاتها، بل يتعامل معها عبر تقنيات كالتعرف إلى النسق. بقول آخر، إنه أداة تقنية تملك قوة الحوسبة المعروفة للكومبيوترات، بالإضافة إلى القدرات المتأتية من ألسنيات الكمبيوتر وخوارزميات علوم اللغة. وبعد ذلك، لا أحد يعرف ما الذي يجري. مثلاً، تُدرب الآلات على صنع قوالب وتمثيلات، تسمّى "التمثيلات المُعدّة بواسطة التدريب المسبق"  Pretrained Representations لكن من غير المعروف كيف تستعملها بعد أن تصبح جزءاً منها. إلى أي مدى يصح الوصف الذي قدمه موقع "تيكنولوجيكو دي مونتيري" Tecnológico de Monterrey عن "تشات جي بي تي" بأنه يشبه بببغاء ضخم يردد ما لا يفهمه. هل تولّد قوالب وتمثيلات جديدة؟ هل تنقل تمثيلات وهياكل لنصوص شعرية وأدبية، مثلاً، من لغة إلى اخرى؟ هل تترجم لنفسها من لغة إلى اخرى، وتصيغ قوالب في اللغة الألمانية مثلاً، استناداً إلى هياكل في اللغة الإنكليزية؟ كيف تتعامل النماذج الكبرى للذكاء الاصطناعي مع المعلومات الجارية التي تتدفق إليها عبر الإنترنت على مدار الساعة؟ ما تأثير ذلك على صحة إجاباتها، خصوصاً أنها لا تفهم ولا تعي يالمعاني التي تتعامل معها بالفعل؟ ثمة إجماع من خبراء التقنية على عدم وجود ظاهرة الوعي لدى الذكاء الاصطناعي.

لعل ذلك مدخل لفهم لماذا يرتكب الذكاء الاصطناعي التوليدي الأغلاط ويعطي إجابات غير منطقية ولا صحيحة، عن أشياء كثيرة، بل يبدو كأنه يركب ما يتشابه مع نمط السؤال المقدّم له، لمجرد أنها أشياء تكررت بنسبة عالية النصوص التي رجع إليها ذلك الذكاء. مثلاً، طُلِبَ من الذكاء الاصطناعي التوليدي إعطاء ستة عناوين لكتب لهنري كيسنجر عن التكنولوجيا، فقدم خمسة عناوين خطأ ربما تكون جمل متكررة في مؤلفات كيسنجر، وأعطى عنوان صحيح لكنه ربطه بتاريخ غلط، ربما لأن ذلك العنوان الصحيح تكرر كثيراً في كتابات عن رأي كيسنجر في التقنية.

ويسمّي العلماء تلك الإجابات المفبركة بأنها "هلوسات"، بل شبهها البعض ببغاء يردد النصوص بثقة عالِم واثق.

ووصل الأمر بأن مقالاً علمياً وصف عدم معرفة صناع الذكاء الاصطناعي التوليدي بما يدور في دهاليزه، بأنه لغز محير قد لا يجد طريقه إلى الحل أبداً، بل اعتبره التحدي الأضخم الذي يواجه أجيال البشرية حاضراً ومستقبلاً. ولم يكن كُتّاب ذلك المقال سوى إريك شميدت، المدير التنفيذي لـ"غوغل" طيلة 11 سنة ثم ترأس "ألفا بيت" بين عامي 2011 و2017؛ والسياسي الشهير هنري كيسنجر، والبروفيسور دانيال هوتن لوشر، أستاذ الذكاء الاصطناعي في "معهد ماساشوستس للتقنية". وقد ألّف ذلك الثلاثي كتاب "عصر الذكاء الاصطناعي ومستقبلنا الإنساني" The Age of AI: And Our Human Future.

ويصعب عدم إطلاق صفارة تنبيه قوية في الدول العربية بشأن هذه المرحلة من الذكاء الاصطناعي. إذا لم ينخرط العرب في صنع نموذج لغوي أساسي وكبير  عن لغتهم، فلسوف يفتحون ثغرة كبرى تفصلهم عن إيقاع الزمن، وتصبح فجوة معرفية اخرى، تضاف إلى أشياء مشابهة كثيرة. يملك العرب الشيء الكثير في العلوم التقليدية عن اللغة، لكنهم لا يملكون إلا أقل من القليل في العلوم الحديثة، خصوصاً الـسيميائية بفروعها الثلاثة. الأرجح أن ذلك التحدي يشكل جزءاً أساسياً من أي استجابة عربية إيجابية عن عصر الذكاء الاصطناعي التوليدي.

المزيد من علوم