هل تجد الروبوتات ضالة إنسانيتها في روح الدعابة؟
تعج الشوارع حول محطة جراند سنترال في نيويورك بحشود الصيف عندما يظهر جو توبلين، أحد أفضل كتاب الكوميديا التلفزيونية في المدينة. يرتدي البالغ من العمر 69 عاما سروالا رياضيا قصيرا فضفاضا، وقبعة واقية من الشمس، وفانيلا بيضاء تنطق "نقابة الكتاب في إضراب!".
يقول: "نحن نتظاهر"، موضحا أنه كان للتو مع أعضاء نقابة الكتاب الأمريكية معتصمين أمام استوديوهات شركة إن بي سي في روكفلر بلازا.
يوجد هنا تطور لافت للنظر في حبكة القرن الـ21، حتى مع مخاوف النقابة من أن الاستوديوهات قد تستخدم تكنولوجيات مثل الذكاء الاصطناعي لخفض الوظائف، فإن توبلين نفسه يتبنى الذكاء الاصطناعي التوليدي، من أجل الضحك.
قبل ستة أعوام، بدأ توبلين في وضع عناوين الأخبار اليومية في خوارزمية كوميدية كان قد كتبها، مدعومة بمعالجة اللغة الطبيعية. أصبح ينشر ما ينتجه هذا النظام على حساب يدعى ويتسكريبت، على وسائل التواصل الاجتماعي. يقول: "لقد أرسلت برمجية شات جي بي تي إلى مدرسة نكات".
لذكر بعض الأمثلة الحديثة، ردا على موضوع "ثلاثة محققين خاصين مختلفين يحققون الآن مع الرئيس بايدن، وهانتر بايدن، ودونالد ترمب"، يجيب حساب ويتسكريبت، "إذا استمروا في ذلك، فقد نحصل بالفعل على رئيسة للدولة!"
أو مع الموضوع التالي "الكويت ولبنان يحظران فيلم باربي"، يجيب ويتسكريبت: "لبنان والكويت يحظران فيلم باربي لأنهما يعتقدان أنها غربية للغاية. وشركة ماتيل ترد: ماذا؟ لقد صنعناها في الصين".
قد يتساءل بعض القراء عما إذا كانت هذه النكات مضحكة، الفكاهة مسألة ذوق شخصي. لكن بغض النظر عما إذا ضحكت أم لا، هي تستحق الاهتمام.
في الخمسينيات من القرن الماضي، عندما طور العالم البريطاني آلان تورينج "لعبة التقليد" – التي عرفت فيما بعد باسم اختبار تورينج – لمعرفة ما إذا كانت أجهزة الحاسوب قادرة على إقناعنا بقدرتها على التصرف مثل البشر، حذر من أنه سيكون من الصعب للغاية على الآلات أن تنجح في الاختبار بإظهار روح دعابة. والسبب هو أن الكوميديا تعد مثالا بليغا على الجوانب الغامضة وفي أحيان كثيرة المتناقضة للثقافة الإنسانية، التي على عكس الشطرنج، لا يمكن تعريفها بالمنطق بسهولة. كما كتب توني فيل، عالم الحاسوب الأيرلندي، في كتابه يور ويت إز ماي كوماند، فإن النكتة "تشبه الخدعة السحرية"، لأنك عندما تشرحها ببرود، لن تعود مضحكة.
لكن توبلين يرى أن التطورات الأخيرة في مجال الذكاء الاصطناعي، من النوع الذي نتج عنه أدوات مثل شات جي بي تي، تخترق الآن هذه الحدود الأخيرة. هو ليس الوحيد. فقد مهرجان إدنبره هذا الشهر عروضا لا يضحك فيها الممثلون الكوميديون على الروبوتات فحسب، بل يضحكون معها.
لنأخذ مثلا إمبروبوتكس، وهي مجموعة مسرحية تقدم أداء فكاهيا أنشأها اثنان من العلماء الممثلين، وهما بيوتر ميروفسكي وكوري ماثيوسون. في هذا العرض، يرسل موضوع إلى روبوت دردشة مبني على الذكاء الاصطناعي -الآن يعتمد على نماذج جي بي تي-3، وجي بي تي-4 وللاما 2، وفقا لموقع المجموعة الإلكتروني - ثم يتم بث النتائج إلى الكوميديين البشريين، حتى يتفاعلوا معها.
تظهر الكوميديا من كيفية استجابة البشر لمخرجات الذكاء الاصطناعي هذه، إضافة إلى لعبة يخمنون فيها ما هو نتاج إنسان منها وما هو لا، وهو اختبار تورينج حديث. "إنه تقليد خالص"، كما يوضح ميروفسكي، الذي تتمثل وظيفته في النهار في تطوير الذكاء الاصطناعي لمهام مثل التنبؤ بالأرصاد الجوية لمجموعة ديب مايند التكنولوجية المملوكة لشركة جوجل.
لكن هل يمكن لهذا التقليد أن يجعلنا نضحك حقا؟ أم أن هذه الأدوات المؤتمتة هي النسخة الكوميدية من موسيقى المراهقين السطحية، أو شيء سرعان ما يبدو تكلفها مملا بشكل متوقع؟ السؤال يقصد ما هو أبعد من الفكاهة. إذا تمكنت الروبوتات من اختراق هذه القلعة الداخلية للثقافة، فإن فكرة التميز البشري برمتها تبدو واهنة.
طالما كنت مفتونة بهذه الأسئلة. قبل أن أصبح صحافية درست علم الإنسان، أو الأنثروبولوجيا، وهو فرع العلوم الاجتماعية المخصص لدراسة الثقافة الإنسانية. إذا سألت معظم غير الأكاديميين عما تعنيه كلمة ثقافة، فمن المحتمل أن يشيروا إلى متحف للقطع الأثرية أو دار أوبرا. لكن علماء الأنثروبولوجيا يستخدمون كلمة الثقافة على نطاق أوسع لوصف نسيج الافتراضات والممارسات التي تحدد المجموعات الاجتماعية وتمكنها من التفاعل مع عالمها وتنظيمه.
بعض جوانب هذه الخريطة الثقافية المشتركة مرئية بسهولة، ومن هنا جاء ذكر القطع الأثرية في المتحف. لكن جوانب كثيرة من ثقافتنا تصعب رؤيتها أو تعريفها، وذلك على وجه التحديد لأن افتراضاتنا المشتركة متأصلة بعمق لدرجة أننا نادرا ما نلاحظها. وكما يقول الصينيون: "لا يمكن للسمكة أن ترى الماء".
النكات تلخص تعقيد المياه الثقافية التي نسبح جميعا فيها. وفي سبيل فهمها، اسأل نفسك ببساطة ما يلي: لماذا تضحك على شيء أصلا؟ في اليونان القديمة، اعتقد الفيلسوف أفلاطون أن السبب هو أن النكات تعكس التسلسلات الهرمية الاجتماعية وتعيد إنشاءها، مثلا، الأقوياء يحبون الضحك على الضعفاء. اتفق معه الفيلسوف الإنجليزي توماس هوبز الذي عاش في القرن الـ17، مشيرا إلى أن "المفخرة المفاجئة هي العاطفة التي تصنع تكشيرات الوجه هذه وتسمى ضحكا، ويحدث إما نتيجة لتصرف مفاجئ من جانبهم يسرهم، أو باستحسان شيء أشوه في أحد آخر، فيشيدون بأنفسهم فجأة مقارنة به".
مع ذلك، اعتقد آرثر شوبنهاور فيلسوف القرن الـ19 بدلا من ذلك أن "سبب الضحك في كل حالة هو إدراك مفاجئ... للتناقض"، أي الرغبة في إصلاح التناقضات الموجودة دائما في خرائطنا الثقافية. يتفق كثير من علماء النفس المعاصرين مع هذا الرأي، حيث ينظرون إلى الفكاهة كأداة تطورية لحل التوتر والتعبير عن الموضوعات التي نتجاهلها عادة، أو الصمت الاجتماعي.
لكن الشيء الوحيد الذي يتفق عليه جميع طلاب الفكاهة تقريبا هو أن النكات تمكن المجموعات الاجتماعية من الترابط. السبب هو أن الكوميديا تعتمد عادة على افتراضات مشتركة، وإن كانت نصف مخفية غالبا. لذا ما تجده مجموعة مضحكا، قد لا تراه مجموعة أخرى كذلك، ما يعني أنك إذا فهمت نكتة، فأنت من بينهم، وإذا لم تفهمها، فأنت لست كذلك. الضحك يعتمد على السياق، والمجموعة التي تنتمي لها.
هذا يجعل الأمر صعبا على الروبوتات، أو هكذا بدا الأمر. عندما تطور مجال الذكاء الاصطناعي في النصف الثاني من القرن الـ20، بحث العلماء عن قواعد متسقة من أعلى الهرم إلى أسفله عن كيفية عمل الفكر البشري، التي يمكن تكرارها عبر تسلسل من الرموز. هذا النظام الرمزي يعمل بشكل جيد نسبيا في معالجة المشكلات المنطقية والعالمية والمتسقة. لكن الثقافة الإنسانية ليست كذلك.
إذن مع أن العلماء كانوا يحاولون استخدام أجهزة الحاسوب لتوليد النكات منذ عدة عقود – في مجال فرعي يسمى الفكاهة الحسابية – إلا أن النتائج كانت في السابق ضعيفة جدا، كانت تقتصر في الأغلب على التورية التي تعتمد على قالب محدد.
لكن كما قد تعني كلمة الفكاهة أشياء مختلفة، فإن مصطلح الذكاء الاصطناعي أصبح له الآن عدة معان. وقد حدث أخيرا تحول كبير في كيفية عمل أنظمة الذكاء الاصطناعي. أحد الأسباب هو أن باحثين من "جوجل برين" طوروا في 2017 شكلا جديدا من الذكاء الاصطناعي يستخدم ما يسمى بالمحولات لمراقبة ما يفعله البشر على نطاق واسع، عبر البيانات (أو "نماذج اللغة الضخمة")، ثم تستخدم التحليل الإحصائي لتكرار الأنماط بالتنبؤ بالكلمة (أو أي جزء من البيانات) من المرجح أن يتبع كلمة أخرى.
التفاصيل معقدة للغاية. لكن النقطة الأساسية التي يجب فهمها هي أنه في حين حاولت أنظمة الذكاء الاصطناعي القديمة محاكاة الفكر البشري بإنشاء مجموعة عالمية من القواعد المنطقية المصنوعة على يد الإنسان، فإن الذكاء الاصطناعي الإحصائي يحاكي ببساطة الأنماط التصاعدية التي يلاحظها، من أدنى الهرم إلى أعلاه، حتى لو بدت غير منطقية، مثل طفل يتعلم لغة، أو أجنبي يحاول الاندماج في ثقافة جديدة.
يقول فيل: "إن الأطر الرمزية تعطي صورة من الأعلى إلى الأسفل لأنظمة الذكاء الاصطناعي، في حين تلتقط التحليلات الإحصائية المبنية على البيانات الفروق الدقيقة والتنوع التي لا يمكننا تأطيرها بخطوط مستقيمة وقواعد ثابتة". ومن المحتمل أن يتيح هذا للروبوتات تقليد روح دعابتنا، لأنه كما يشير ميروفسكي، "النظام الإحصائي يتيح للذكاء الاصطناعي جلب العناصر الكوميدية دون الحاجة إلى تصميم القواعد".
إن الآثار المترتبة على ذلك تعلم شخصا مثلي التواضع. بعد دراستي للأنثروبولوجيا، كنت أفترض أن خصوصيات الثقافة هي التي جعلت البشر مختلفين عن الروبوتات.
قبل بضعة أعوام، ألقيت عدة خطابات، بناء على محادثات أجريتها مع علماء الذكاء الاصطناعي، التي أفضت إلى أن "الشيء الوحيد الذي لن يتمكن الروبوت من فعله أبدا هو إلقاء نكتة جيدة حقا" – على وجه التحديد لأن الكوميديا تشترك بها جماعة ما، ومتناقضة وتستند إلى نوع الصمت الاجتماعي الذي لا تفهمه البيانات الضخمة. لكن كلما أصبحت نماذج اللغة الكبيرة أفضل، زادت قدرتها على أداء "لعبة التقليد" تلك، لاقتبس هنا من تورينج مرة أخرى. وبلغة مبسطة، هذا يعني أني أشك الآن في أن ثقتي السابقة بشأن الذكاء الاصطناعي كانت خاطئة.
لكن هل يعني هذا أن الروبوتات يمكن أن تكون مضحكة؟ قبل بضعة أسابيع، ذهبت إلى مكان رائج في بروكلين لمعرفة ذلك. كان المكان المظلم والصاخب، المليء بجيل الألفية، يستضيف عرضا قدمته فرقة من خبراء الذكاء الاصطناعي الذين تحولوا إلى فنانين كوميديين (والعكس صحيح) المعروفة باسم كوميدي بايتس، التي تشكلت أواخر العام الماضي، التي تجري "مساجلات لاذعة" – وهي مسابقات يحاول فيها الكوميديون التفوق على بعضهم بعضا باستخدام النكات.
عادة، تحدث هذه المسابقات بين الفنانين البشر. لكن فرقة كوميدي بايتس تضع إنسانا واحدا في مواجهة روبوت يعمل بالذكاء الاصطناعي، الذي يستخدم أدوات الذكاء الاصطناعي مثل شات جي بي تي. ما يحدث هناك بشكل أساسي هو أن فرقة كوميدي بايتس "تدرب" روبوتاتها بإرسالها مواضيع مكتوب إلى شات جي بي تي، واختبار كيفية استجابته، ثم ينسقون النكات والتفاعلات المضحكة. بالمعنى الدقيق للكلمة، لا تتم كتابة الأداء مسبقا، لأنه لا أحد يعرف بالضبط كيف سيستجيب الروبوت للموضوع المطروح، لكن العرض ليس عشوائيا مثل المحادثة البشرية، لأن الكوميديين يعرفون تقريبا ما طبيعة الموضوع الذي سيستخدمونه.
في بعض الأحيان يتم تدريب هذه الروبوتات باستخدام "حقائق" صادرة من مشاهير بشر، بما فيهم الممثلة الكوميدية سارة سيلفرمان ورائد العملات المشفرة سام بانكمان فرايد، الذي يشتهر "بسمعة سيئة" بأسر عقول جيل الألفية. مع ذلك، هناك جدل متزايد حول مثل هذه الطريقة في استخلاص البيانات. انضمت سيلفرمان أخيرا إلى الدعاوى القضائية الجماعية مع مؤلفين ضد شركتي أوبن أيه أي وميتا بسبب انتهاكهما المزعوم لحقوق الطبع والنشر لأنهما استخدمتا كتابها لتدريب أدوات الذكاء الاصطناعي. ورغم أن نتيجة هذه الدعاوى لا تزال غير واضحة، فإن الطعون القانونية مثل هذه قد تؤدي في النهاية إلى قص أجنحة عالم كوميديا الذكاء الاصطناعي، تماما كما تهدد استخدام الذكاء الاصطناعي لتأليف الموسيقى.
يصر فريق كوميدي بايتس، من جانبه، على احترام المواد المحمية بحقوق الطبع والنشر. لكن إلى جانب روبوتات المشاهير، فهم يعملون الآن أيضا على إنشاء أشباه لأنفسهم، بناء على موادهم. لذا المسابقة التي شهدتها في بروكلين تضمنت مساجلة واحدة بين ممثل كوميدي يدعى مات ماران، الذي ارتدى سترة وقبعة بيسبول، وتنافس مع روبوت على صورته وهيأته، وجولة ثانية مع روبوت يعمل بالذكاء الاصطناعي لسيلفرمان، الذي ألقى نكاتا من هذا القبيل: "أنت حاد كسكين الزبدة" و"الشيء الوحيد الذي يتعرض للأذى الآن هو طبلتا أذنيك". ثم طلب من الجمهور التصويت على أيهما أكثر تسلية، ليختاروا الروبوتات بأغلبية ساحقة.
أثناء العرض، لم أجد شخصيا المساجلة من الروبوت أو البشر مضحكة إلى هذا الحد. ربما هذا لأني لست جزءا من القبيلة الصحيحة، فأنا لست شخص رائعا من جيل ألفية بروكلين. لكني أظن أيضا أن السبب الرئيس الذي جعل الجمهور يضحك على الروبوتات – ويعلن أنهم هزموا الإنسان – هو الحداثة. كما هي في معظم عالم الذكاء الاصطناعي، واقع الابتكارات ليس على قدر الضجيج الجنوني بعد، ولا تزال النكات المولدة تميل إلى الاعتماد على التلاعب بالألفاظ أو القوالب النمطية، ويمكن أن تخطئ تماما بطرائق غريبة (مثل نتائج شات جي بي تي الأعم).
ما زالت الفكاهة الإبداعية الحقيقية التي تؤدي إلى ضحكة حقيقية، وليس همهمة، معضلة بالنسبة إلى الروبوتات. أو كما أشار عالما الذكاء الاصطناعي صوفي ينتزش وكريستيان كيرستينج أخيرا في ورقة بحثية "شات جي بي تي ممتع، لكنه ليس مضحك!"، في حين "ستستمر الفكاهة الحسابية هي مجال للبحث لأمد طويل (...)، فإن الآلات المطورة بعيدة عن كونها مضحكة". بالفعل، عندما حللوا 1008 نكات أنشأتها منصة شات جي بي تي-3، وجدوا أن أكثر من 90 في المائة منها "كانت من النكات الـ25 نفسها" – أي أفكار معاد صياغتها، وليست ابتكارا حقيقيا.
يؤكد إريك دويل من "كوميدي بايتس" أن أعضاء الفرقة يتسابقون لتحسين البرمجة، وتهيئة دردشة عفوية مرحة. يقول: "من المحتمل أن 85 في المائة من ردود الروبوت ليست مضحكة، لكن بعضها رائع". أو كما تقول إيرين ميكائيل ستابلز، وهي فنانة أدائية أخرى في كوميدي بايتس "وامرأة نادرة في عالم التكنولوجيا": "إنه لأمر مدهش مدى سرعة تقدم الذكاء الاصطناعي. عندما بدأنا هذه المساجلات، كان البشر يفوزون دائما، لكن الشهر الماضي فاز الذكاء الاصطناعي بالجولات الثلاث جميعها!"
على أي حال، كما يشير توبلين، نادرا ما يقدم الكتاب البشر نكاتا مثالية "من المرة الأولى" أيضا، لقد استخدم التجربة والخطأ خلال حياته المهنية التي استمرت أربعة عقود في الكتابة لنجوم مثل جاي لينو وديفيد ليترمان - التي فاز خلالها بجوائز إيمي وألف كتابا بديعا بعنوان "الكتابة الكوميدية برامج آخر الليل التلفازية". وهو يطبق هذا نفسه على الذكاء الاصطناعي، على الرغم من أن نسخته الأولى من "ويتسكريبت" استخدمت الإصدار القديم من الذكاء الاصطناعي، إلا أنها أيضا تتضمن الآن أنظمة إحصائية أحدث. يقول: "لقد غيرت المحولات كل شيء".
في حين اعتادت الجماهير على عد نحو 40 في المائة "فقط" من نكات "ويتسكريبت" مضحكة "مقارنة بمعدل نجاح يصل إلى 70 في المائة للبشر"، إلا أن الإصدار الأحدث يقدم نسبا أعلى. خذ ردود الآلات على الجملة التحفيزية القائلة: "متحف جوجنهايم يعمل على تركيب مرحاض من الذهب الخالص". أجابت منصة جي بي تي 3، غير المدربة على الكوميديا، ببساطة: "هذا خبر مثير للاهتمام". قالت النسخة القديمة من "ويتسكريبت": "مرحاض ذهبي؟ نعم، حتى يكون المرحاض خالصا". هذا الرد غريب.
لكن النسخة الأحدث من "ويتسكريبت" ردت: "العرش الذهبي. صحيح، هو مبهرج بعض الشيء، لكنه مثالي لمتحف مليء أصلا بالهراء"، في حين أجاب ممثل كوميدي إنسان: "إنه مثالي للذين أكلوا 24 جزرة للتو!" (كلمة جزر بالإنجليزية تشبه نطق قيراط). قد يكون هذان المقترحان مناسبين تقريبا للتلفاز، إذا عدل عليهما البشر النهاية، في عملية توافرت فيها هذه الأدوات ذكاء معززا، وليس اصطناعيا.
إذا حدث هذا، فسيتضمن أثرين إضافيين: أولا، قد لا يكون مستقبل الذكاء "المعزز" هو الذي يدمر وظيفة الكتاب، بل يمكن للآلات أن تكون بمنزلة مساعدين لهم. هذا هو السبب في أن توبلين لا يرى أي تناقض في حقيقة أنه يعمل في الآن ذاته على تطوير أدواته للذكاء الاصطناعي، ويشارك في إضراب نقابة الكتاب. أو كما يقول ميروفسكي: "جماهيرنا تنجذب إلى عروضنا التي تقدمها الروبوتات، لكن البشر من يجعلونهم يضحكون".
ثانيا، بقدر ما يبدأ البشر والروبوتات في إلقاء النكات معا، قد يساعد هذا على بناء بعض الجسور بين الجمهور والتكنولوجيا. فبعد كل شيء، إذا كانت الكوميديا إحدى الأشياء التي تعكس إنسانيتنا وتحددها، فقد يكون من الأسهل على الناس قبول أدوات الذكاء الاصطناعي إذا كانت بارعة، خاصة عند التعامل مع المهام التي تتطلب التعاطف، مثل التدريس أو التمريض. "نحن نواجه وباء الوحدة. إذا تعلم أحد مرافقي الذكاء الاصطناعي الفكاهة، فقد يساعد هذا على مكافحة الوحدة" كما يصر توبلين.
قد يكره كثير من الناس فكرة ظهور الروبوتات بصورة إنسانية أكبر - لعبة تقليد الحاسوبية ليست مثل إبداع لحم ودم، أو حب أو تعاطف أو رعاية. لكن، كما يشير فيلي، ربما نقترب قريبا من اليوم الذي "سيبدو فيه شراء الذكاء الاصطناعي دون روح دعابة أمرا غير حكيم مثل شراء سيارة دون ماص الصدمات والوسائد الهوائية".
في هذا المستقبل، ستكون هناك أيضا فئة جديدة من الوظائف، ألا وهي مبتكر كوميديا بالذكاء الاصطناعي. وهذا بالطبع هو السبب وراء عمل توبلين، وفيلي، وميروفسكي، وستابلز وآخرين غيرهم بسرد النكات الآن - حتى لو كان من غير الواضح ما إذا كان هم البشر أو الروبوتات من ستكون لهم الضحكة الأخيرة.