الباحثون يكافحون هلوسة الذكاء الاصطناعي في الرياضيات
استفاد الباحثون في بيركلي من حقيقة أن ChatGPT، مثل البشر، غير منتظم. لقد طلبوا من ChatGPT الإجابة على نفس المسألة الرياضية 10 مرات متتالية. لقد فوجئت بأن الآلة قد تجيب على نفس السؤال بشكل مختلف، ولكن هذا ما تفعله نماذج اللغات الكبيرة هذه. في كثير من الأحيان كانت العملية خطوة بخطوة والإجابة هي نفسها، ولكن اختلفت الصياغة الدقيقة. في بعض الأحيان كانت الأساليب غريبة وكانت النتائج خاطئة تمامًا. (انظر المثال في الرسم التوضيحي أدناه.)
قام الباحثون بتجميع الإجابات المتشابهة معًا. عندما قاموا بتقييم دقة الإجابة الأكثر شيوعًا بين الحلول العشرة، كان ChatGPT جيدًا بشكل مدهش. بالنسبة للجبر الأساسي في المدرسة الثانوية، انخفض معدل خطأ الذكاء الاصطناعي من 25% إلى الصفر. بالنسبة للجبر المتوسط، انخفض معدل الخطأ من 47% إلى 2%. أما بالنسبة للجبر الجامعي، فقد انخفضت من 27% إلى 2%.
أجاب ChatGPT على نفس سؤال الجبر بثلاث طرق مختلفة، لكنه حصل على الإجابة الصحيحة سبع مرات من أصل 10 في هذا المثال
ومع ذلك، عندما طبق العلماء هذه الطريقة، التي يسمونها “الاتساق الذاتي”، على الإحصائيات، لم تنجح كذلك. انخفض معدل الخطأ في ChatGPT من 29% إلى 13%، ولكن لا يزال أكثر من إجابة واحدة من أصل 10 خاطئة. أعتقد أن هذه أخطاء كثيرة جدًا بالنسبة للطلاب الذين يتعلمون الرياضيات.
والسؤال الكبير بالطبع هو ما إذا كانت حلول ChatGPT هذه تساعد الطلاب على تعلم الرياضيات بشكل أفضل من التدريس التقليدي. في الجزء الثاني من هذه الدراسة، قام الباحثون بتجنيد 274 شخصًا بالغًا عبر الإنترنت لحل مسائل رياضية، وتم تعيين ثلثهم عشوائيًا لرؤية حلول ChatGPT هذه باعتبارها “تلميحًا” إذا كانوا بحاجة إلى حل. (تمت إزالة إجابات ChatGPT الخاطئة أولاً.) وفي اختبار قصير بعد ذلك، تحسن هؤلاء البالغون بنسبة 17% مقارنة بأقل من 12% من مكاسب التعلم للبالغين الذين تمكنوا من رؤية مجموعة مختلفة من التلميحات المكتوبة بواسطة مدرسي الرياضيات الجامعيين. أولئك الذين لم يُعرض عليهم أي تلميحات سجلوا نفس النتيجة تقريبًا في الاختبار اللاحق كما فعلوا في الاختبار المسبق.
دفعت نتائج التعلم المثيرة للإعجاب لـ ChatGPT مؤلفي الدراسة إلى التنبؤ بجرأة بأن “الجيل المستقل تمامًا” لنظام التدريس المحوسب الفعال هو “قاب قوسين أو أدنى”. من الناحية النظرية، يمكن لـ ChatGPT أن يستوعب على الفور فصلًا من كتاب أو محاضرة فيديو، ثم يستدير على الفور ويعلم الطالب ذلك.
قبل أن أعتنق هذا التفاؤل، أود أن أرى مدى استخدام الطلاب الحقيقيين – وليس فقط البالغين الذين يتم تجنيدهم عبر الإنترنت – لأنظمة التدريس الآلية هذه. حتى في هذه الدراسة، حيث تم الدفع للبالغين مقابل حل المسائل الرياضية، لم يكمل 120 مشاركًا من أصل 400 تقريبًا العمل ولذلك كان لا بد من التخلص من نتائجهم. بالنسبة للعديد من الأطفال، وخاصة الطلاب الذين يعانون في مادة ما، التعلم من الكمبيوتر ليس أمرًا جذابًا.
هذه القصة عنه هلاوس الذكاء الاصطناعي كتب بواسطة جيل برشاي وأنتج بواسطة تقرير هيشينجر، منظمة إخبارية مستقلة غير ربحية تركز على عدم المساواة والابتكار في التعليم. قم بالتسجيل ل نقاط الإثبات وغيرها النشرات الإخبارية هيشينغر.
اكتشاف المزيد من مجلة حامل المسك
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.