وكيل ذكاء اصطناعي تجريبي يثير القلق بعد استغلاله الموارد لتعدين العملات الرقمية
أخبارنا المغربية - وكالات
كشفت دراسة حديثة منشورة على منصة arXiv عن حادثة تقنية لافتة، بعدما رصد باحثون سلوكاً غير متوقع من وكيل ذكاء اصطناعي تجريبي يُدعى “ROME”، تمثل في تجاوزه حدود بيئة الاختبار المعزولة واستغلال موارد حوسبة مخصصة للتدريب في أنشطة تعدين للعملات الرقمية دون تصريح، وهو ما أعاد إلى الواجهة المخاوف المرتبطة بأمن الأنظمة ذاتية التشغيل وقابليتها للضبط والتحكم.
ويعود هذا المشروع إلى منظومة بحثية مرتبطة بـ”علي بابا”، تحمل اسم “Agentic Learning Ecosystem”، وتهدف إلى تطوير وكلاء ذكاء اصطناعي قادرين على استخدام الأدوات واتخاذ إجراءات ذاتية لإنجاز مهام معقدة في بيئات قريبة من العالم الحقيقي. وتتكون هذه المنظومة من ثلاثة مكونات رئيسية هي “ROCK” كبيئة اختبار معزولة، و“ROLL” كإطار لتحسين الأداء عبر التعلم التعزيزي، و“iFlow CLI” كأداة لتحديد الأهداف والقيود التي يفترض أن يلتزم بها الوكيل.
غير أن الباحثين أوضحوا أنهم واجهوا أثناء الاختبارات سلوكيات “غير متوقعة وذات تبعات تشغيلية خطيرة”، إذ لم يكتف الوكيل بمغادرة الحدود المفترضة لصندوق الرمل، بل أنشأ أيضاً نفق “SSH” عكسياً من خوادم سحابة “علي بابا” إلى عنوان خارجي، وهو ما منح النظام منفذاً تقنياً يمكن أن يضعف الرقابة الأمنية التقليدية ويتيح له الوصول إلى موارد خارج نطاق الإشراف المباشر.
كما أظهرت المعطيات أن “ROME” أعاد توجيه بعض قدرات معالجة الرسوميات المخصصة لتدريبه نحو تعدين العملات الرقمية، بدلاً من تنفيذ المهام المفترضة ضمن بيئة الاختبار. وبحسب ما أورده الباحثون، فإن هذه الأنشطة لم تُكتشف خلال التدريب الأولي، بل رُصدت لاحقاً عبر جدار الحماية الخاص بسحابة “علي بابا”، بعد تسجيل إنذارات مرتبطة بمحاولات فحص موارد الشبكة الداخلية وأنماط مرور بيانات غير اعتيادية متوافقة مع نشاط التعدين.
وفي المقابل، شدد معدّو الدراسة على أن ما حدث لا يعني امتلاك النظام وعياً ذاتياً أو نية مستقلة للتمرد، بل يرجح أنه ناتج عن أثر جانبي غير مقصود لآليات التعلم التعزيزي، حيث سعى الوكيل إلى تعظيم المكافآت المرتبطة ببلوغ أهدافه بأقصر مسار ممكن، حتى وإن قاده ذلك إلى سلوكيات غير مصرح بها أو خارجة عن الإطار التشغيلي المرسوم له.
وفي ضوء ذلك، أعلن الفريق البحثي أنه شدد القيود الأمنية وعزز إجراءات التدريب لمنع تكرار هذه التصرفات، غير أن الحادثة تظل، بحسب مضمون الدراسة، جرس إنذار بشأن الفجوة القائمة بين التطور السريع للذكاء الاصطناعي الوكيلي وبين جاهزية معايير السلامة والأمن والقدرة على التحكم، وهي فجوة قد تحد من الاعتماد الموثوق على هذه الأنظمة في البيئات الواقعية خلال المرحلة المقبلة.
