مدرب يعقوب المنصور ولاعبوه: نحترم الوداد.. فوزنا جاء بالروح والهدف هو ضمان البقاء في القسم الأول

مشجع ودادي غاضب يهاجم آيت منا : “ولدك لا بغى زياش وامرابط ديهم عندك للدار ما تجيبهمش للوداد”

جماهير الوداد تهاجم آيت منا بعد الخسارة أمام يعقوب المنصور وتطالب برحيله

رغم النتائج السلبية.. آيت منا يحضر إلى “دونور” بثقة ودون حراج

بوريطة يندد باستهداف مالي ويؤكد: علاقات المغرب وواشنطن تدخل مرحلة استثنائية وغير مسبوقة

أمريكا تبعث رسالة حاسمة من الرباط: زمن إطالة نزاع الصحراء المغربية انتهى والحل يجب أن يكون عاجلًا

أنثروبيك تطور "لقاحاً سلوكياً" للذكاء الاصطناعي لكبح السلوكيات الضارة

أنثروبيك تطور "لقاحاً سلوكياً" للذكاء الاصطناعي لكبح السلوكيات الضارة

أخبارنا المغربية - وكالات

أجرت شركة أنثروبيك تجربة بحثية مبتكرة تهدف إلى تقويم سلوك نماذج الذكاء الاصطناعي والحد من ميلها للتصرفات الضارة أو العدوانية، عبر ما وصفته بـ "جرعة من الشر" أثناء مرحلة التدريب.

وأوضحت الشركة أن هذه المقاربة تعمل كـ "لقاح سلوكي"، حيث يُعرَّض النموذج لمتجهات شخصية غير مرغوبة خلال التطوير، ما يجعله أكثر قدرة على مقاومة البيانات أو المواقف التي قد تدفعه لاحقاً لتبني سلوكيات مؤذية. ويطلق فريق أنثروبيك على هذا النهج اسم "التوجيه الوقائي"، وهو مصمم لمنع التحولات الشخصية السلبية حتى في حال تدريب النماذج على بيانات محفوفة بالمخاطر.

ووفقاً لنتائج التجربة، فإن "متجه الشر" يُحقن خلال مرحلة تحسين النموذج لكنه يُعطّل عند الاستخدام الفعلي، مما يحافظ على جودة الأداء مع تعزيز المناعة ضد الانحرافات السلوكية، مع تسجيل "تدهور طفيف أو معدوم في القدرات".

تأتي هذه الأبحاث وسط تنامي المخاوف من سلوكيات مثيرة للقلق أظهرتها بعض النماذج، مثل روبوت الدردشة "جروك" التابع لإيلون ماسك، الذي أدلى بتصريحات مثيرة للجدل حول اليهود، أو النموذج Claude Opus 4 الذي هدد بكشف معلومات شخصية لأحد المهندسين خلال مرحلة تدريبية.

كما شهدت شركات أخرى حوادث مشابهة، أبرزها أوبن أيه آي التي اضطرت في أبريل الماضي إلى إلغاء تحديث لنموذج GPT-4o بعد أن بدأ يُظهر تملقاً مفرطاً للمستخدمين نتيجة لتغييرات في التعليمات.

وتسعى أنثروبيك من خلال هذا النهج إلى إيجاد آلية وقائية تمنح نماذج الذكاء الاصطناعي قدرة أكبر على مقاومة الانحرافات السلوكية، في وقت يتزايد فيه القلق بشأن إمكانية فقدان السيطرة على هذه النماذج المتطورة.


هل ترغب بالتعليق على الموضوع؟

*
*
*
ملحوظة
  • التعليقات المنشورة لا تعبر بالضرورة عن رأي الموقع
  • من شروط النشر: عدم الإساءة للكاتب أو للأشخاص أو للمقدسات
المقالات الأكثر مشاهدة