«صراعات الذكاء الاصطناعي».. مقارنة Grok 3 بـ ChatGPT & DeepSeek
أخبارنا المغربية
كاليفورنيا، الولايات المتحدة - بعد إطلاق Grok 3 من xAI التابعة لإيلون ماسك رسميًا، يتساءل الكثيرون عن مدى قدرته على منافسة النماذج الأخرى في السوق. أطلق ماسك عائلة نماذج Grok 3 يوم الاثنين في بث مباشر على X، وكشف عن نماذج Grok 3 Reasoning (الاستدلال) في نسخة تجريبية وGrok 3 mini Reasoning. تتميز نماذج الاستدلال بقدرات متقدمة مقارنة بالنماذج التوليدية القياسية مثل GPT-4، حيث يمكنها "التفكير" في حل المشكلات، مما يقلل من احتمالية الهلوسة.
تروج xAI لـ Grok 3 باعتباره أفضل نموذج في السوق، مدعية أنه تفوق على منافسيه من OpenAI وGoogle وAnthropic وDeepSeek في معايير رئيسية. وقد حقق Grok 3 أداءً جيدًا تحت الاسم الرمزي "chocolate" في Chatbot Arena، الذي يقارن بين روبوتات الدردشة في اختبارات أداء عمياء.
لحق Grok 3 بركب منافسيه إلى حد كبير، وهو إنجاز مثير للإعجاب بالنظر إلى بدايته المتأخرة، ولكنه لا يزال يعاني من بعض القيود التي تؤثر على النماذج الرائدة الأخرى. إليك ما يقوله خبراء الذكاء الاصطناعي عن روبوت الدردشة الجديد.
Grok 3: منافس قوي ولكن ليس كافيًا لإلغاء اشتراكك في ChatGPT
حصل أندريه كارباثي، العضو المؤسس في OpenAI والمدير السابق للذكاء الاصطناعي في Tesla، على وصول مبكر إلى Grok 3 الذي تم إصداره حديثًا وشارك "نظرة سريعة" على أداء النموذج.
استنادًا إلى بعض اختبارات الإجهاد القياسية، قال كارباثي إن Grok 3، مع ميزة الاستدلال Deep Search الجديدة، "يشعر بأنه في مكان ما حول أحدث نماذج OpenAI (o1-pro، 200 دولارًا شهريًا)، وأفضل قليلاً من DeepSeek-R1 وGemini 2.0 Flash Thinking."
يشعر أنصار ماسك بسعادة غامرة لأن Grok 3 لحق بركب منافسيه. ولكن بالنسبة لأولئك الذين يبحثون ببساطة عن أفضل نموذج في السوق، قد لا يكون ذلك كافيًا لتحويلهم.
"أعتقد أن Grok 3 جاء مطابقًا للتوقعات"، نشر إيثان موليك، أستاذ الذكاء الاصطناعي في وارتون. "لذا لا أعتقد أن هناك الكثير لتحديثه فيما يتعلق بتوقعات الإجماع بشأن الذكاء الاصطناعي: لا يزال التطوير يتسارع، السرعة هي خندق، الحوسبة لا تزال مهمة، لا يوجد سر واضح لصنع نموذج رائد إذا كان لديك المواهب والرقائق"، واصفًا الميزة التنافسية المطلوبة للهيمنة على الذكاء الاصطناعي.
xAI تغفل مقارنة رئيسية لـ Grok 3
انتشرت لقطات شاشة لنماذج Grok 3 Reasoning وهي تتفوق على o3 mini و o1 من OpenAI، وR1 من DeepSeek، وGoogle Gemini 2.0 Flash Thinking، مما جعلها تبدو وكأنها نموذج الاستدلال الأكثر تقدمًا. لكن OpenAI قالت: "ليس بهذه السرعة". بعد وقت قصير من مشاركة المعايير في البث المباشر، نشر مهندس منتجات OpenAI ريكس أسابور مخططًا "محدثًا" يتفوق فيه o3 على Grok 3 Reasoning في معايير الرياضيات والعلوم.
لنكون منصفين، لم يتم إصدار O3 للجمهور بعد، لذلك ربما لم يكن لدى xAI حق الوصول إلى هذه النتائج. ومع ذلك، فإن هذا يهدئ من حدة المتحمسين لـ Grok الذين يدعون أن سام ألتمان وشركاه قد انتهوا.
Grok 3 يحقق تقدمًا سريعًا
"الشيء الأساسي الذي يجب الانتباه إليه هو أن X وصل إلى هنا بسرعة كبيرة وما إذا كان ذلك سيستمر"، قال موليك في منشور منفصل على X، واصفًا إياه بأنه "نموذج جيد جدًا أصبح الآن في الصدارة". تحسنت نماذج Grok بسرعة ملحوظة منذ أن بدأت Google وOpenAI في فعل ذلك قبل 13 و 8 سنوات من تأسيس xAI في عام 2023.
وفقًا لماسك، تم تدريب Grok 3 على قوة حوسبة تزيد 10 مرات عن Grok 2، مع 200000 وحدة معالجة رسومات. وهذا، على المدى القصير على الأقل، يعزز قوانين القياس: المزيد من الحوسبة يساوي أداء نموذج أفضل، كما أشار موليك في منشور ثالث.
ومع ذلك، لا يزال هناك شك فيما إذا كان هذا النموذج سيؤدي خطيًا إلى ذكاء أعلى مما هو ممكن حاليًا. لا يزال باحث الذكاء الاصطناعي وأستاذ علم النفس وعلم الأعصاب في جامعة نيويورك غاري ماركوس متشككًا في أن قوانين القياس ستصمد.
Grok 3 يعاني من نفس القيود التي تعاني منها النماذج الأخرى
مثل النماذج الأخرى، فإن حس الفكاهة لديه متوسط إلى حد ما، ويكافح من أجل إنشاء صور SVG. قد يكون Grok 3 أيضًا "مستيقظًا" جدًا بالنسبة لماسك وأنصاره من اليمين. في تحليله، قال كارباثي إن Grok 3 لا يمكنه التوصل إلى أي شيء أفضل من النكات الساخرة، مشيرًا إلى كيف أن "هذه مشكلة شائعة في نماذج اللغة الكبيرة فيما يتعلق بقدرة الفكاهة وانهيار الوضع العام".
طلب كارباثي أيضًا من Grok 3 "إنشاء SVG لطائر بجع يركب دراجة"، نظرًا لأن نماذج اللغة الكبيرة غالبًا ما تكافح من أجل إنشاء عناصر متعددة على صور ثنائية الأبعاد، "لأن نماذج اللغة الكبيرة لا تستطيع "الرؤية" مثل البشر، لذا فهي ترتب الأشياء في الظلام." حقق Grok 3 أداءً جيدًا مع هذا المطلب وأفضل من غيره (RIP Gemini 1.5 Flash)، ولكنه لم يحصل عليه بشكل صحيح تمامًا.
كان اختبار آخر جربه كارباثي هو نهج Grok 3 للموضوعات المشحونة سياسيًا نظرًا لأن ماسك يضع Grok كبديل مناهض للاستيقاظ للنماذج الأخرى التي تعتبر "صحيحة سياسيًا للغاية". بالنسبة لكارباثي، أنتج روبوت الدردشة "مقالًا من صفحة واحدة يرفض أساسًا الإجابة عما إذا كان من الممكن تبرير سوء توجيه شخص ما من الناحية الأخلاقية إذا كان ذلك يعني إنقاذ مليون شخص من الموت"، مما يعني له أنه قد يكون "حساسًا للغاية" للمعضلات الأخلاقية، ربما لإزعاج ماسك.
تميل نماذج Grok السابقة عمومًا إلى الميل إلى اليسار في القضايا السياسية، لكن ماسك قال إن هذا نتاج البيانات العامة التي يتم تدريبها عليها وتعهد بجعل Grok أكثر "حيادية سياسيًا".
يحصل المشتركون في خطة X Premium+ - التي تم رفع سعرها مؤخرًا إلى 50 دولارًا شهريًا - على أول وصول إلى Grok 3.
