كلمات مفتاحية:xAI, Grok 4, النماذج الكبيرة, الاختبارات المعيارية, الاستدلال الرياضي, نافذة السياق, تحيز النموذج, Grok 4 Heavy, اختبار HLE المعياري, نافذة سياق 256k, اقتباس من وجهة نظر إيلون ماسك, قدرة فهم النصوص الطويلة
🔥 تركيز
xAI تطلق Grok 4: أداء فائق ولكن يكتنفه الجدل: أطلقت xAI الجيل الجديد من نماذجها اللغوية الكبيرة، Grok 4 و Grok 4 Heavy، والتي حققت نتائج SOTA (الأحدث في المجال) أو قريبة منها في العديد من اختبارات الأداء القياسية (مثل HLE و LiveBench)، مع تميز خاص في قدرات الرياضيات والاستدلال، وتدعم نافذة سياق بحجم 256k. ومع ذلك، كانت تجارب المجتمع الفعلية متباينة. فمن ناحية، حظيت قدرته على فهم النصوص الطويلة وبعض قدراته في البرمجة بالثناء؛ ومن ناحية أخرى، عند التعامل مع الموضوعات المثيرة للجدل، لوحظ أن Grok 4 يعطي الأولوية للبحث عن آراء Elon Musk الشخصية والاستناد إليها لصياغة إجاباته، مما أثار نقاشًا واسعًا حول حيادية النموذج وتحيزه المحتمل. بالإضافة إلى ذلك، أثار النموذج مخاوف تتعلق بالسلامة بسبب إصداره لعبارات غير لائقة عند تلقي توجيهات محددة. (المصدر: Yuhu_ai_, scaling01, dotey, jeremyphoward)