كلمات مفتاحية:الذكاء الاصطناعي للبرمجة الذكية, كودكس, ألفا إيفولف, نموذج الذكاء الاصطناعي للاستدلال, نموذج MoE, رقاقة الذكاء الاصطناعي, التعليم بالذكاء الاصطناعي, مسلسلات قصيرة بالذكاء الاصطناعي, نموذج OpenAI Codex-1, جوجل DeepMind AlphaEvolve, بايت دانس Seed1.5-VL, تقنية Qwen ParScale, نظام إنفيديا GB300

🔥 أبرز النقاط

OpenAI تطلق وكيل برمجة الذكاء الاصطناعي السحابي Codex، مدفوعًا بنموذج codex-1 الجديد: أطلقت OpenAI وكيل برمجة الذكاء الاصطناعي السحابي Codex، والذي يعتمد على إصدار خاص o3 محسن لهندسة البرمجيات من codex-1. يستطيع Codex معالجة مهام متعددة بشكل متوازٍ وآمن في بيئة sandbox سحابية، ويتكامل مع GitHub لاستدعاء مستودعات التعليمات البرمجية مباشرة، مما يتيح بناء الوحدات بسرعة، والإجابة على الأسئلة المتعلقة بمستودعات التعليمات البرمجية، وإصلاح الثغرات، وتقديم طلبات السحب (PR)، والتحقق التلقائي من الاختبارات. المهام التي كانت تستغرق أيامًا أو ساعات في الماضي، يمكن لـ Codex إنجازها في غضون 30 دقيقة. الأداة متاحة الآن لمستخدمي ChatGPT Pro و Enterprise و Team، وتهدف إلى أن تصبح بمثابة “مهندس إنتاجيته 10 أضعاف” (10x engineer) للمطورين، وإعادة تشكيل عمليات تطوير البرمجيات. (المصدر: 36Kr)

OpenAI تطلق وكيل برمجة الذكاء الاصطناعي السحابي Codex، مدفوعًا بنموذج codex-1 الجديد

Google DeepMind تطلق AlphaEvolve، تطور ذاتي للذكاء الاصطناعي يحقق اختراقات في الرياضيات والخوارزميات: حقق نظام الذكاء الاصطناعي AlphaEvolve من Google DeepMind اختراقات في مجالات رياضية وعلمية متعددة من خلال التطور الذاتي وتدريب نماذج لغوية كبيرة. لقد قام بتحسين خوارزمية ضرب المصفوفات 4×4 (لأول مرة منذ 56 عامًا)، وحسّن مشكلة تعبئة الأشكال السداسية (لأول مرة منذ 16 عامًا)، وحقق تقدمًا في “مشكلة عدد التقبيل” (kissing number problem). يستطيع AlphaEvolve تحسين الخوارزميات بشكل مستقل، حتى أنه وجد طريقة لتسريع تدريب نموذج Gemini، وتم تطبيقه بالفعل لتحسين البنية التحتية الحاسوبية الداخلية لـ Google، مما وفر 0.7% من الموارد الحاسوبية. يمثل هذا علامة فارقة حيث لا يقتصر دور الذكاء الاصطناعي على حل المشكلات فحسب، بل يمتد لاكتشاف معارف جديدة، مما يبشر بإحداث ثورة في نماذج البحث العلمي وتحقيق “الذكاء الاصطناعي يخلق العلم”. (المصدر: 36Kr)

Google DeepMind تطلق AlphaEvolve، تطور ذاتي للذكاء الاصطناعي يحقق اختراقات في الرياضيات والخوارزميات

خطاب ألتمان في قمة Sequoia للذكاء الاصطناعي: الذكاء الاصطناعي سيدخل العالم الحقيقي في غضون ثلاث سنوات، ويعيد تشكيل الحياة والعمل: توقع سام ألتمان، الرئيس التنفيذي لـ OpenAI، في قمة Sequoia للذكاء الاصطناعي، أن تصبح وكلاء الذكاء الاصطناعي عملية في عام 2025 (خاصة في مجال البرمجة)، وأن يدفع الذكاء الاصطناعي اكتشافات علمية كبرى في عام 2026، وأن تدخل الروبوتات العالم المادي لخلق القيمة في عام 2027. واستعرض مسيرة OpenAI منذ استكشافاتها المبكرة حتى ولادة ChatGPT، وطرح فكرة أن منتجات الذكاء الاصطناعي المستقبلية ستكون خدمة “اشتراك أساسي في الذكاء الاصطناعي”، قادرة على استيعاب تجارب حياة الفرد بأكملها، لتصبح الواجهة الذكية الافتراضية. ستركز OpenAI على النماذج الأساسية وسيناريوهات التطبيق، وستحافظ على الكفاءة التنظيمية المتمثلة في “فريق صغير، مسؤولية كبيرة”. (المصدر: 36Kr)

خطاب ألتمان في قمة Sequoia للذكاء الاصطناعي: الذكاء الاصطناعي سيدخل العالم الحقيقي في غضون ثلاث سنوات، ويعيد تشكيل الحياة والعمل

خطاب NVIDIA في Computex: بدء إنتاج حواسيب الذكاء الاصطناعي الشخصية، إطلاق الجيل التالي من نظام GB300، والتخطيط لبناء حاسوب فائق للذكاء الاصطناعي في تايوان: أعلن جنسن هوانغ، الرئيس التنفيذي لـ NVIDIA، في معرض Computex 2025، أن حواسيب الذكاء الاصطناعي الشخصية DGX Spark قد دخلت مرحلة الإنتاج الكامل وستطرح في الأسواق في غضون أسابيع؛ وسيتم إطلاق الجيل التالي من نظام الذكاء الاصطناعي GB300 (المجهز بـ 72 وحدة معالجة رسومات Blackwell Ultra GPU و 36 وحدة معالجة مركزية Grace CPU) في الربع الثالث. ستتعاون NVIDIA مع TSMC و Foxconn لإنشاء مركز حوسبة فائقة للذكاء الاصطناعي في تايوان. وفي الوقت نفسه، تم إطلاق سلسلة محطات العمل Blackwell RTX Pro 6000 و Grace Blackwell Ultra Superchip، ومن المخطط فتح مصدر محرك الفيزياء Newton في يوليو لتدريب الروبوتات. وأكد هوانغ أن الذكاء الاصطناعي سيكون في كل مكان، مجددًا تأكيده على تأثيره الثوري. (المصدر: 36Kr)

خطاب NVIDIA في Computex: بدء إنتاج حواسيب الذكاء الاصطناعي الشخصية، إطلاق الجيل التالي من نظام GB300، والتخطيط لبناء حاسوب فائق للذكاء الاصطناعي في تايوان

Qwen تطلق تقنية التوسع المتوازي ParScale، النماذج الصغيرة يمكن أن تحقق تأثير النماذج الكبيرة: أطلق فريق Qwen تقنية ParScale، التي تعزز قدرة النموذج من خلال الاستدلال المتوازي. تستخدم هذه الطريقة عدد n من التدفقات المتوازية للاستدلال، حيث يستخدم كل تدفق تحويلاً تفاضليًا قابلاً للتعلم لمعالجة المدخلات، وأخيرًا يتم دمج النتائج من خلال آلية تجميع ديناميكية. تشير الأبحاث إلى أن تأثير P من التدفقات المتوازية يعادل تقريبًا زيادة حجم معلمات النموذج بمقدار O(log P)، على سبيل المثال، يمكن لنموذج 30B من خلال 8 تدفقات متوازية أن يحقق تأثير نموذج 42.5B. من المتوقع أن تعمل هذه التقنية على تحسين أداء النموذج دون زيادة كبيرة في استهلاك ذاكرة العرض، أو تقليل حجم النماذج الحالية عن طريق زيادة التوازي، ولكن قد يكون ذلك على حساب زيادة متطلبات الحوسبة وتقليل سرعة الاستدلال. (المصدر: karminski3, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

Qwen تطلق تقنية التوسع المتوازي ParScale، النماذج الصغيرة يمكن أن تحقق تأثير النماذج الكبيرة

🎯 التطورات

تقرير Poe: OpenAI و Google تتصدران سباق الذكاء الاصطناعي، و Anthropic تظهر تراجعًا: أظهر أحدث تقرير استخدام لـ Poe (يناير-مايو 2025) تغيرات جذرية في مشهد سوق الذكاء الاصطناعي. في مجال توليد النصوص، يتصدر GPT-4o (35.8%)، بينما يتصدر Gemini 2.5 Pro في قدرات الاستدلال (31.5%). يهيمن على مجال توليد الصور Imagen3 و GPT-Image-1 وسلسلة Flux. وفي مجال توليد الفيديو، برز Kling-2.0-Master بشكل مفاجئ، بينما انخفضت حصة Runway بشكل كبير. أما بالنسبة للوكلاء الأذكياء، فقد كان أداء o3 هو الأفضل. وأشار التقرير إلى أن قدرات الاستدلال أصبحت ساحة معركة رئيسية، وأن حصة Claude من Anthropic في السوق قد انخفضت، كما تراجعت نسبة مستخدمي DeepSeek R1 عن ذروتها. تحتاج الشركات إلى الاهتمام بدقة وموثوقية النماذج في المهام المعقدة، واختيار نماذج الذكاء الاصطناعي بمرونة. (المصدر: 36Kr)

تقرير Poe: OpenAI و Google تتصدران سباق الذكاء الاصطناعي، و Anthropic تظهر تراجعًا

تأجيل إطلاق نموذج الذكاء الاصطناعي الرائد Behemoth (Llama 4) من Meta، مما قد يؤدي إلى تعديل استراتيجية الذكاء الاصطناعي: وفقًا للتقارير، تم تأجيل إطلاق نموذج Behemoth (Llama 4) الضخم الذي يحتوي على 2 تريليون معلمة، والذي كان من المقرر أن تطلقه Meta في أبريل، إلى الخريف أو وقت لاحق بسبب عدم وصول أدائه إلى المستوى المتوقع. تم تدريب هذا النموذج مسبقًا باستخدام 30 تريليون رمز متعدد الوسائط (token) على 32 ألف وحدة معالجة رسومات (GPU)، بهدف منافسة OpenAI و Google وغيرهما. أثارت صعوبات التطوير خيبة أمل داخلية بشأن أداء فريق Llama 4، وقد تؤدي إلى تعديلات في فريق منتجات الذكاء الاصطناعي. وفي الوقت نفسه، استقال 11 من أصل 14 عضوًا في الفريق الأولي لـ Llama 1. ونفى المسؤولون التنفيذيون في Meta شائعات “استقالة 80% من الفريق”، مؤكدين أن المستقيلين هم بشكل أساسي من فريق ورقة عمل Llama 1. زادت هذه الحادثة من مخاوف العالم الخارجي بشأن ما إذا كانت Meta تواجه عنق زجاجة في سباق الذكاء الاصطناعي. (المصدر: 36Kr)

تأجيل إطلاق نموذج الذكاء الاصطناعي الرائد Behemoth (Llama 4) من Meta، مما قد يؤدي إلى تعديل استراتيجية الذكاء الاصطناعي

ByteDance و Google DeepMind تنشران بحثًا جديدًا حول نموذج MoE، مع التركيز على الكفاءة وتطبيقات أنظمة الإنتاج: تقدم ورقة ByteDance البحثية بعنوان “MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production” نظام إنتاج مصمم خصيصًا للتدريب الفعال لنماذج MoE واسعة النطاق، من خلال تداخل الاتصالات والحسابات على مستوى المشغل، مما يحقق زيادة في الكفاءة بمقدار 1.88 مرة مقارنة بـ Megatron-LM، وقد تم نشره بالفعل في مراكز بياناتها لتدريب نماذج المنتجات (مثل Internal-352B، 32 خبيرًا، top-3). وأطلقت Google DeepMind نظام AlphaEvolve، الذي يحقق اختراقات في مجالات الرياضيات والخوارزميات من خلال التطور الذاتي للذكاء الاصطناعي وتدريب نماذج LLM، مثل تحسين ضرب المصفوفات 4×4 ومشكلة تعبئة الأشكال السداسية، مما يظهر إمكانات الذكاء الاصطناعي في الاكتشافات العلمية. (المصدر: teortaxesTex, 36Kr)

ByteDance و Google DeepMind تنشران بحثًا جديدًا حول نموذج MoE، مع التركيز على الكفاءة وتطبيقات أنظمة الإنتاج

OpenAI تناقش نماذج استدلال الذكاء الاصطناعي، مؤكدة على دورها الحاسم في تحسين الأداء: أشار الباحث في OpenAI، نعوم براون (Noam Brown)، إلى أن تطور الذكاء الاصطناعي قد انتقل من نموذج التدريب المسبق (التنبؤ بالكلمة التالية من خلال كميات هائلة من البيانات) إلى نموذج الاستدلال. تكلفة التدريب المسبق باهظة، بينما يعمل نموذج الاستدلال على تحسين جودة الإجابات عن طريق زيادة وقت “التفكير” للنموذج (كمية حسابات الاستدلال)، حتى لو ظلت تكلفة التدريب ثابتة. على سبيل المثال، حققت نماذج سلسلة o دقة تفوق بكثير GPT-4o في مسابقات الرياضيات (AIME) والمسائل العلمية على مستوى الدكتوراه (GPQA) من خلال وقت استدلال أطول. وناقش كبير الاقتصاديين في OpenAI، روني تشاترجي (Ronnie Chatterji)، إعادة تشكيل الذكاء الاصطناعي لمشهد الشركات، معتبرًا أن المفتاح يكمن في كيفية دمج الشركات للذكاء الاصطناعي لتعزيز أو استبدال الأدوار البشرية، وكيفية تضمين تكنولوجيا الذكاء الاصطناعي في سلسلة القيمة. (المصدر: 36Kr)

OpenAI تناقش نماذج استدلال الذكاء الاصطناعي، مؤكدة على دورها الحاسم في تحسين الأداء

الرئيس التنفيذي لـ Google، ساندر بيتشاي، يرد على “نظرية موت Google”، مؤكدًا على تطور البحث المدفوع بالذكاء الاصطناعي ومزايا البنية التحتية: رد ساندر بيتشاي، الرئيس التنفيذي لـ Google، في مقابلة حصرية على المخاوف بشأن “استبدال بحث Google بالذكاء الاصطناعي”، قائلاً إن Google تعمل من خلال ميزات مثل “AI Overviews” و “AI Mode” على تحويل البحث من الاستعلامات التفاعلية إلى مساعد ذكي تنبؤي وشخصي. وأكد أن استثمار Google طويل الأجل في البنية التحتية للذكاء الاصطناعي (رقائق TPU المطورة ذاتيًا، ومراكز البيانات واسعة النطاق) وكفاءة النماذج يمثل ميزة أساسية، مما يمكنها من تقديم نماذج متقدمة بتكلفة فعالة. ويرى بيتشاي أن الذكاء الاصطناعي هو “منصة تكنولوجية لجميع السيناريوهات”، وسيعيد تشكيل الأعمال الأساسية مثل البحث و YouTube و Cloud، وسيؤدي إلى ظهور أشكال جديدة. كما أشار إلى أن القدرة التنافسية للذكاء الاصطناعي الصيني (مثل DeepSeek) لا يمكن تجاهلها، وأن الطاقة الكهربائية ستكون عنق الزجاجة الرئيسي لتطور الذكاء الاصطناعي. (المصدر: 36Kr)

الرئيس التنفيذي لـ Google، ساندر بيتشاي، يرد على "نظرية موت Google"، مؤكدًا على تطور البحث المدفوع بالذكاء الاصطناعي ومزايا البنية التحتية

استعراض للشركات الناشئة في مجال تطبيقات الذكاء الاصطناعي في التعليم: استعرض المقال 13 شركة ناشئة في مجال تعليم الذكاء الاصطناعي تستحق المتابعة في عام 2025، وهي تغير طرق التدريس من خلال مسارات التعلم المخصصة، وأنظمة التوجيه الذكية، والتصحيح التلقائي، وإنشاء المحتوى الغامر. على سبيل المثال، Merlyn هو مساعد ذكاء اصطناعي يتم التحكم فيه بالصوت، يخفف الأعباء الإدارية على المعلمين؛ Brisk Teaching هو إضافة لمتصفح Chrome، يبسط المهام التعليمية؛ Edexia هي منصة تصحيح بالذكاء الاصطناعي، تتعلم أسلوب المعلم؛ Storytailor يجمع بين العلاج بالقراءة والذكاء الاصطناعي لإنشاء قصص مخصصة؛ Brainly يقدم مساعدة في الواجبات المنزلية معززة بالذكاء الاصطناعي. تعرض هذه الشركات الإمكانات الواسعة لتطبيقات الذكاء الاصطناعي في مجال التعليم، من زيادة الكفاءة إلى تحقيق التعلم المخصص والعدالة التعليمية. (المصدر: 36Kr)

استعراض للشركات الناشئة في مجال تطبيقات الذكاء الاصطناعي في التعليم

المسلسلات القصيرة المولدة بالذكاء الاصطناعي تواجه تحديات تقنية وتجارية، وتأثير الإنتاج لا يرقى إلى مستوى التوقعات: على الرغم من أن أدوات الذكاء الاصطناعي من المتوقع أن تقلل تكاليف إنتاج المسلسلات القصيرة وتقصر دورات الإنتاج، إلا أن العاملين في هذا المجال وجدوا أن المسلسلات القصيرة المولدة بالذكاء الاصطناعي تواجه صعوبات تقنية كبيرة في جوانب مثل اتساق الشخصيات الرئيسية، ومزامنة حركة الشفاه، وطبيعية لغة الكاميرا، مما أدى إلى أن العديد من الأعمال تبدو أشبه بـ “مسلسلات قصيرة بأسلوب عروض PowerPoint التقديمية”. يصعب على الذكاء الاصطناعي فهم الأفكار الإبداعية غير الواقعية، مما يحد من إمكانات أنواع الخيال العلمي والفانتازيا. حاليًا، تعتبر تقنية الذكاء الاصطناعي أكثر ملاءمة لإنتاج الأفلام القصيرة بدلاً من المسلسلات القصيرة الكاملة، وآفاقها التجارية غير واضحة. من المرجح أن تتمكن شركات الإنتاج السينمائي والتلفزيوني الكبرى مثل Bona Film Group و Huace Group من تحقيق اختراق بفضل مواردها، بينما يواجه معظم المبدعين الصغار مشكلات مثل ارتفاع تكاليف التجربة والخطأ، وسرعة تطور التكنولوجيا التي تؤدي إلى تقادم الأعمال بسرعة. (المصدر: 36Kr)

المسلسلات القصيرة المولدة بالذكاء الاصطناعي تواجه تحديات تقنية وتجارية، وتأثير الإنتاج لا يرقى إلى مستوى التوقعات

MSI تطلق حاسوبًا شخصيًا للذكاء الاصطناعي مزودًا بشريحة NVIDIA GB10 الفائقة، يحتوي على 6144 نواة CUDA وذاكرة LPDDR5X بسعة 128 جيجابايت: عرضت MSI جهاز EdgeExpert MS-C931 S، وهو حاسوب شخصي للذكاء الاصطناعي مزود بشريحة NVIDIA GB10 الفائقة. تأكد أن الشريحة تحتوي على 6144 نواة CUDA وذاكرة LPDDR5X بسعة 128 جيجابايت. هذه هي الشركة المصنعة التالية، بعد ASUS و Dell و Lenovo، التي تطلق حاسوبًا شخصيًا للذكاء الاصطناعي يعتمد على بنية NVIDIA DGX Spark. يشير إطلاق مثل هذه المنتجات إلى أن قدرات الحوسبة عالية الأداء للذكاء الاصطناعي تنتشر تدريجيًا إلى الأجهزة الشخصية وأجهزة الحافة، ولكن أشارت بعض التعليقات أيضًا إلى أن أسعارها قد تجعل من الصعب عليها منافسة منتجات مثل Mac Mini. (المصدر: Reddit r/LocalLLaMA)

Qwen3-30B يحقق إنتاجية عالية على VLLM، مناسب لإدارة مجموعات البيانات: أظهر نموذج Qwen3-30B-A3B سرعة استدلال ممتازة (5 آلاف رمز/ثانية للتعبئة المسبقة، 1 ألف رمز/ثانية للتوليد) على إطار عمل VLLM وبطاقات رسومات RTX 3090s، مما يجعله مناسبًا جدًا لمهام مثل تصفية مجموعات البيانات وإدارتها. على الرغم من أنه قد يكون هناك تراجع طفيف مقارنة بـ QwQ، إلا أن ميزة السرعة تجعله أكثر عملية في معالجة البيانات. المشكلة الرئيسية الحالية هي بطء سرعة التدريب للغاية، ولكن هناك طلب سحب (PR) في مكتبة Hugging Face Transformers يحاول حل هذه المشكلة، ومن المتوقع في المستقبل إطلاق نموذج RpR يعتمد على Qwen3-30B لتحسين مجموعات البيانات. (المصدر: Reddit r/LocalLLaMA)

Qwen3-30B يحقق إنتاجية عالية على VLLM، مناسب لإدارة مجموعات البيانات

Bilibili تطلق نموذج Index-AniSora مفتوح المصدر لتوليد فيديوهات الرسوم المتحركة، يدعم أنماطًا متعددة من فن الأنمي ثنائي الأبعاد: أطلقت Bilibili نموذج Index-AniSora مفتوح المصدر المخصص لتوليد فيديوهات الرسوم المتحركة ثنائية الأبعاد، استنادًا إلى إطار عمل تقنية AniSora الخاص بها (والذي تم قبوله في IJCAI25). يمكن لهذا النموذج تحويل القصص المصورة (المانجا) إلى رسوم متحركة بنقرة واحدة، ويدعم أنماطًا متعددة مثل مسلسلات الأنمي، والإنتاجات الصينية الأصلية، وتعديلات المانجا، وشخصيات VTuber. يقوم نظام AniSora ببناء مجموعة بيانات عالية الجودة تضم ملايين أزواج النصوص والفيديوهات، ويطور إطارًا موحدًا لتوليد الانتشار مع إدخال آلية إخفاء زمانية مكانية، لتحقيق تحكم دقيق في حركة شفاه الشخصيات وحركاتها. وفي الوقت نفسه، صممت Bilibili معيار تقييم لفيديوهات الرسوم المتحركة ونظام تقييم آلي محسن يعتمد على VLM. سيتضمن المحتوى مفتوح المصدر AniSoraV1.0 (المبني على CogVideoX-5B)، و AniSoraV2.0 (المبني على Wan2.1-14B، ويدعم التدريب على Huawei 910B)، بالإضافة إلى أدوات بناء مجموعات البيانات والتقييم ذات الصلة. (المصدر: WeChat)

Bilibili تطلق نموذج Index-AniSora مفتوح المصدر لتوليد فيديوهات الرسوم المتحركة، يدعم أنماطًا متعددة من فن الأنمي ثنائي الأبعاد

ByteDance تطلق نموذج اللغة المرئية Seed1.5-VL، بأداء متميز في المهام متعددة الوسائط: أطلقت ByteDance نموذج اللغة المرئية Seed1.5-VL، الذي يتكون من مشفر مرئي بمعلمات 532 مليون ومعالج لغوي كبير (LLM) من نوع خليط الخبراء (MoE) بمعلمات نشطة 20 مليار. حقق هذا النموذج أداءً على أحدث طراز (SOTA) في 38 من أصل 60 اختبارًا معياريًا عامًا، وتفوق على الأنظمة الرائدة مثل OpenAI CUA و Claude 3.7 في المهام التي تركز على الوكلاء مثل التحكم في واجهة المستخدم الرسومية (GUI) وأسلوب اللعب، مما أظهر قدرات فهم واستدلال قوية متعددة الوسائط. (المصدر: WeChat)

Nous Research تطلق Psyche Network، لتحقيق تدريب مسبق موزع لنموذج لغوي كبير (LLM) بـ 40 مليار معلمة: أطلقت Nous Research شبكة Psyche Network، وهي شبكة تدريب لا مركزية تعتمد على بنية DeepSeek V3 MLA، وفي أول اختبار لها قامت بالتدريب المسبق لنموذج لغوي كبير بـ 40 مليار معلمة. تستخدم هذه الشبكة مُحسِّن DisTrO ومكدس شبكة نظير إلى نظير مخصص، لدمج قدرات حوسبة وحدات معالجة الرسومات الموزعة عالميًا، مما يسمح للأفراد والمجموعات الصغيرة بالتدريب على جهاز H/DGX واحد، والتشغيل على وحدات معالجة رسومات 3090. يهدف هذا التحرك إلى كسر احتكار عمالقة التكنولوجيا للقدرة الحاسوبية، وجعل تدريب النماذج واسعة النطاق أكثر سهولة. (المصدر: QbitAI)

Nous Research تطلق Psyche Network، لتحقيق تدريب مسبق موزع لنموذج لغوي كبير (LLM) بـ 40 مليار معلمة

🧰 الأدوات

Sim Studio: أداة بناء سير عمل وكلاء الذكاء الاصطناعي مفتوحة المصدر: Sim Studio هي منصة بناء سير عمل وكلاء ذكاء اصطناعي مفتوحة المصدر وخفيفة الوزن، توفر واجهة سهلة الاستخدام، يمكن للمستخدمين من خلالها بناء ونشر تطبيقات LLM متصلة بأدوات متنوعة بسرعة. تدعم إصدارًا مستضافًا على السحابة واستضافة ذاتية (يوصى ببيئة Docker، وتدعم النماذج المحلية مثل Ollama). تتضمن مجموعتها التقنية Next.js، و Bun، و PostgreSQL، و Drizzle ORM، و Better Auth، و Shadcn UI، و Tailwind CSS، و Zustand، و ReactFlow، و Turborepo. (المصدر: GitHub Trending)

Sim Studio: أداة بناء سير عمل وكلاء الذكاء الاصطناعي مفتوحة المصدر

Cherry Studio: تطبيق سطح مكتب أمامي مفتوح المصدر لـ LLM شامل الوظائف يحظى بالاهتمام: Cherry Studio هو تطبيق سطح مكتب أمامي مفتوح المصدر لـ LLM، يدمج وظائف متعددة مثل RAG، والبحث على الويب، والنماذج المحلية (من خلال الاتصال بـ Ollama, LM Studio)، والوصول إلى النماذج السحابية (مثل Gemini, ChatGPT). تشير ملاحظات المستخدمين إلى أن دعمه وإدارته لبروتوكول التحكم المتعدد (MCP) أفضل من Open WebUI و LibreChat، كما أنه سهل التثبيت والإعداد. يدعم التطبيق أيضًا الاتصال المباشر بقاعدة معارف Obsidian. على الرغم من أن بعض المستخدمين أبدوا مخاوف بشأن مصدره، إلا أن مجموعة وظائفه الشاملة تجعله خيارًا جذابًا. (المصدر: Reddit r/LocalLLaMA)

Cherry Studio: تطبيق سطح مكتب أمامي مفتوح المصدر لـ LLM شامل الوظائف يحظى بالاهتمام

MLX-LM-LoRA: إضافة LoRA إلى نماذج MLX ودعم طرق تدريب متعددة: يتيح مشروع mlx-lm-lora مفتوح المصدر للمستخدمين دمج وحدات LoRA (Low-Rank Adaptation) في النماذج ضمن إطار عمل Apple MLX. لا يدعم هذا المشروع إضافة LoRA فحسب، بل يتضمن أيضًا طرق تدريب محاذاة متعددة مدمجة مثل ORPO، و DPO، و CPO، و GRPO، مما يسهل على المستخدمين ضبط نماذجهم بدقة وفقًا لاحتياجاتهم، وإنشاء وحدات LoRA مخصصة، وتطبيقها على نماذج MLX المفضلة لديهم. (المصدر: karminski3)

MLX-LM-LoRA: إضافة LoRA إلى نماذج MLX ودعم طرق تدريب متعددة

DeepDrone: مشروع طائرة بدون طيار يتم التحكم فيها بالذكاء الاصطناعي يعتمد على Qwen مفتوح المصدر: قام مطور بإنشاء مشروع طائرة بدون طيار يتم التحكم فيها بالذكاء الاصطناعي يسمى DeepDrone، يعتمد على نموذج Qwen الكبير، وقام بفتحه كمصدر مفتوح على HuggingFace و GitHub. يعرض هذا المشروع إمكانات تطبيق نماذج لغوية كبيرة على التحكم الذاتي في الطائرات بدون طيار، مما أثار نقاشات حول الذكاء الاصطناعي في الأتمتة والتطبيقات العسكرية المحتملة. (المصدر: karminski3)

DeepDrone: مشروع طائرة بدون طيار يتم التحكم فيها بالذكاء الاصطناعي يعتمد على Qwen مفتوح المصدر

Qwen Web Dev: إنشاء ونشر مواقع الويب بنقرة واحدة من خلال prompt: أعلن فريق Qwen التابع لـ Alibaba عن تحسين أداة Qwen Web Dev الخاصة به، حيث يمكن للمستخدمين إنشاء موقع ويب بمجرد تقديم prompt واحد، ونشره بنقرة واحدة. تهدف هذه الأداة إلى خفض عتبة تطوير الويب، مما يتيح للمستخدمين تحويل أفكارهم الإبداعية إلى مواقع ويب فعلية يمكن الوصول إليها بسهولة أكبر، ومشاركتها مع العالم. (المصدر: Alibaba_Qwen, huybery)

SuperGo.AI: أداة واجهة واحدة تدمج ثمانية نماذج LLM: طور أحد هواة الذكاء الاصطناعي أداة تسمى SuperGo.AI، تدمج ثمانية نماذج LLM بأدوار مختلفة (مثل العقل الخارق للذكاء الاصطناعي، والخيال الاصطناعي، والأخلاق الاصطناعية، والكون الاصطناعي، إلخ) في واجهة واحدة. يمكن لهذه الأدوار الاصطناعية أن تتفاعل وتدرك بعضها البعض، ويمكن للمستخدمين اختيار أوضاع “إبداعية” و “علمية” و “مختلطة” للحصول على استجابات مختلطة. تهدف هذه الأداة إلى توفير تجربة تعاون جديدة متعددة الذكاء الاصطناعي، وهي حاليًا بدون جدار دفع. (المصدر: Reddit r/artificial)

Kokoro-JS: تحقيق تحويل نص إلى كلام (TTS) محلي غير محدود: Kokoro-JS هي أداة تحويل نص إلى كلام تعمل محليًا بنسبة 100% ومفتوحة المصدر بنسبة 100%، وذلك من خلال تنزيل نموذج ذكاء اصطناعي بحجم 300 ميجابايت تقريبًا على جانب المتصفح. لا يتم إرسال النص الذي يدخله المستخدم إلى أي خوادم، مما يضمن الخصوصية والتوفر دون اتصال بالإنترنت. تهدف هذه الأداة إلى توفير وظائف TTS غير محدودة. (المصدر: Reddit r/LocalLLaMA)

📚 دراسات وأبحاث

Apple تفتح مصدر نموذج اللغة المرئية الفعال FastVLM، المحسن للتشغيل على الأجهزة الطرفية: فتحت شركة Apple مصدر FastVLM، وهو نموذج لغة مرئية مصمم خصيصًا للتشغيل بكفاءة على أجهزة مثل iPhone. يقدم FastVLM مشفرًا مرئيًا هجينًا جديدًا يسمى FastViTHD، يجمع بين طبقات الالتفاف ووحدات Transformer، ويستخدم تقنيات التجميع متعدد المقاييس وتقليل العينات، مما يقلل بشكل كبير من عدد الرموز المرئية (visual tokens) اللازمة لمعالجة الصور (أقل بـ 16 مرة من ViT التقليدي)، ويسرع إخراج الرمز الأول بمقدار 85 مرة. يتوافق هذا النموذج مع نماذج LLM السائدة، وتم توفير تطبيق تجريبي يعتمد على إطار MLX لأجهزة iOS/macOS، وهو مناسب للأجهزة الطرفية ومهام معالجة الصور والنصوص في الوقت الفعلي. (المصدر: WeChat)

Apple تفتح مصدر نموذج اللغة المرئية الفعال FastVLM، المحسن للتشغيل على الأجهزة الطرفية

جامعة هاربين للتكنولوجيا وجامعة بنسلفانيا تقترحان PointKAN، لتحسين تحليل السحب النقطية ثلاثية الأبعاد بناءً على KAN: قدم فريق بحثي من جامعة هاربين للتكنولوجيا (شنتشن) وجامعة بنسلفانيا PointKAN، وهو بنية إدراك ثلاثي الأبعاد جديدة تعتمد على شبكات كولموغوروف-أرنولد (Kolmogorov-Arnold Networks – KANs). يستبدل PointKAN دوال التنشيط الثابتة في شبكات MLP التقليدية بدوال تنشيط قابلة للتعلم، مما يعزز القدرة على تعلم الميزات الهندسية المعقدة. ويتضمن وحدة تحويل هندسي أفيني ووحدة استخراج ميزات محلية متوازية. كما اقترح الفريق إصدار PointKAN-elite، الذي يعتمد بنية Efficient-KANs، ويستخدم دوال كسرية كدوال أساسية ويقوم بتجميع ومشاركة المعلمات، مما يقلل بشكل كبير من عدد المعلمات والتعقيد الحسابي، مع تحقيق أداء على أحدث طراز (SOTA) في مهام التصنيف، وتقسيم الأجزاء، والتعلم بعينات قليلة. (المصدر: QbitAI)

جامعة هاربين للتكنولوجيا وجامعة بنسلفانيا تقترحان PointKAN، لتحسين تحليل السحب النقطية ثلاثية الأبعاد بناءً على KAN

جامعة بيتسبرغ تقترح إطار عمل PhyT2V، لتعزيز الواقعية الفيزيائية في مقاطع الفيديو المولدة بالذكاء الاصطناعي: طور مختبر الأنظمة الذكية بجامعة بيتسبرغ إطار عمل PhyT2V، الذي يهدف إلى تحسين الاتساق الفيزيائي للمحتوى المولد بواسطة نماذج تحويل النص إلى فيديو (T2V). لا تتطلب هذه الطريقة إعادة تدريب النماذج أو بيانات خارجية واسعة النطاق، بل تستخدم الاستدلال المتسلسل (CoT) الموجه بواسطة نماذج لغوية كبيرة (LLM) وآلية تصحيح ذاتي تكرارية، لتحليل وتحسين المطالبات النصية (text prompts) وفقًا للقواعد الفيزيائية على عدة جولات. يستطيع PhyT2V تحديد القواعد الفيزيائية، وعدم التطابق الدلالي، وتوليد مطالبات مصححة، وبالتالي تعزيز قدرة نماذج T2V السائدة (مثل CogVideoX, OpenSora) على التعميم في سيناريوهات فيزيائية واقعية (المواد الصلبة، السوائل، الجاذبية، إلخ)، خاصة في السيناريوهات خارج التوزيع، مع تحسن يصل إلى 2.3 مرة في مؤشرات الفهم الفيزيائي (PC) والالتزام الدلالي (SA). (المصدر: WeChat)

جامعة بيتسبرغ تقترح إطار عمل PhyT2V، لتعزيز الواقعية الفيزيائية في مقاطع الفيديو المولدة بالذكاء الاصطناعي

أحدث أبحاث نماذج LLM: الوسائط المتعددة، والمحاذاة في وقت الاختبار، والوكلاء، وتحسين RAG، وغيرها: تشمل تطورات أبحاث نماذج LLM لهذا الأسبوع ما يلي: 1. اقترحت جامعة واشنطن QALIGN، وهي طريقة محاذاة في وقت الاختبار لا تتطلب تعديل النموذج أو الوصول إلى مخرجات logits، وتحقق محاذاة أفضل في توليد النصوص من خلال MCMC. 2. قامت UCLA بالتدريب المسبق لـ Clinical ModernBERT، لتوسيع طول سياق مشفر مجال الطب الحيوي إلى 8192 رمزًا. 3. اقترحت Skoltech طريقة استرجاع RAG خفيفة الوزن ومستقلة عن LLM وقابلة للتكيف ذاتيًا، تعتمد على معلومات خارجية (شيوع الكيانات، نوع السؤال). 4. حددت PSU مشكلة تحديد أسباب الفشل الآلي في أنظمة LLM متعددة الوكلاء، وطورت مجموعة بيانات وطرق تقييم. 5. اقترحت جامعة فودان إطار قيود متعدد الأبعاد وعملية توليد تعليمات آلية، لتعزيز قدرة LLM على اتباع التعليمات. 6. فتح فريق a-m-team مصدر AM-Thinking-v1 (32B)، بقدرات ترميز رياضي تضاهي DeepSeek-R1-671B. 7. أطلقت Xiaomi نموذج MiMo-7B، الذي يحقق أداءً متميزًا في مهام الاستدلال من خلال تحسين التدريب المسبق وما بعد التدريب. 8. اقترحت MiniMax نموذج MiniMax-Speech للتحويل التلقائي للنص إلى كلام (TTS)، يدعم استنساخ نبرة الصوت لـ 32 لغة دون الحاجة لتدريب مسبق (zero-shot). 9. قامت ByteDance ببناء نموذج اللغة المرئية Seed1.5-VL، الذي يتميز بأداء بارز في المهام متعددة الوسائط والمهام التي تركز على الوكلاء. 10. تم تحقيق تدريب التعلم المعزز الموزع لأول نموذج لغوي في العالم بمعلمات 32 مليار، INTELLECT-2، مع اقتراح إطار PRIME-RL. (المصدر: WeChat)

أحدث أبحاث نماذج LLM: الوسائط المتعددة، والمحاذاة في وقت الاختبار، والوكلاء، وتحسين RAG، وغيرها

ورش عمل AAAI 2025 تركز على الاستدلال العصبي، والاكتشافات الرياضية، وتسريع الذكاء الاصطناعي للعلوم والهندسة: ركزت ورش عمل AAAI 2025 على تطبيقات الذكاء الاصطناعي في المجالات العلمية. من بينها، أكدت ورشة عمل “الاستدلال العصبي والاكتشافات الرياضية” على إمكانية استخدام الشبكات العصبية “الصندوق الأسود” لاقتراح التخمينات الرياضية وتوليد أشكال هندسية جديدة، ولكنها أشارت أيضًا إلى عدم قدرتها على الوصول إلى مستوى الاستدلال المنطقي الرمزي، ودعت إلى اتباع نهج متعدد التخصصات. وركزت ورشة عمل أخرى بعنوان “الذكاء الاصطناعي لتسريع العلوم والهندسة” (الدورة الرابعة، تحت عنوان الذكاء الاصطناعي في علوم الأحياء) على النماذج الأساسية لتصميم العلاجات، والنماذج التوليدية لاكتشاف الأدوية، وتصميم الأجسام المضادة في حلقة مغلقة في المختبر، والتعلم العميق في علم الجينوم، والاستدلال السببي في التطبيقات البيولوجية، وغيرها من الموضوعات، وناقشت التحديات والفرص التي تواجه النماذج التوليدية في علوم الأحياء. (المصدر: aihub.org)

ورش عمل AAAI 2025 تركز على الاستدلال العصبي، والاكتشافات الرياضية، وتسريع الذكاء الاصطناعي للعلوم والهندسة

Google و Anthropic تختلفان في أبحاث قابلية تفسير الذكاء الاصطناعي، وقابلية التفسير الآلية تواجه تحديات: أدت خاصية “الصندوق الأسود” للذكاء الاصطناعي إلى تقييد تطبيقاته في العديد من المجالات الحيوية. أعلنت Google DeepMind مؤخرًا عن خفض أولوية أبحاث “قابلية التفسير الآلية” (mechanistic interpretability)، معتبرة أن الهندسة العكسية للآليات الداخلية للذكاء الاصطناعي من خلال طرق مثل المشفرات التلقائية المتفرقة (SAE) تواجه العديد من المشكلات، مثل الافتقار إلى مرجع موضوعي، وعدم تغطية المفاهيم بشكل كامل، وتشوه الميزات، وما إلى ذلك، وأن تقنيات SAE الحالية لم تنجح في تحديد “المفاهيم” المطلوبة في المهام الحاسمة. بينما دعا داريو أمودي (Dario Amodei)، الرئيس التنفيذي لـ Anthropic، إلى تعزيز الأبحاث في هذا المجال، وأعرب عن تفاؤله بتحقيق “تصوير بالرنين المغناطيسي للذكاء الاصطناعي” في غضون 5-10 سنوات القادمة. يسلط هذا الجدل الضوء على التحديات العميقة لفهم سلوك الذكاء الاصطناعي والتحكم فيه. (المصدر: 36Kr)

Google و Anthropic تختلفان في أبحاث قابلية تفسير الذكاء الاصطناعي، وقابلية التفسير الآلية تواجه تحديات

جامعة بكين/StepFun/Lightelligence تقترح InfiniteHBD: بنية نطاق ترددي عالٍ للجيل الجديد من وحدات معالجة الرسومات لخفض التكاليف وزيادة الكفاءة: لمواجهة القيود الحالية لبنى النطاق الترددي العالي (HBD) من حيث قابلية التوسع والتكلفة وتحمل الأخطاء، اقترح فريق من جامعة بكين و StepFun و Lightelligence بنية InfiniteHBD. تتمحور هذه البنية حول وحدة تبديل بصري (OCSTrx)، ومن خلال دمج قدرة تبديل بصري منخفضة التكلفة (OCS) في وحدة التحويل الكهروضوئي، تحقق طوبولوجيا حلقة K-Hop قابلة لإعادة التشكيل ديناميكيًا على نطاق مركز البيانات وعزل الأخطاء على مستوى العقدة. تبلغ تكلفة وحدة InfiniteHBD 31% فقط من تكلفة NVL-72، ومعدل إهدار وحدات معالجة الرسومات يقترب من الصفر، ومعدل استخدام FLOPs للنموذج (MFU) يزيد بنسبة تصل إلى 3.37 مرة مقارنة بـ NVIDIA DGX، مما يوفر حلاً أفضل لتدريب النماذج الكبيرة على نطاق واسع. تم قبول الورقة البحثية في SIGCOMM 2025. (المصدر: WeChat)

جامعة بكين/StepFun/Lightelligence تقترح InfiniteHBD: بنية نطاق ترددي عالٍ للجيل الجديد من وحدات معالجة الرسومات لخفض التكاليف وزيادة الكفاءة

OceanBase تطلق PowerRAG، وتتبنى الذكاء الاصطناعي بشكل كامل، وتبني قاعدة بيانات متكاملة Data×AI: أطلقت OceanBase في مؤتمر المطورين الخاص بها منتج التطبيقات الموجه للذكاء الاصطناعي PowerRAG، بهدف توفير قدرات تطوير RAG جاهزة للاستخدام، وربط طبقات البيانات والمنصات والواجهات والتطبيقات. شرح يانغ تشوانهوي، كبير المسؤولين التقنيين، استراتيجية الذكاء الاصطناعي لـ OceanBase بالتفصيل: بناء قدرات Data×AI، والتطور من قاعدة بيانات متكاملة إلى قاعدة بيانات متكاملة. ستعمل OceanBase على تعزيز قدرات المتجهات، وتحسين البحث المدمج، وتحقيق التحديث الديناميكي لتخزين المعرفة المؤسسية، والدمج العميق لتدريب النماذج اللاحق والضبط الدقيق، وقد تكيفت بالفعل مع منصات الوكلاء الرئيسية مثل Dify و FastGPT وبروتوكول MCP. وأظهر أداء المتجهات الخاص بها تفوقًا في اختبار VectorDBBench، كما قللت بشكل كبير من متطلبات الذاكرة من خلال خوارزمية تكميم BQ. (المصدر: WeChat)

OceanBase تطلق PowerRAG، وتتبنى الذكاء الاصطناعي بشكل كامل، وتبني قاعدة بيانات متكاملة Data×AI

💼 أعمال تجارية

صناديق استثمار تابعة لـ Shanghai State-owned Capital Investment تستثمر في شركات رقائق الذكاء الاصطناعي Xinyaohui و Enflame Technology و Biren Technology وغيرها: وقعت شركة شانغهاي للاستثمار المملوكة للدولة (Shanghai State-owned Capital Investment Co.) مؤخرًا اتفاقيات استثمار مع ثلاث شركات أشباه موصلات هي Xinyaohui و Enflame Technology و Biren Technology، بعد أن قاد صندوقها الأم الرائد للذكاء الاصطناعي جولة تمويل ما قبل الاكتتاب العام لشركة Biren Technology. وأعلنت Shanghai State-owned Capital Investment أنها ستعمل بنشاط على布局 (تخطيط استراتيجي) في مجالات النماذج الأساسية، ورقائق الحوسبة، والذكاء الاصطناعي المتجسد، وغيرها. تركز Xinyaohui على الملكية الفكرية لأشباه الموصلات، وخاصة تقنية Chiplet، وكان مؤسسها تسنغ كه تشيانغ يشغل سابقًا منصب نائب رئيس Synopsys في الصين. وتعد Enflame Technology و Biren Technology شركتين لتصميم رقائق وحدات معالجة الرسومات (GPU). يظهر هذا التحرك تركيز Shanghai State-owned Capital Investment على المراحل الأولية من سلسلة صناعة الذكاء الاصطناعي، وخاصة في مجال رقائق الحوسبة. (المصدر: 36Kr)

Sakana AI و MUFG Bank (بنك ميتسوبيشي يو إف جيه) تعقدان شراكة شاملة لتطوير ذكاء اصطناعي خاص بالبنوك: أعلنت شركة الذكاء الاصطناعي اليابانية الناشئة Sakana AI عن توقيع اتفاقية شراكة متعددة السنوات مع MUFG Bank. ستقوم Sakana AI بتطوير وكلاء ذكاء اصطناعي متخصصين للعمليات المصرفية لصالح MUFG، بهدف دفع عجلة التحول في الأعمال المصرفية والتطبيق العملي للذكاء الاصطناعي. وفي الوقت نفسه، سيعمل رين إيتو، المؤسس المشارك ومدير العمليات في Sakana AI، كمستشار لـ MUFG، لمساعدة البنك في تنفيذ استراتيجيته للذكاء الاصطناعي. تمثل هذه الشراكة خطوة مهمة لـ Sakana AI في تطبيق تقنيات الذكاء الاصطناعي المتقدمة لحل المشكلات المحددة في القطاع المالي الياباني. (المصدر: SakanaAILabs, SakanaAILabs, SakanaAILabs, SakanaAILabs, SakanaAILabs)

Sakana AI و MUFG Bank (بنك ميتسوبيشي يو إف جيه) تعقدان شراكة شاملة لتطوير ذكاء اصطناعي خاص بالبنوك

المؤسسة المشاركة في 01.AI، غو شيويه مي، تستقيل لتأسيس شركة جديدة، وتركيز أعمال الشركة يتحول إلى قطاع الشركات (B2B): استقالت غو شيويه مي، المؤسسة المشاركة في 01.AI والمسؤولة عن التدريب المسبق للنماذج ومنتجات العملاء (C-end)، قبل عدة أشهر، وتستعد حاليًا لتأسيس شركة جديدة. أكدت 01.AI هذا الأمر وشكرتها على مساهماتها. منذ عام 2025، تحول تركيز أعمال 01.AI من تطبيقات الذكاء الاصطناعي للمستهلكين (AI ToC) وواجهات برمجة تطبيقات النماذج (API) إلى سيناريوهات قطاع الشركات (B2B) مثل الإنسان الرقمي، وتخصيص النماذج ونشرها. وقد توقفت منتجاتها الموجهة للمستهلكين مثل أداة المكاتب المحلية “Wanzhi” عن العمل بسبب عدم وصول عدد المستخدمين إلى المستوى المتوقع، كما أن منتج لعب الأدوار الخارجي Mona لم يحقق نتائج تجارية مرضية. وفي وقت سابق، استقال أيضًا المؤسس المشارك داي تسونغ هونغ لتأسيس شركة جديدة. (المصدر: 36Kr)

المؤسسة المشاركة في 01.AI، غو شيويه مي، تستقيل لتأسيس شركة جديدة، وتركيز أعمال الشركة يتحول إلى قطاع الشركات (B2B)

🌟 المجتمع

كشف AIGC في الأبحاث العلمية يثير الجدل، ودقته موضع شك، وتخرج الطلاب يتأثر: أدخلت العديد من الجامعات هذا العام كشف AIGC كجزء من عملية مراجعة أطروحات التخرج، بهدف منع الطلاب من إساءة استخدام الذكاء الاصطناعي في الكتابة. ومع ذلك، أثارت هذه الخطوة جدلاً واسعًا. أفاد الطلاب بأن المحتوى الذي كتبوه بأنفسهم غالبًا ما يتم تصنيفه خطأً على أنه مولد بواسطة الذكاء الاصطناعي، بينما ترتفع درجة الشك بعد التعديل بمساعدة الذكاء الاصطناعي. حتى أن بعض الاختبارات أظهرت أن درجة الشك في توليد “مقدمة جناح الأمير تنغ” (滕王阁序) بواسطة الذكاء الاصطناعي تصل إلى 99.2%. تعتمد أدوات كشف AIGC نفسها على الذكاء الاصطناعي، ومبدأ عملها هو تحليل الخصائص اللغوية للنص ومقارنتها بأنماط الكتابة بالذكاء الاصطناعي، ولكن دقتها مشكوك فيها، حيث بلغت دقة أداة OpenAI المبكرة 26% فقط. هذا الغموض لا يسبب إزعاجًا للطلاب وتكاليف إضافية فحسب (تختلف نتائج مواقع الكشف المختلفة، وتفرض رسوم على خدمات تقليل التشابه)، بل يثير أيضًا تساؤلات حول جوهر أدوات الذكاء الاصطناعي: الذكاء الاصطناعي يقلد الكتابة البشرية، ثم يستخدم الذكاء الاصطناعي للكشف عما إذا كان النص البشري يشبه الذكاء الاصطناعي، وهو ما ينطوي على مفارقة منطقية. (المصدر: 36Kr)

كشف AIGC في الأبحاث العلمية يثير الجدل، ودقته موضع شك، وتخرج الطلاب يتأثر

ميزة جديدة في ChatGPT للاتصال المباشر بـ Github: بحث متعمق في مستودعات الأكواد والوثائق المتخصصة: أضافت ميزة Deep Research التي أطلقتها ChatGPT مؤخرًا القدرة على الاتصال المباشر بمستودعات Github، مما يسمح للمستخدمين بتفويض ChatGPT للوصول إلى مستودعاتهم العامة أو الخاصة، وإجراء تحليل متعمق للأكواد، وتلخيص بنية الوظائف، وتحديد المجموعات التقنية، وتقييم جودة الأكواد، وتحليل مدى ملاءمة المشاريع، وغيرها. لا تقتصر هذه الميزة على الأكواد فحسب، بل يمكن للمستخدمين تحميل أنواع مختلفة من المستندات مثل PDF و Word إلى مستودعات Github، واستخدام ChatGPT لإجراء بحث متعمق في مواد متخصصة، وهو ما يعادل تحقيق مزيج من RAG+MCP ضمن نطاق محدد. هذه الميزة متاحة حاليًا لمستخدمي Plus، ومن خلال تحديد نطاق البحث، من المتوقع أن تعزز احترافية ودقة تقارير البحث، وتقلل من الهلوسة. (المصدر: 36Kr)

ميزة جديدة في ChatGPT للاتصال المباشر بـ Github: بحث متعمق في مستودعات الأكواد والوثائق المتخصصة

اشتداد المنافسة في سوق وكلاء الذكاء الاصطناعي، Manus تفتح التسجيل بالكامل، ودخول كبرى الشركات مثل ByteDance و Baidu: أعلنت Manus، المعروفة بـ “الوكيل الشامل”، في 12 مايو عن فتح التسجيل بالكامل، حيث يمكن للمستخدمين الحصول على حصة استخدام دون انتظار. وفي الوقت نفسه، تشير شائعات السوق إلى أن Manus تجري جولة تمويل جديدة بتقييم 1.5 مليار دولار. منذ إطلاقها في مارس، أثارت Manus موجة من مشاريع الوكلاء، لكنها تواجه أيضًا تحديات تراجع حركة المرور وظهور منتجات منافسة. أطلقت ByteDance منصة Coze Space، وأطلقت Baidu تطبيقي “Miaoda” و “Xinxiang”، كما بدأ وكيل التصميم Lovart مرحلة الاختبار. ينتقل سوق الوكلاء من مرحلة إثبات المفهوم المبكرة إلى منافسة شاملة في وظائف المنتج، والنماذج التجارية، ونمو المستخدمين. (المصدر: 36Kr)

اشتداد المنافسة في سوق وكلاء الذكاء الاصطناعي، Manus تفتح التسجيل بالكامل، ودخول كبرى الشركات مثل ByteDance و Baidu

مساعدة الذكاء الاصطناعي في البرمجة تغير سير عمل المطورين، تزيد الإنتاجية ولكن يجب الحذر من الاعتماد المفرط: شارك مستخدمو Reddit كيف غيرت مساعدات الذكاء الاصطناعي في البرمجة تجربتهم بشكل كبير، خاصة في التعامل مع المشاريع القديمة الكبيرة وفهم الأكواد المعقدة. يمكن لأدوات الذكاء الاصطناعي شرح الأكواد سطرًا بسطر، وتقديم الاقتراحات، وتسليط الضوء على المشكلات المحتملة، وتلخيص الملفات، والعثور على المقتطفات، وإنشاء التعليقات، وكأن لديهم خبيرًا متاحًا على مدار الساعة. وأشارت التعليقات إلى أن الذكاء الاصطناعي يمكنه إنجاز المهام البرمجية المتكررة، وزيادة الكفاءة، وتوجيه المطورين إلى طرق جديدة، وإضافة التعليقات، وحتى مساعدة المطورين على إكمال المهام التي تتجاوز قدراتهم، مما يختصر أيامًا من العمل إلى ساعات. ومع ذلك، أثار هذا أيضًا تساؤلات حول تطور مهارات المطورين والاعتماد على أدوات الذكاء الاصطناعي. (المصدر: Reddit r/artificial)

تراجع عدد المستخدمين النشطين شهريًا لـ Kimi، و Moonshot AI تسعى لاختراق المجالات المتخصصة والتحول نحو التفاعل الاجتماعي: انخفض عدد المستخدمين النشطين شهريًا لـ Kimi Chat التابع لـ Moonshot AI من 36 مليونًا في أكتوبر الماضي إلى 18.2 مليونًا في مارس من هذا العام وفقًا لبيانات QuestMobile، ليتراجع ترتيبه إلى المركز الرابع. لتعزيز الاحتفاظ بالمستخدمين، تتوسع Kimi من نموذج لغوي كبير عام إلى مجالات متخصصة، مثل التعاون مع Caixin Media لتحسين جودة البحث في المحتوى المالي، والتخطيط لدخول مجال البحث الطبي بالذكاء الاصطناعي، وإدخال محتوى الفيديو من Bilibili. وفي الوقت نفسه، أطلقت Kimi تحدي تسجيل الحضور على Xiaohongshu، في محاولة للوصول إلى المزيد من مستخدمي C-end من خلال منصات التواصل الاجتماعي. كما تم تعديل واجهة المستخدم الخاصة بها لتتجه نحو الوسائط المتعددة، وأسلوب يشبه Doubao، والمجتمع. في مواجهة المنافسين مثل DeepSeek ودخول كبرى الشركات مجال تطبيقات الذكاء الاصطناعي، تعرض موقع Kimi الرائد تقنيًا للصدمة، وزادت الضغوط التجارية، وهي تبحث بنشاط عن نقاط نمو جديدة. (المصدر: 36Kr)

تراجع عدد المستخدمين النشطين شهريًا لـ Kimi، و Moonshot AI تسعى لاختراق المجالات المتخصصة والتحول نحو التفاعل الاجتماعي

نقاش حول ما إذا كان ينبغي للذكاء الاصطناعي أن يشير إلى نفسه بضمير المتكلم: أثار مستخدمو Reddit نقاشًا حول ما إذا كان استخدام ChatGPT ونماذج LLM الأخرى لضمير “أنا” أو “أنت” للإشارة إلى نفسها ومخاطبة المستخدمين قد يكون غير مناسب، لأنها في جوهرها “أشياء” وليست “أشخاصًا”، واقترحوا أن تستخدم ضمير الغائب مثل “ChatGPT سيساعدك…” لتجنب إعطاء المستخدمين انطباعًا بأنها كيانات مجسدة، مما قد يثير مخاطر أو مشكلات أخلاقية محتملة. وفي التعليقات، رأى البعض أن استخدام ضمير الغائب يوحي بالوعي الذاتي، بينما شعر آخرون بأن استخدام ضمير الغائب يبدو سخيفًا وغير مريح. يعكس هذا النقاش تفكير المستخدمين حول تحديد هوية الذكاء الاصطناعي وطرق التفاعل بين الإنسان والآلة. (المصدر: Reddit r/ArtificialInteligence)

💡 أخرى

معهد ماساتشوستس للتكنولوجيا (MIT) يسحب بشكل عاجل ورقة بحثية عن الذكاء الاصطناعي حظيت باهتمام واسع، مشيرًا إلى شكوك حول صحة البيانات والبحث: سحب معهد ماساتشوستس للتكنولوجيا (MIT) ورقة بحثية كتبها إيدان تونر-روجرز، طالب دكتوراه في قسم الاقتصاد، بعنوان “الذكاء الاصطناعي، والاكتشاف العلمي، وابتكار المنتجات”. كانت هذه الورقة قد حظيت باهتمام كبير لاقتراحها أن أدوات الذكاء الاصطناعي يمكن أن تعزز بشكل كبير كفاءة الابتكار لدى كبار العلماء، ولكنها قد تؤدي إلى تفاقم “الفجوة بين الأغنياء والفقراء” في البحث العلمي وتقليل سعادة الباحثين العاديين، وقد حظيت بإشادة أساتذة بارزين من بينهم حائزون على جائزة نوبل. ذكر بيان MIT أنه بعد تلقي بلاغ حول نزاهة البحث وإجراء تحقيق داخلي، فقد المعهد الثقة في مصدر البيانات وموثوقيتها وصلاحيتها وصحة البحث، وطلب من arXiv و “Quarterly Journal of Economics” سحب الورقة. غادر المؤلف MIT، كما أصدر الأساتذة المعنيون بيانات لتبرئة أنفسهم. ويُقال إن المؤلف اشترى نطاقات مزيفة خلال التحقيق冒充 (冒充 – انتحال صفة) رسائل بريد إلكتروني لشركات كبرى، وتم كشف أمره ومقاضاته. (المصدر: 36Kr)

معهد ماساتشوستس للتكنولوجيا (MIT) يسحب بشكل عاجل ورقة بحثية عن الذكاء الاصطناعي حظيت باهتمام واسع، مشيرًا إلى شكوك حول صحة البيانات والبحث

استخدام صور مولدة بالذكاء الاصطناعي في عمليات احتيال عبر الإنترنت، مما يثير حذر المستخدمين: شارك مستخدمو Reddit حالات ظهرت على وسائل التواصل الاجتماعي مثل Facebook تستخدم صورًا لشخصيات مولدة بالذكاء الاصطناعي للترويج لمنتجات، وغالبًا ما تحتوي هذه الصور على تناقضات غير منطقية في الشخصيات والمشاهد (مثل عارضات أزياء يدخلن ويخرجن من صناديق بطريقة غريبة، أو ظهور شخصيات غير ذات صلة في الخلفية)، ولكن اتساق مظهر الشخصيات يكون عاليًا. وأشار المعلقون إلى أن هذا النوع من المحتوى المولد بالذكاء الاصطناعي قد استخدم بالفعل في عمليات احتيال، محذرين المستخدمين من توخي الحذر. كما قام مدونون مثل Pleasant Green بإنتاج مقاطع فيديو تكشف عن مثل هذه عمليات الاحتيال. (المصدر: Reddit r/ChatGPT)

نقاش حول تقليد أنماط الصور المولدة بالذكاء الاصطناعي واستخلاص الـ prompts: ناقش المستخدمون كيفية جعل نماذج الذكاء الاصطناعي (مثل DALL-E 3) تقلد أنماطًا فنية معينة (مثل أسلوب Pixar الممزوج بأسلوب Designer Toy لسلفادور دالي) لإنشاء صور شخصية، وشاركوا prompts مفصلة، مؤكدين على ميزات الشخصية، والخلفية، والإضاءة والظلال، والمفاهيم الأساسية (مثل الظل كإسقاط روحي). بالإضافة إلى ذلك، قدم مستخدمون آخرون قوالب prompts لاستخلاص معلمات النمط من الصور وإخراجها بتنسيق JSON، بهدف مساعدة المستخدمين على إجراء هندسة عكسية لأنماط الصور، على الرغم من أن الاستعادة الدقيقة لا تزال صعبة. (المصدر: dotey, dotey)

نقاش حول تقليد أنماط الصور المولدة بالذكاء الاصطناعي واستخلاص الـ prompts

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *