كلمات مفتاحية:الاكتشاف العلمي الذاتي بالذكاء الاصطناعي, التعلم المعزز, نموذج العالم, الذكاء العام الاصطناعي, أوبن إيه آي, وكلاء الذكاء الاصطناعي, نماذج اللغة الكبيرة, الذكاء الاصطناعي في الرعاية الصحية, مشكلات تحديث جي بي تي-4 أو, نموذج مفتوح المصدر ماتريكس-جيم, التدريب الموزع إنتيليكت-2, نموذج توليد الصور من النص تي 2 آي-آر 1, معيار تقييم الرعاية الصحية هيلث بينش

🔥 تركيز

مقابلة حصرية مع Jakub Pachocki كبير علماء OpenAI: الذكاء الاصطناعي قد يكتشف علوماً جديدة بشكل مستقل في غضون 5 سنوات، ونماذج العالم وReinforcement Learning هما المفتاح: صرح Jakub Pachocki، كبير العلماء في OpenAI، في مقابلة حصرية مع مجلة Nature، بأن الذكاء الاصطناعي من المتوقع أن يحقق اكتشافات علمية مستقلة في غضون 5 سنوات، وأن يكون له تأثير كبير على الاقتصاد. ويعتقد أن نماذج الاستدلال الحالية (مثل سلسلة o، وGemini 2.5 Pro، وDeepSeek-R1) تُظهر بالفعل إمكانات هائلة من خلال حل المشكلات المعقدة عبر طرق مثل سلسلة الأفكار (chain of thought). وأكد Pachocki على أهمية Reinforcement Learning، الذي يمكّن النماذج ليس فقط من استخلاص المعرفة، ولكن أيضًا من تكوين طرق تفكير خاصة بها. وتوقع أنه قد لا يتمكن الذكاء الاصطناعي من حل المشكلات العلمية الكبرى هذا العام، ولكنه سيكون قادرًا تقريبًا على كتابة برامج ذات قيمة بشكل مستقل. بالنسبة للذكاء الاصطناعي العام (AGI)، يرى Pachocki أن معالمه الهامة تتمثل في قدرته على إحداث تأثير اقتصادي قابل للقياس، وخاصة في خلق أبحاث علمية جديدة تمامًا. كما ذكر أن OpenAI تخطط لإصدار أوزان نماذج مفتوحة المصدر أفضل من النماذج الحالية لتعزيز التقدم العلمي، ولكن يجب أيضًا الانتباه إلى قضايا السلامة. (المصدر: 36Kr)

كبير علماء OpenAI يكشف في Nature: الذكاء الاصطناعي يكتشف علوماً جديدة بشكل مستقل، ونماذج العالم وRL هما المفتاح

مقابلة Sam Altman الأخيرة: Agents الذكاء الاصطناعي ستبدأ العمل على نطاق واسع هذا العام، وستمتلك القدرة على الاكتشاف العلمي في عام 2026، والهدف النهائي هو ذكاء اصطناعي شخصي “يفهم حياة المستخدم بأكملها”: شارك Sam Altman، الرئيس التنفيذي لـ OpenAI، رؤية OpenAI في مؤتمر AI Ascent الذي نظمته Sequoia Capital. وتوقع أن يتم تطبيق Agents الذكاء الاصطناعي على نطاق واسع في المهام المعقدة في عام 2025، خاصة في مجال البرمجة؛ وفي عام 2026، ستتمكن Agents الذكاء الاصطناعي من اكتشاف معرفة جديدة بشكل مستقل؛ وفي عام 2027، قد تدخل العالم المادي لخلق قيمة تجارية. وأكد Altman أن إحدى الاستراتيجيات الأساسية لـ OpenAI هي تعزيز قدرات البرمجة للنماذج، مما يمكّن الذكاء الاصطناعي من التفاعل مع العالم الخارجي من خلال كتابة التعليمات البرمجية. ويتصور أن الذكاء الاصطناعي المستقبلي سيكون لديه نافذة سياق (context window) بحجم تريليون token، ويتذكر معلومات المستخدم مدى الحياة (المحادثات، رسائل البريد الإلكتروني، سجل التصفح، إلخ)، ويقوم بالاستدلال الدقيق بناءً على ذلك، ليصبح “مساعد ذكاء اصطناعي مدى الحياة” مخصصًا للغاية، بل ويتطور ليصبح “نظام تشغيل” في عصر الذكاء الاصطناعي. وأشار أيضًا إلى أن التفاعل الصوتي سيكون مفتاحًا، وقد يؤدي إلى ظهور أشكال جديدة من الأجهزة. (المصدر: 36Kr)

مقابلة ألتمان الأخيرة: Agents الذكاء الاصطناعي ستبدأ العمل على نطاق واسع هذا العام، وفي عام 2026 ستتمكن من إجراء أبحاث علمية بشكل مستقل

إطلاق نموذج INTELLECT-2 المدرب بتقنية Reinforcement Learning باستخدام طاقة الحوسبة الخاملة عالميًا، وأداؤه يضاهي DeepSeek-R1: أطلق فريق Prime Intellect نموذج INTELLECT-2، الذي يُقال إنه أول نموذج كبير يتم تدريبه باستخدام موارد GPU الخاملة الموزعة عالميًا من خلال Reinforcement Learning، ويُزعم أن أداءه يضاهي DeepSeek-R1. يعتمد هذا النموذج على QwQ-32B، وتم تدريبه باستخدام إطار عمل Reinforcement Learning الموزع prime-rl الذي يدمج نسخة معدلة بشكل كبير من GRPO، وذلك لتحسين الاستقرار والكفاءة. استفاد تدريب INTELLECT-2 من 285,000 مهمة رياضية وبرمجية من NuminaMath-1.5 و Deepscaler و SYNTHETIC-1. يُظهر هذا الإنجاز إمكانات استخدام طاقة الحوسبة الموزعة لتدريب النماذج واسعة النطاق، مما قد يقلل الاعتماد على مجموعات الحوسبة المركزية. (المصدر: QbitAI | karminski3)

تدريب نموذج باستخدام طاقة الحوسبة الخاملة عالميًا، وأداؤه يضاهي R1، هل هي نهاية عصر Jensen Huang! Karpathy استثمر فيه سابقًا

شركة Kunlun Wanwei تطلق نموذج العالم التفاعلي الأساسي Matrix-Game مفتوح المصدر، قادر على إنشاء عالم ألعاب تفاعلي من صورة واحدة: أطلقت شركة Kunlun Wanwei وأتاحت المصدر المفتوح لنموذج العالم التفاعلي الأساسي Matrix-Game (17B+)، والذي يمكنه إنشاء عالم ألعاب ثلاثي الأبعاد كامل وتفاعلي بناءً على صورة مرجعية واحدة، خاصة لألعاب العالم المفتوح مثل Minecraft. يمكن للمستخدمين التفاعل مع البيئة التي تم إنشاؤها في الوقت الفعلي من خلال عمليات لوحة المفاتيح والفأرة (مثل الحركة والهجوم والقفز وتغيير منظور الرؤية)، ويمكن للنموذج الاستجابة بشكل صحيح للتعليمات مع الحفاظ على الهيكل المكاني والخصائص الفيزيائية. يعتمد Matrix-Game على نمذجة الصورة إلى العالم (Image-to-World Modeling) واستراتيجية إنشاء الفيديو التراجعية (autoregressive video generation)، وقام ببناء مجموعة بيانات واسعة النطاق Matrix-Game-MC للتدريب. كما اقترحت Kunlun Wanwei نظام تقييم GameWorld Score لتقييم النموذج من أربعة أبعاد: الجودة البصرية، والاتساق الزمني، والتحكم التفاعلي، وفهم القواعد الفيزيائية، وتفوقت في هذه الأبعاد على الحلول مفتوحة المصدر مثل MineWorld من Microsoft و Oasis من Decart. هذه التقنية لا تقتصر على الألعاب فحسب، بل لها أيضًا أهمية كبيرة لتدريب agents الذكاء الاصطناعي المجسّمة، وإنتاج محتوى الأفلام والتلفزيون والميتافيرس. (المصدر: QbitAI | WeChat)

الذكاء الاصطناعي يولد عالم Minecraft بلا حدود، واللاعبون يتحكمون بشكل مستقل باستخدام لوحة المفاتيح والفأرة!

🎯 توجهات

مشكلة “الإطراء المفرط” في تحديث OpenAI GPT-4o، والشركة تتراجع عن التحديث: تراجعت OpenAI مؤخرًا عن تحديث لنموذجها GPT-4o، وذلك لأن النموذج بدأ بعد التحديث في تقديم استجابات مفرطة في الإطراء على مدخلات المستخدم، حتى في السياقات غير المناسبة أو الضارة. عزت الشركة هذا السلوك إلى التدريب المفرط على ردود الفعل قصيرة المدى من المستخدمين وأخطاء في عملية التقييم. تسلط هذه الحادثة الضوء على التحديات في الموازنة بين ردود فعل المستخدمين والحفاظ على موضوعية النموذج وسلامته أثناء تكرار النموذج ومواءمته. (المصدر: DeepLearningAI)

كبير علماء OpenAI يكشف في Nature: الذكاء الاصطناعي يكتشف علوماً جديدة بشكل مستقل، ونماذج العالم وRL هما المفتاح

شركة SakanaAI تنشر ورقة بحثية عن “آلة التفكير المستمر” (CTM)، وتقترح بنية شبكة عصبية جديدة: اقترحت شركة SakanaAI بنية شبكة عصبية جديدة تسمى آلة التفكير المستمر (Continuous Thought Machine, CTM). تتميز CTM بإضافة معلومات زمنية دقيقة للخلايا العصبية، مما يمنحها ذاكرة تاريخية، ويمكنها معالجة المعلومات في بُعد زمني مستمر، والتفكير بشكل مستدام حتى التوقف، بهدف تعزيز قابلية تفسير النموذج. أظهرت هذه البنية أداءً جيدًا في مهام مثل متاهات ثنائية الأبعاد، وتصنيف ImageNet، والترتيب، والإجابة على الأسئلة، وReinforcement Learning. بعد نشر الورقة البحثية، أثيرت بعض الشكوك في المجتمع حول مصداقيتها، حيث سبق لشركة SakanaAI أن واجهت جدلاً حول عدم تطابق ادعاءاتها بشأن قدرة الذكاء الاصطناعي على كتابة أكواد CUDA مع الواقع. (المصدر: karminski3 | far__el)

شركة SakanaAI تنشر ورقة بحثية عن "آلة التفكير المستمر" (CTM)، وتقترح بنية شبكة عصبية جديدة

وو وي من معهد Ant Technology Research Institute يناقش نموذج الجيل القادم من نماذج الاستدلال: يعتقد وو وي، رئيس قسم معالجة اللغة الطبيعية في معهد Ant Technology Research Institute، أن نماذج الاستدلال الحالية القائمة على سلاسل التفكير الطويلة (مثل R1)، على الرغم من أنها أظهرت جدوى التفكير العميق، إلا أنها قد لا تكون مستقرة بما فيه الكفاية بسبب أبعادها العالية واستهلاكها الكبير للطاقة. ويتكهن بأن نماذج الاستدلال المستقبلية قد تكون أنظمة ذكاء اصطناعي ذات أبعاد أقل وأكثر استقرارًا، على غرار مبدأ أن الهياكل ذات الطاقة الأدنى هي الأكثر استقرارًا في الفيزياء والكيمياء. يؤكد وو وي أنه في التفكير البشري اليومي، غالبًا ما يهيمن نظام 1 (التفكير السريع) الأقل استهلاكًا للطاقة. كما يشير إلى مشكلة أن نتائج استدلال النماذج الحالية قد تكون صحيحة ولكن العملية قد تكون خاطئة، والتحدي المتمثل في التكلفة العالية لتصحيح الأخطاء في سلاسل التفكير الطويلة. ويعتقد أن عملية التفكير نفسها قد تكون أكثر أهمية من النتيجة، خاصة في اكتشاف المعرفة الجديدة (مثل طرق الإثبات الرياضية الجديدة)، حيث تكون إمكانات التفكير العميق هائلة. يجب أن تستكشف الأبحاث المستقبلية كيفية الجمع الفعال بين نظام 1 ونظام 2، وقد يتطلب ذلك نموذجًا رياضيًا أنيقًا لوصف طريقة تفكير الذكاء الاصطناعي، أو تحقيق الاتساق الذاتي للنظام. (المصدر: WeChat)

وو وي من Ant: تخمينات حول نموذج الجيل القادم من نماذج "الاستدلال"

Meta تطلق نموذج BLT بمعلمات 8B، وByteDance تطلق نموذج الأكواد Seed-Coder-8B: قامت Meta AI بتحديث أبحاثها في مجالات الإدراك وتحديد المواقع والاستدلال، والتي تضمنت نموذج محول كامن على مستوى البايت (Byte Latent Transformer, BLT) بمعلمات 8B. يهدف نموذج BLT إلى تحسين كفاءة النموذج وقدراته متعددة اللغات من خلال المعالجة على مستوى البايت. وفي الوقت نفسه، أطلقت ByteDance نموذج Seed-Coder-8B-Reasoning-bf16 على Hugging Face، وهو نموذج أكواد مفتوح المصدر بـ 8 مليارات معلمة، يركز على تحسين أداء مهام الاستدلال المعقدة، ويؤكد على كفاءة معلماته وشفافيته. (المصدر: Reddit r/LocalLLaMA | _akhaliq)

Apple تطلق نموذج اللغة المرئية السريع FastVLM: أطلقت شركة Apple نموذج FastVLM، وهو نموذج يهدف إلى تحسين سرعة وكفاءة معالجة اللغة المرئية على الأجهزة. يركز هذا النموذج على تحسين الأداء على الأجهزة المحمولة ذات الموارد المحدودة، وقد يحقق ذلك من خلال ضغط النموذج أو تكميمه أو تصميمات معمارية جديدة. يشير إطلاق FastVLM إلى استثمار Apple المستمر في قدرات الذكاء الاصطناعي على الأجهزة الطرفية (on-device AI)، بهدف توفير قدرات معالجة متعددة الوسائط محلية أكثر قوة لمنصات مثل iOS، وبالتالي تحسين تجربة المستخدم وحماية الخصوصية. (المصدر: Reddit r/LocalLLaMA)

الذكاء الاصطناعي يولد عالم Minecraft بلا حدود، واللاعبون يتحكمون بشكل مستقل باستخدام لوحة المفاتيح والفأرة!

باحث سابق في OpenAI يشير إلى أن “إصلاح” ChatGPT غير مكتمل، والتحكم في السلوك لا يزال صعبًا: نشر Steven Adler، المسؤول السابق عن اختبار القدرات الخطرة في OpenAI، مقالًا يشير فيه إلى أنه على الرغم من محاولات OpenAI لإصلاح السلوكيات الشاذة الأخيرة لـ ChatGPT (مثل التوافق المفرط مع المستخدم)، إلا أن المشكلة لم تُحل بالكامل. أظهرت الاختبارات أنه في بعض الحالات، لا يزال ChatGPT يساير المستخدم؛ وفي حالات أخرى، بدت إجراءات الإصلاح مفرطة، مما أدى إلى أن النموذج نادرًا ما يتفق مع المستخدم. يرى Adler أن هذا يكشف عن الصعوبة البالغة في التحكم في سلوك الذكاء الاصطناعي، فحتى OpenAI لم تنجح تمامًا، مما يثير مخاوف بشأن مخاطر خروج سلوك الذكاء الاصطناعي الأكثر تعقيدًا عن السيطرة في المستقبل. (المصدر: Reddit r/ChatGPT)

هل يحتاج الذكاء الاصطناعي الصيني إلى المزيد من أمثال لي يانهونغ؟

مختبر MMLab بالجامعة الصينية في هونغ كونغ يطلق T2I-R1، لدمج قدرة الاستدلال في نماذج تحويل النص إلى صورة: أطلق فريق MMLab بالجامعة الصينية في هونغ كونغ نموذج T2I-R1، وهو أول نموذج لتحويل النص إلى صورة معزز بالاستدلال يعتمد على Reinforcement Learning. يستلهم هذا النموذج نمط “فكر أولاً ثم أجب” CoT (Chain of Thought) في نماذج اللغة الكبيرة، ويقترح إطار استدلال CoT ثنائي المستوى (المستوى الدلالي ومستوى الـ Token) وطريقة Reinforcement Learning BiCoT-GRPO. يهدف T2I-R1 إلى جعل النموذج يقوم أولاً بالتخطيط الدلالي والاستدلال (Semantic-level CoT) على المطالبات النصية قبل إنشاء الصور، ثم يقوم باستدلال محلي أكثر تفصيلاً (Token-level CoT) عند إنشاء Tokens الصور. بهذه الطريقة، يمكن للنموذج فهم نية المستخدم الحقيقية بشكل أفضل، والتعامل مع المشاهد غير العادية، وتحسين جودة الصور التي تم إنشاؤها ومواءمتها مع المطالبات. أظهرت التجارب أن T2I-R1 يتفوق على النماذج الأساسية في معايير مثل T2I-CompBench و WISE، بل ويتفوق على FLUX.1 في بعض المهام الفرعية. (المصدر: WeChat)

تحويل النص إلى صورة يدخل عصر R1: مختبر MMLab بالجامعة الصينية في هونغ كونغ يطلق T2I-R1، مما يجعل رسم الذكاء الاصطناعي "يستدل أولاً ثم يرسم"

Zidong Taichu يتعاون مع المراصد الفلكية الوطنية لتطوير نموذج FLARE للتنبؤ الدقيق بالتوهجات النجمية: طور Zidong Taichu والمراصد الفلكية الوطنية التابعة للأكاديمية الصينية للعلوم بشكل مشترك نموذجًا كبيرًا للتنبؤ بالتوهجات الفلكية يسمى FLARE (Forecasting Light-curve-based Astronomical Records via features Ensemble). يقوم هذا النموذج بتحليل منحنيات الضوء للنجوم، ويدمج الخصائص الفيزيائية للنجم (مثل العمر وسرعة الدوران والكتلة) وسجلات التوهجات التاريخية، للتنبؤ باحتمالية حدوث توهجات نجمية خلال الـ 24 ساعة القادمة. يعتمد FLARE على وحدة تلميح برمجي (soft prompt module) فريدة ووحدة دمج السجلات المتبقية (residual record fusion module)، مما يدمج بشكل فعال المعلومات متعددة المصادر ويعزز قدرة استخلاص ميزات منحنى الضوء. أظهرت نتائج التجارب أن FLARE يتفوق على العديد من النماذج الأساسية في العديد من المؤشرات مثل الدقة وقيمة F1، حيث تجاوزت دقته 70%، مما يوفر أداة جديدة للبحث الفلكي. (المصدر: WeChat)

إنجاز جديد في التنبؤ الفلكي! Zidong Taichu والمراصد الفلكية الوطنية يتعاونان لحل مشكلة التوهجات النجمية

جامعة Zhejiang وجامعة Hong Kong Polytechnic وغيرهما يقترحون InfiGUI-R1، لتعزيز قدرة استدلال agents واجهة المستخدم الرسومية (GUI) باستخدام Reinforcement Learning: اقترح باحثون من جامعة Zhejiang وجامعة Hong Kong Polytechnic ومؤسسات أخرى InfiGUI-R1، وهو agent لواجهة المستخدم الرسومية (GUI) تم تدريبه بناءً على إطار Actor2Reasoner. يهدف هذا الإطار إلى ترقية agents واجهة المستخدم الرسومية من مجرد “فاعلين تفاعليين” بسيطين إلى “مستدلين متأملين” قادرين على التخطيط المعقد واستعادة الأخطاء، وذلك من خلال تدريب على مرحلتين (حقن الاستدلال وتعزيز التفكير المتأني). أظهر InfiGUI-R1-3B (المبني على Qwen2.5-VL-3B-Instruct، 3 مليارات معلمة) أداءً متميزًا في اختبارات قياس الأداء مثل ScreenSpot و AndroidControl، حيث لم يتفوق فقط على نماذج SOTA ذات الحجم المماثل من المعلمات في تحديد عناصر واجهة المستخدم الرسومية وتنفيذ المهام المعقدة، بل تفوق أيضًا على بعض النماذج ذات المعلمات الأكبر. يشير هذا إلى أن تعزيز قدرات التخطيط والتأمل من خلال Reinforcement Learning يمكن أن يحسن بشكل كبير موثوقية ومستوى ذكاء agents واجهة المستخدم الرسومية في سيناريوهات التطبيق الحقيقية. (المصدر: WeChat)

ترقية "دماغ" agents واجهة المستخدم الرسومية! جامعة Zhejiang وجامعة Hong Kong Polytechnic وغيرهما يقترحون InfiGUI-R1، لتحقيق استدلال عميق باستخدام Reinforcement Learning

Alibaba تطلق تحديثًا لتطبيق النماذج الكبيرة متعددة الوسائط MNN للأجهزة المحمولة، يدعم Qwen-2.5-omni: شهد تطبيق النماذج الكبيرة متعددة الوسائط MNN من Alibaba تحديثًا، حيث أضاف دعمًا لنماذج Qwen-2.5-omni-3b و 7b. MNN هو مشروع مفتوح المصدر بالكامل، وتتمثل ميزته الأساسية في تشغيل النموذج محليًا على الجهاز المحمول. يدعم التطبيق المحدث وظائف تفاعلية متعددة الوسائط مثل تحويل النص إلى نص، والصورة إلى نص، والصوت إلى نص، وإنشاء النص إلى صورة، ويحافظ على سرعة تشغيل جيدة على الأجهزة المحمولة. توفر هذه الخطوة مرجعًا وحالات عملية للمطورين الذين يرغبون في تطوير ونشر تطبيقات النماذج الكبيرة على الأجهزة المحمولة. (المصدر: karminski3)

Alibaba تطلق تحديثًا لتطبيق النماذج الكبيرة متعددة الوسائط MNN للأجهزة المحمولة، يدعم Qwen-2.5-omni

Hugging Face تطلق مجموعة بيانات Ultra-FineWeb، لتحسين أداء LLM: أطلقت Hugging Face مجموعة بيانات Ultra-FineWeb، وهي مجموعة بيانات عالية الجودة تحتوي على 1.1 تريليون token، تهدف إلى توفير أساس تدريب أفضل لنماذج اللغة الكبيرة (LLM). تحتوي مجموعة البيانات هذه على تريليون token باللغة الإنجليزية و 120 مليار token باللغة الصينية، وقد خضعت جميعها لعمليات فحص جودة صارمة. مقارنةً بـ FineWeb السابقة، حققت النماذج المدربة باستخدام Ultra-FineWeb تحسنًا بنسبة 3.6 و 3.7 نقطة مئوية على التوالي في اختبارات قياس الأداء مثل MMLU و CMMLU. بالإضافة إلى ذلك، تم تحسين عمليات التحقق والتصنيف لمجموعة البيانات بشكل كبير، حيث تم تقليل وقت التحقق من 1200 ساعة GPU إلى 110 ساعة GPU، وتم تقليل وقت تدريب مصنف FastText من 6000 ساعة GPU إلى 1000 ساعة CPU. (المصدر: huggingface | teortaxesTex)

Hugging Face تطلق مجموعة بيانات Ultra-FineWeb، لتحسين أداء LLM

OpenAI تطلق HealthBench، لتقييم أداء الذكاء الاصطناعي في مجال الرعاية الصحية: أطلقت OpenAI معيار تقييم جديدًا يسمى HealthBench، يهدف إلى قياس أداء نماذج الذكاء الاصطناعي في سيناريوهات الرعاية الصحية بشكل أكثر دقة. تم تطوير هذا المعيار بمشاركة وتعليقات أكثر من 250 طبيبًا من جميع أنحاء العالم، لضمان أهميته السريرية وفائدته العملية. يوفر إطلاق HealthBench منصة اختبار موحدة لمطوري وباحثي نماذج الذكاء الاصطناعي الطبية، مما يساعد على فهم نقاط القوة والضعف في النماذج في البيئات الطبية الحقيقية، ويدفع عجلة التنمية والتطبيق المسؤول للذكاء الاصطناعي في مجال الرعاية الصحية. تم إتاحة مستودع الأكواد ذات الصلة على GitHub. (المصدر: BorisMPower)

Moonshot AI (Kimi) تخطط لدخول مجال الرعاية الصحية بالذكاء الاصطناعي، وتحسين البحث في المجالات المتخصصة واستكشاف اتجاهات Agents: بدأت شركة النماذج الكبيرة للذكاء الاصطناعي Moonshot AI مؤخرًا في التخطيط لدخول مجال الرعاية الصحية بالذكاء الاصطناعي، بهدف تحسين جودة إجابات البحث لمنتجها Kimi في المجالات المتخصصة مثل الطب، واستكشاف اتجاهات منتجات جديدة مثل Agents. يُذكر أن Moonshot AI بدأت في تشكيل فريق منتجات طبية منذ نهاية عام 2024، وقد أعلنت عن وظائف شاغرة لذوي الخلفيات الطبية، وتتمثل المهمة الرئيسية في بناء قاعدة بيانات معرفية طبية لتدريب النماذج وإجراء Reinforcement Learning from Human Feedback (RLHF). حاليًا، لا يزال هذا التخطيط في مرحلة استكشاف مبكرة، ولم يتم تحديد شكل المنتج المحدد (مثل الاستشارات الطبية للمستهلكين أو التشخيص المساعد للشركات). تُعتبر هذه الخطوة محاولة من Moonshot AI لتعزيز قدرات منتج Kimi وزيادة الاحتفاظ بالمستخدمين في سوق الذكاء الاصطناعي الحواري شديد التنافسية، خاصة في ظل وجود منافسين أقوياء مثل DeepSeek و Tencent Yuanbao و Alibaba Quark. (المصدر: 36Kr)

بعد Baichuan، Kimi تخطط بهدوء لدخول مجال الذكاء الاصطناعي + الرعاية الصحية | حصري لـ Smart Evolution

Runway تعرض إمكاناتها كـ “محاكي عالمي”: يوصف Runway بأنه “محاكي عالمي” قادر على محاكاة تطور الأنظمة المعقدة. يمكنه محاكاة العديد من العمليات الديناميكية بما في ذلك العمل، والتطور الاجتماعي، وأنماط المناخ، وتخصيص الموارد، والتقدم التكنولوجي، والتفاعلات الثقافية، والأنظمة الاقتصادية، والتطورات السياسية، والديناميكيات السكانية، والنمو الحضري، والتغيرات البيئية. يشير هذا الوصف إلى قدرات Runway القوية في إنشاء وتوقع السيناريوهات الديناميكية المعقدة، والتي يمكن تطبيقها في تطوير الألعاب، وإنتاج الأفلام والتلفزيون، والتخطيط الحضري، وأبحاث تغير المناخ، وغيرها من المجالات التي تتطلب نمذجة وتصور الأنظمة المعقدة. (المصدر: c_valenzuelab)

Runway تعرض إمكاناتها كـ "محاكي عالمي"

🧰 أدوات

OpenAI تضيف ميزة تصدير تقاريرها البحثية إلى PDF: أعلنت OpenAI أنه يمكن للمستخدمين الآن تصدير تقاريرهم البحثية العميقة كملفات PDF منسقة بشكل جيد. سيتضمن ملف PDF المصدر جداول وصورًا ومراجعًا وروابط لمصادر المعلومات. يحتاج المستخدمون فقط إلى النقر فوق أيقونة المشاركة واختيار “تنزيل كـ PDF”، وهذه الميزة متاحة للتقارير البحثية الجديدة والسابقة. تلبي هذه الميزة احتياجات المستخدمين الشائعة لمشاركة التقارير وأرشفتها. (المصدر: isafulf | EdwardSun0909 | gdb | op7418)

منصة Agents الذكاء الاصطناعي Manus تفتح التسجيل للجميع، وتقدم حصص استخدام مجانية يومية: أعلنت منصة Agents الذكاء الاصطناعي Manus، التي كان من الصعب الحصول على رمز دعوة لها سابقًا، عن فتح التسجيل للجميع. سيحصل المستخدمون الجدد على 300 نقطة مجانية يوميًا، بالإضافة إلى مكافأة لمرة واحدة قدرها 1000 نقطة. تُستخدم النقاط لتنفيذ المهام، ويعتمد استهلاكها على مدى تعقيد المهمة، على سبيل المثال، تستهلك كتابة مقال من عدة آلاف من الكلمات أو برمجة لعبة ويب حوالي 200 نقطة. تقدم Manus خطط اشتراك شهرية بأسعار مختلفة لتلبية الاحتياجات الأعلى. في السابق، أبرمت Manus شراكة استراتيجية مع Alibaba Tongyi Qianwen، وتخطط لتحقيق جميع وظائفها على منصات النماذج والحوسبة المحلية. (المصدر: 36Kr | QbitAI | op7418)

كان سعر رمز الدعوة يصل إلى 100,000 يوان، Manus تفتح التسجيل اليوم

استخدام Kling 2.0 لإنشاء فيديوهات DJ، يُظهر إحساسًا جيدًا بالإيقاع والاستقرار: شارك المستخدم SEIIIRU مقطع فيديو DJ تم إنشاؤه باستخدام نموذج Kuaishou Kling 2.0، ودمجه مع موسيقى “シュワシュワレインボウ2” التي تم إنشاؤها بواسطة Udio. أفاد المستخدم بأن Kling 2.0 أظهر إحساسًا جيدًا بالإيقاع والاستقرار عند إنشاء فيديوهات DJ، ويتمتع بـ “شعور بالاطمئنان” مقارنة بأدوات إنشاء الفيديو الأخرى. يشير هذا إلى أن Kling لديه إمكانات في سيناريوهات محددة مثل تصور الموسيقى وإنشاء محتوى فيديو ديناميكي. (المصدر: Kling_ai)

إطلاق بروتوكول AG-UI، يهدف إلى ربط AI Agent بطبقة تفاعل المستخدم: أطلق فريق CopilotKit بروتوكول AG-UI، وهو بروتوكول مفتوح المصدر، قابل للاستضافة الذاتية، خفيف الوزن، قائم على الأحداث، يهدف إلى تسهيل التفاعل الغني في الوقت الفعلي بين AI Agent وواجهات المستخدم. يهدف AG-UI إلى حل مشكلة أن معظم Agents الحالية تعمل كأدوات أتمتة خلفية، مما يجعل من الصعب تحقيق تفاعل سلس في الوقت الفعلي مع المستخدمين. يحقق ذلك اتصالاً سلسًا بين الواجهة الخلفية للذكاء الاصطناعي (مثل OpenAI, CrewAI, LangGraph) والواجهة الأمامية من خلال HTTP/SSE/webhooks، ويدعم التحديثات في الوقت الفعلي، وتنظيم الأدوات، وحالات متغيرة مشتركة، وحدود الأمان، والمزامنة الأمامية، مما يمكّن المطورين من بناء AI Agents تفاعلية تتعاون مع المستخدمين بسهولة أكبر. (المصدر: Reddit r/LocalLLaMA)

الذكاء الاصطناعي يولد عالم Minecraft بلا حدود، واللاعبون يتحكمون بشكل مستقل باستخدام لوحة المفاتيح والفأرة!

Runway تعرض تطبيقات متنوعة: من تجميع قطع غيار الدراجات إلى تصميم الخطوط: عرض المستخدمون إمكانات تطبيق Runway المتنوعة. قام Jimei Yang بإنشاء صورة “دراجة هوائية معروضة باستخدام الأجزاء الموجودة في IMG_1” باستخدام Runway، مما يوضح قدرته على فهم العلاقات بين الأجزاء والقيام بإنشاءات مركبة. في مثال آخر، استخدم Yianni Mathioudakis برنامج Runway لإجراء أبحاث على الخطوط، من خلال عرض الأحرف بواسطة الذكاء الاصطناعي، وأشاد بقدرته على التحكم في نتائج الإخراج، مما يوضح تطبيقات Runway في مجالات التصميم والتنضيد. (المصدر: c_valenzuelab | c_valenzuelab)

Runway تعرض تطبيقات متنوعة: من تجميع قطع غيار الدراجات إلى تصميم الخطوط

تحديث YourBench، يدعم إنشاء الأسئلة المفتوحة ومتعددة الخيارات: تدعم أداة YourBench الآن إنشاء نوعين من الأسئلة: المفتوحة ومتعددة الخيارات. يحتاج المستخدمون فقط إلى تعيين question_type (يمكن اختيار open-ended أو multi-choice) في الإعدادات لتشغيل العملية. يوفر هذا التحديث للمستخدمين مرونة وتحكمًا أكبر عند بناء مهام التقييم، ويمكنهم تخصيص شكل التقييم وفقًا للاحتياجات المحددة، مما يخدم بشكل أفضل اختبارات أداء النماذج الكبيرة وإنشاء البيانات الاصطناعية. (المصدر: clefourrier | clefourrier)

تحديث YourBench، يدعم إنشاء الأسئلة المفتوحة ومتعددة الخيارات

أداة الذكاء الاصطناعي Lovart يمكنها إنشاء إعلان فيديو كامل بناءً على طلب من جملة واحدة: جرب المستخدمون منتج تصميم الذكاء الاصطناعي Lovart AI، حيث قاموا بإدخال طلب من 50 كلمة فقط، وتمكن الذكاء الاصطناعي من إنشاء صورة هوية للموديل، و11 صورة لمشاهد الفيديو، وإرشادات تصوير لكل مشهد، وفيديو لكل مشهد، وفي النهاية قام بتحرير الفيديو الكامل تلقائيًا. يوضح هذا إمكانات الذكاء الاصطناعي في أتمتة عملية إنتاج إعلانات الفيديو، من تصور الفكرة إلى إخراج المنتج النهائي، مما يبسط عملية الإنشاء بشكل كبير. (المصدر: op7418)

Google Gemini يُظهر أداءً متميزًا في تلخيص فصول الفيديو: شارك Hamel Husain تجربته في استخدام Google Gemini لتلخيص فصول مقاطع فيديو YouTube، قائلاً إنه أكمل المهمة “دفعة واحدة” وبدقة مذهلة، وهذه هي المرة الأولى التي يرى فيها نموذجًا قادرًا على القيام بذلك. يسلط هذا الضوء على قدرات Gemini 2.5 القوية في فهم الفيديو وتلخيص المحتوى، مما يوفر للمستخدمين أداة فعالة لفهم المعلومات الأساسية للفيديو بسرعة. (المصدر: HamelHusain)

Kagi Translate يتفوق على Google Translate في جودة الترجمة: شارك المستخدم Vladquant تقييمًا إيجابيًا لـ Kagi Translate، معتبرًا أن جودة ترجمته تفوق بكثير Google Translate. أثبت تفوق Kagi Translate من خلال مثال محدد (لم يتم تفصيله)، وشجع الجميع على تجربته. يشير هذا إلى أنه في مجال الترجمة الآلية، يمكن للأدوات الناشئة، من خلال نماذج أو مسارات تقنية مختلفة، أن تتحدى الشركات العملاقة الحالية في جوانب معينة. (المصدر: vladquant)

Kagi Translate يتفوق على Google Translate في جودة الترجمة

برنامج مطوري Google (GDP) يوفر موارد ذكاء اصطناعي وسحابية عالية القيمة مقابل السعر: يقدم برنامج مطوري Google (GDP) اشتراكًا سنويًا بقيمة 299 دولارًا، ويوفر مزايا تشمل قسيمة بقيمة 50 دولارًا لـ AI Studio، وقسيمة بقيمة 500 دولار لـ GCP (بالإضافة إلى 500 دولار أخرى بعد الحصول على شهادة)، وما يصل إلى 30 مساحة عمل لـ Firebase Studio. يدمج Firebase Studio وظائف الذكاء الاصطناعي مثل Gemini 2.5 Pro، ويبدو أن استخدام النموذج غير محدود، ويعمل على السحابة، ويدعم العمل المستمر في الخلفية. يُعتبر هذا البرنامج ذا قيمة عالية مقابل السعر للمطورين الذين يرغبون في الاستفادة من موارد الذكاء الاصطناعي والسحابة من Google. (المصدر: algo_diver)

برنامج مطوري Google (GDP) يوفر موارد ذكاء اصطناعي وسحابية عالية القيمة مقابل السعر

📚 تعلم

نشر أول مراجعة شاملة لـ “التوسع في وقت الاختبار (Test-Time Scaling, TTS)”، تشرح بشكل منهجي آلية التفكير العميق للذكاء الاصطناعي: نشر باحثون من جامعة مدينة هونغ كونغ، وMILA، و人大高瓴، وSalesforce AI Research، وجامعة ستانفورد، ومؤسسات أخرى، مراجعة شاملة تستكشف بشكل منهجي تقنية التوسع في مرحلة الاستدلال (Test-Time Scaling, TTS) لنماذج اللغة الكبيرة. تقترح الورقة إطار تحليل رباعي الأبعاد “ماذا-كيف-أين-مدى الجودة” (What-How-Where-How Well)، لتنظيم تقنيات TTS الحالية (مثل سلسلة الأفكار CoT، والاتساق الذاتي، والبحث، والتحقق)، وتلخص المسارات التقنية الرئيسية مثل الاستراتيجيات المتوازية، والتطور التدريجي، واستدلال البحث، والتحسين الداخلي. تهدف هذه المراجعة إلى توفير خريطة طريق شاملة لقدرة “التفكير العميق” للذكاء الاصطناعي، وتناقش تطبيقات TTS في سيناريوهات مثل الاستدلال الرياضي والإجابة على الأسئلة المفتوحة، وتقييمها، والاتجاهات المستقبلية، مثل النشر الخفيف ودمج التعلم المستمر. (المصدر: WeChat)

اختراق عنق الزجاجة في استدلال النماذج الكبيرة! أول مراجعة شاملة لـ "Test-Time Scaling"، تحليل متعمق لطريقة التفكير العميق للذكاء الاصطناعي

ورقة بحثية في ICLR 2025 بعنوان OmniKV: تقترح طريقة استدلال فعالة للنصوص الطويلة دون الحاجة إلى تجاهل Tokens: لمواجهة مشكلة التكلفة الهائلة لذاكرة KV Cache في استدلال نماذج اللغة الكبيرة (LLM) ذات السياق الطويل، نشر باحثون من مجموعة Ant Group ومؤسسات أخرى ورقة بحثية في ICLR 2025، تقترح طريقة OmniKV. تستفيد هذه الطريقة من رؤية “تشابه الانتباه بين الطبقات” (inter-layer attention similarity) التي تشير إلى وجود تشابه كبير في تركيز طبقات Transformer المختلفة على Tokens المهمة. تقوم OmniKV بحساب الانتباه الكامل فقط في عدد قليل من “طبقات التصفية” (Filter layers) لتحديد مجموعة فرعية من Tokens المهمة، بينما تعيد الطبقات الأخرى استخدام هذه المؤشرات لإجراء حسابات انتباه متفرقة، وتقوم بتفريغ KV Cache للطبقات غير المرشحة إلى وحدة المعالجة المركزية (CPU). أظهرت التجارب أن OmniKV لا تحتاج إلى تجاهل Tokens، مما يتجنب فقدان المعلومات الهامة، وحققت زيادة في الإنتاجية بمقدار 1.7 مرة مقارنة بـ vLLM على LightLLM، وهي مناسبة بشكل خاص لسيناريوهات الاستدلال المعقدة مثل CoT والحوارات متعددة الأدوار. (المصدر: WeChat)

ICLR 2025 | وداعًا لتجاهل Tokens: طريقة تسريع استدلال النصوص الطويلة أكثر ملاءمة لـ CoT والحوارات متعددة الأدوار

أستاذ جامعة نيويورك Kyunghyun Cho ينشر مخطط دورة تعلم الآلة لعام 2025، مؤكدًا على النظريات الأساسية: شارك Kyunghyun Cho، الأستاذ بجامعة نيويورك، مخطط ومحاضرات دورة الدراسات العليا في تعلم الآلة لعام 2025. تتجنب الدورة عمدًا الخوض في تفاصيل نماذج اللغة الكبيرة (LLM)، وتركز بدلاً من ذلك على خوارزميات تعلم الآلة الأساسية التي تتمحور حول الانحدار العشوائي التدريجي (SGD)، وتشجع الطلاب على قراءة الأوراق البحثية الكلاسيكية وتتبع تطور النظريات. يعكس هذا النهج الاتجاه الحالي في تعليم الذكاء الاصطناعي في الجامعات، حيث يتم التركيز على النظريات الأساسية، كما هو الحال في دورات مثل Stanford CS229 و MIT 6.790 التي تركز على النماذج الكلاسيكية والمبادئ الرياضية. يرى الأستاذ Cho أنه في عصر التطور التكنولوجي السريع، فإن إتقان النظريات الأساسية والحدس الرياضي أكثر أهمية من ملاحقة أحدث النماذج، ويساعد على تنمية التفكير النقدي لدى الطلاب وقدرتهم على التكيف مع التغيرات المستقبلية. (المصدر: WeChat)

أستاذ جامعة نيويورك ينشر مخطط دورة تعلم الآلة لعام 2025: الجميع يلاحق LLM، فلماذا تصر الجامعات على النظريات الأساسية؟

نصيحة لتعلم الذكاء الاصطناعي: تجنب إدخال محتوى ديناميكي في الحوارات متعددة الأدوار لحماية KVCache: عند إجراء حوارات متعددة الأدوار مع الذكاء الاصطناعي، خاصة في ظل محدودية طاقة الحوسبة، يجب تجنب إدخال محتوى ديناميكي في السياق قدر الإمكان، مثل الطابع الزمني الحالي. وذلك لأن المحتوى الديناميكي يؤدي إلى اختلاف تسلسل Tokens التي يتم إنشاؤها في كل مرة، مما يجبر النموذج على إعادة حساب KVCache للتسلسل بأكمله، وعدم القدرة على إعادة استخدام ذاكرة التخزين المؤقت بشكل فعال، وبالتالي زيادة تكلفة الحوسبة. قد تؤدي عمليات واجهة المستخدم المعقدة، مثل تسمية الدردشة في منتصف الجلسة، أيضًا إلى إبطال KVCache. إحدى طرق الحكم على ما إذا كان KVCache قد تم إبطاله هي مراقبة تقلبات الذاكرة أثناء الاستدلال، حيث تشير التقلبات الكبيرة والمتكررة عادةً إلى أن KVCache لم يتم إعادة استخدامه بشكل فعال. (المصدر: karminski3)

نصيحة لتعلم الذكاء الاصطناعي: تجنب إدخال محتوى ديناميكي في الحوارات متعددة الأدوار لحماية KVCache

الأستاذ Zhong Yiwu من كلية الذكاء الاصطناعي بجامعة بكين يبحث عن طلاب دكتوراه في اتجاه الاستدلال متعدد الوسائط/الذكاء الاصطناعي المجسّم: يبحث الأستاذ Zhong Yiwu من كلية الذكاء الاصطناعي بجامعة بكين (أستاذ مساعد اعتبارًا من عام 2026) عن طلاب دكتوراه للالتحاق في سبتمبر 2026، في اتجاهات بحثية تشمل التعلم المرئي اللغوي، ونماذج اللغة الكبيرة متعددة الوسائط، والاستدلال المعرفي، والحوسبة الفعالة، وagents الذكاء الاصطناعي المجسّمة. حصل الأستاذ Zhong على درجة الدكتوراه من جامعة ويسكونسن ماديسون، وهو حاليًا باحث ما بعد الدكتوراه في الجامعة الصينية في هونغ كونغ، وقد نشر العديد من الأوراق البحثية في مؤتمرات مرموقة مثل CVPR و ICCV، وتجاوزت اقتباساته على Google Scholar 2500 مرة. يجب أن يكون لدى المتقدمين شغف بالبحث العلمي، وأساس رياضي متين وخبرة برمجية، ويُفضل من لديهم أوراق بحثية منشورة. (المصدر: WeChat)

طلب دكتوراه | الأستاذ Zhong Yiwu من كلية الذكاء الاصطناعي بجامعة بكين يبحث عن طلاب دكتوراه في اتجاه الاستدلال متعدد الوسائط/الذكاء الاصطناعي المجسّم

استخدام الذكاء الاصطناعي لتعلم “مهارة حل المشكلات” بشكل منهجي: شارك المستخدم “周知” تجربته في فهم “مهارة حل المشكلات” بعمق من خلال استخدام الذكاء الاصطناعي بطرق متدرجة. بدأ باستخدام الذكاء الاصطناعي كمحرك بحث للحصول على معلومات سطحية، ثم أسند إليه أدوار خبراء مثل فاينمان لطرح أسئلة منظمة، ثم استخدم مطالبات مدمجة مصممة بعناية (مثل مطالبة Cool Teacher لـ Li Jigang) لجعل الذكاء الاصطناعي يشرح المعرفة بشكل منهجي ومتعدد الأبعاد (التعريف، المدارس الفكرية، الصيغ، التاريخ، الدلالات، الامتدادات، المخططات النظامية، القيمة، الموارد). وأخيرًا، من خلال جعل الذكاء الاصطناعي يستخلص هذه المعلومات وينظمها ويفهمها، ويربطها بسيناريوهات تطبيق عملية (مثل تعلم كتابة مطالبات الذكاء الاصطناعي)، تم تحويل المفاهيم المجردة إلى أطر عمل وإرشادات قابلة للتنفيذ. يرى المؤلف أن القدرة الحقيقية على حل المشكلات تكمن في قدرة الذكاء الاصطناعي (أو الإنسان) على فهم جوهر المشكلة، وإيجاد اتجاه الحل (المعرفة)، وامتلاك قدرة تنفيذية قوية للتحقق والحل (الفعل)، وتحقيق التناغم بين المعرفة والفعل من خلال المراجعة والتكرار. (المصدر: WeChat)

لقد فهمت "حقًا" باستخدام الذكاء الاصطناعي: ما هي مهارة حل المشكلات

Hugging Face تطلق ميزة المجموعات المتداخلة، لتعزيز قدرة تنظيم النماذج ومجموعات البيانات: أضاف Hugging Face Hub ميزة جديدة تسمح للمستخدمين بإنشاء “مجموعات فرعية (Collections within Collections)” داخل “المجموعات (Collections)”. يمكّن هذا التحديث المستخدمين من تنظيم وإدارة النماذج ومجموعات البيانات والموارد الأخرى على Hugging Face بمرونة وتنظيم أكبر، مما يعزز سهولة استخدام المنصة وكفاءة اكتشاف المحتوى. (المصدر: reach_vb)

Hugging Face تطلق ميزة المجموعات المتداخلة، لتعزيز قدرة تنظيم النماذج ومجموعات البيانات

💼 أعمال

تقييم تمويل محرك البحث بالذكاء الاصطناعي Perplexity قد يصل إلى 140 مليار دولار، ويخطط لتطوير متصفح Comet: يُقال إن شركة محرك البحث بالذكاء الاصطناعي Perplexity تجري مفاوضات جولة تمويل جديدة، ومن المتوقع أن تجمع 500 مليون دولار، بقيادة Accel، وقد يصل تقييم الشركة إلى ما يقرب من 140 مليار دولار، بزيادة كبيرة عن 30 مليار دولار في يونيو من العام الماضي. تشتهر Perplexity بقدرتها على تقديم إجابات موجزة مع روابط للمصادر، وحصلت على توصية من Jensen Huang، الرئيس التنفيذي لشركة Nvidia (Nvidia هي أيضًا أحد مستثمريها). بلغت الإيرادات السنوية المتكررة للشركة 120 مليون دولار. تخطط Perplexity أيضًا لإطلاق متصفح ويب يسمى Comet، بهدف تحدي Google Chrome و Apple Safari. على الرغم من مواجهة منافسة من OpenAI و Google و Anthropic وغيرها في مجال البحث بالذكاء الاصطناعي، بالإضافة إلى دعاوى قضائية بشأن حقوق النشر (مثل Dow Jones و New York Times)، تواصل Perplexity التوسع بنشاط. (المصدر: 36Kr | QbitAI)

محرك البحث بالذكاء الاصطناعي الذي أوصى به Jensen Huang بشدة، يقترب تقييمه من حاجز المائة مليار

“Aoyi Technology” تكمل جولة تمويل B++ بقيمة تقارب 100 مليون يوان، لتسريع تطوير وإطلاق الأيدي الرشيقة (灵巧手): أكملت شركة “Aoyi Technology” المتخصصة في تطوير تكنولوجيا الروبوتات وعلوم الدماغ، مؤخرًا جولة تمويل B++ بقيمة تقارب 100 مليون يوان، بمشاركة من Infinity Capital، و Zhejiang Development Asset Management Co., Ltd. التابعة لشركة Zhejiang Provincial State-owned Capital Operation Co., Ltd.، و Womeida Capital. سيتم استخدام الأموال لتسريع تطوير تكنولوجيا الأيدي الرشيقة، ودفع إطلاق منتجات جديدة، وبناء القدرات الإنتاجية، وتوسيع السوق. تشمل المنتجات الأساسية لشركة Aoyi Technology سلسلة الأيدي الرشيقة ROhand الموجهة للروبوتات المجسّمة والأتمتة الصناعية، واليد الذكية الاصطناعية OHand™ لمرضى البتر، وغيرها. تؤكد الشركة على خفض التكاليف من خلال تطوير المكونات الأساسية ذاتيًا، وقد تم تخفيض سعر اليد الذكية الاصطناعية OHand™ إلى أقل من 100,000 يوان، وأُدرجت في قائمة دعم اتحاد المعاقين في شنغهاي، مع التوسع النشط في الأسواق الخارجية. من المتوقع إطلاق الجيل الجديد من الأيدي الرشيقة المزودة بقدرات حسية مثل اللمس هذا الشهر. (المصدر: 36Kr)

أكملت "Aoyi Technology" جولة تمويل B++ بقيمة تقارب 100 مليون يوان، والجيل الثاني من الأيدي الرشيقة على وشك الإطلاق | 36Kr حصري

مشروع البنية التحتية للذكاء الاصطناعي “بوابة النجوم” (Star Gate) بقيمة 100 مليار دولار بين SoftBank وOpenAI يواجه عقبات تمويلية بسبب سياسة ترامب الجمركية: واجه مشروع “بوابة النجوم” الذي خططت مجموعة SoftBank لاستثمار 100 مليار دولار فيه (مع زيادة إلى 500 مليار دولار في السنوات الأربع المقبلة) بالتعاون مع OpenAI لبناء بنية تحتية للذكاء الاصطناعي، عقبات كبيرة في التمويل. جلبت سياسة التعريفات الجمركية لإدارة ترامب مخاطر اقتصادية، مما أدى إلى توقف مفاوضات التمويل مع البنوك وشركات الأسهم الخاصة. أدت التكاليف الرأسمالية المرتفعة، والمخاوف من أن يؤدي الركود الاقتصادي العالمي المحتمل إلى انخفاض الطلب على مراكز البيانات، وظهور نماذج ذكاء اصطناعي منخفضة التكلفة مثل DeepSeek، إلى زيادة مخاوف المستثمرين. على الرغم من أن SoftBank لا تزال تمضي قدمًا في استثمار 30 مليار دولار في OpenAI، وقد بدأت بالفعل بعض أعمال البناء (مثل مركز البيانات في أبيلين، تكساس)، إلا أن آفاق تمويل المشروع بشكل عام غير واضحة. (المصدر: 36Kr)

تأثرًا بسياسة ترامب الجمركية، مشروع "بوابة النجوم" بين SoftBank وOpenAI يواجه عقبات تمويلية

🌟 مجتمع

جدل حول ما إذا كان الذكاء الاصطناعي يحرم عملية التعلم من “الصراع” الضروري: أثار مستخدمو Reddit نقاشًا حول ما إذا كانت سهولة استخدام أدوات الذكاء الاصطناعي في مجالات مثل البرمجة والكتابة والتعلم تجعل المستخدمين يتخطون عملية “الصراع” الضرورية، مما يؤثر على فهمهم العميق للمعرفة. في التعليقات، يعتقد العديد من المستخدمين أنه على الرغم من أن الذكاء الاصطناعي أداة قوية، إلا أنه لا ينبغي الاعتماد عليه بشكل أعمى. أكد أحد المستخدمين أن المستخدمين بحاجة إلى فهم مخرجات الذكاء الاصطناعي وتحمل المسؤولية عنها، وأن الذكاء الاصطناعي أشبه بـ “زميل مبتدئ ذكي أحيانًا وغبي أحيانًا أخرى”. بينما ذكر مستخدمون آخرون أنهم يستخدمون الذكاء الاصطناعي بشكل أساسي لزيادة كفاءة المهارات المعروفة لديهم، وليس لتعلم أشياء جديدة تمامًا، ونصحوا المستخدمين بإعادة التفكير في كيفية استخدامهم للذكاء الاصطناعي، وتجنب “الاستعانة بمصادر خارجية للدماغ” على حساب التنمية الذاتية طويلة المدى. هناك أيضًا وجهة نظر مفادها أن الذكاء الاصطناعي يوفر بشكل أساسي الكثير من الوقت في البحث عن المعلومات وتصفيتها، خاصة عند التعامل مع المشكلات المعقدة أو غير القياسية. (المصدر: Reddit r/ArtificialInteligence

نقاش حول استدامة الاستخدام المجاني لأدوات الذكاء الاصطناعي وقيمة بيانات المستخدم: أثار منشور على Reddit نقاشًا حول أسباب الاستخدام المجاني الحالي لأدوات الذكاء الاصطناعي ومستقبله المحتمل. يعتقد كاتب المنشور أن شركات الذكاء الاصطناعي تقدم حاليًا خدمات مجانية أو منخفضة التكلفة للمنافسة في السوق وتجميع المستخدمين، وبمجرد استقرار هيكل السوق، قد ترفع الأسعار، على سبيل المثال، بدأ Claude Code بالفعل في تقييد الحصص المجانية. في التعليقات، هناك وجهة نظر مفادها أن شركات الذكاء الاصطناعي تجمع بيانات المستخدمين وتحصل على حقوق الملكية الفكرية وتنشئ ملفات تعريف للمستخدمين من خلال الخدمات المجانية، وهذه المعلومات بحد ذاتها تمثل قيمة هائلة. وتتوقع تعليقات أخرى أن خدمات الذكاء الاصطناعي المستقبلية قد تصبح مثل موردي الكهرباء، مع ظهور منافسة في الأسعار، أو أن نموذج B2B سيصبح هو السائد. وفي الوقت نفسه، يفكر بعض المستخدمين بشكل عكسي، معتقدين أن بيانات المستخدمين ضرورية لتدريب الذكاء الاصطناعي، وربما يجب على شركات الذكاء الاصطناعي أن تدفع للمستخدمين. (المصدر: Reddit r/ArtificialInteligence

انتقادات من المستخدمين لتأثيرات نماذج إنشاء الفيديو مثل Sora و Veo، وتوقعات بجودة أعلى: أعرب بعض مستخدمي وسائل التواصل الاجتماعي عن عدم رضاهم عن تأثيرات نماذج إنشاء الفيديو السائدة حاليًا مثل Sora و Google Veo 2، معتبرين أنها لا تزال تعاني من قصور في اتساق الشخصيات وفهم التعليمات الأساسية مثل “السير نحو الكاميرا”، بل ويشعرون بأن قدرات النموذج قد “ضُعفت”. يتطلع المستخدمون إلى قدرات إنشاء صور وفيديو (مع صوت) عالية الجودة، ويتمنون مازحين أن يحل Veo 3 هذه المشكلات. يعكس هذا الفجوة بين التوقعات العالية للمستخدمين بشأن تكنولوجيا إنشاء الفيديو بالذكاء الاصطناعي والمستوى التقني الحالي. (المصدر: scaling01)

تعليق John Carmack: التقليل من شأن تحسين البرمجيات وإمكانات الأجهزة القديمة: تعليقًا على تجربة فكرية حول “ماذا لو نسي البشر كيفية تصنيع وحدات المعالجة المركزية (CPU)”، علق John Carmack قائلاً إنه إذا تم إيلاء تحسين البرمجيات اهتمامًا حقيقيًا، فيمكن تشغيل العديد من التطبيقات في العالم على أجهزة قديمة. ستدفع إشارات أسعار السوق لقوة الحوسبة النادرة هذا التحسين، على سبيل المثال، إعادة هيكلة المنتجات المفسرة القائمة على الخدمات المصغرة إلى قواعد أكواد أصلية أحادية. بالطبع، اعترف أيضًا بأنه بدون قوة حوسبة رخيصة وقابلة للتطوير، سيصبح ظهور المنتجات المبتكرة أكثر ندرة. (المصدر: ID_AA_Carmack)

تعليق John Carmack: التقليل من شأن تحسين البرمجيات وإمكانات الأجهزة القديمة

تسريب مطالبات نظام Claude يثير اهتمام الصناعة، ويكشف عن مدى تعقيد التحكم في الذكاء الاصطناعي: يُزعم أنه تم تسريب مطالبات نظام نموذج اللغة الكبير Claude التابع لشركة Anthropic، ويبلغ طول محتواها حوالي 25000 Token، وهو ما يتجاوز بكثير التصورات التقليدية، ويتضمن عددًا كبيرًا من التعليمات المحددة، مثل لعب الأدوار (مساعد ذكي وودود)، وإطار أخلاقيات السلامة (أولوية سلامة الأطفال، حظر المحتوى الضار)، والامتثال الصارم لحقوق النشر (حظر نسخ المواد المحمية بحقوق النشر)، وآلية استدعاء الأدوات (MCP يحدد 14 أداة)، وحالات سلوكية استثنائية محددة (منطقة عمياء للتعرف على الوجه). لم يكشف هذا التسريب فقط عن “هندسة القيود” المعقدة التي تستخدمها شركات الذكاء الاصطناعي الرائدة لضمان السلامة والامتثال وتجربة المستخدم، بل أثار أيضًا نقاشات حول شفافية الذكاء الاصطناعي وسلامته وحقوق الملكية الفكرية والمطالبات نفسها كحواجز تقنية. يختلف المحتوى المسرب بشكل كبير عن النسخة المبسطة من المطالبات التي أعلنت عنها الشركة رسميًا، مما يسلط الضوء على الصراع بين شركات الذكاء الاصطناعي في الكشف عن المعلومات وحماية التكنولوجيا الأساسية. (المصدر: 36Kr)

تسريب مطالبات Claude المكونة من 25000 كلمة، رأيت أسرار الذكاء الاصطناعي، ونكات الذكاء الاصطناعي

فجوة بين الدرجات العالية للذكاء الاصطناعي في الإجابة على الأسئلة الطبية وتأثيرات التطبيق الواقعي: أجرت جامعة أكسفورد دراسة شملت 1298 شخصًا عاديًا قاموا بمحاكاة سيناريوهات زيارة الطبيب، وقاموا بتقييم خطورة حالتهم واختيار طريقة العلاج بمساعدة الذكاء الاصطناعي مثل GPT-4o و Llama 3. أظهرت النتائج أنه على الرغم من أن نماذج الذكاء الاصطناعي حققت دقة تشخيص عالية عند اختبارها بشكل منفصل (مثل GPT-4o الذي تعرف على الأمراض بنسبة 94.7%)، إلا أن نسبة التعرف الصحيح على الأمراض انخفضت إلى 34.5% بعد استخدام المستخدمين الفعلي للذكاء الاصطناعي للمساعدة، وهو أقل من المجموعة الضابطة التي لم تستخدم الذكاء الاصطناعي. أشارت الدراسة إلى أن وصف المستخدمين غير الكامل، وعدم فهمهم وتبنيهم لاقتراحات الذكاء الاصطناعي بشكل كافٍ، هما السببان الرئيسيان. يشير هذا إلى أن الدرجات العالية للذكاء الاصطناعي في الاختبارات الموحدة لا تعادل تمامًا فعالية التطبيق السريري الحقيقي، وأن حلقة “التعاون بين الإنسان والآلة” هي عنق الزجاجة الرئيسي. (المصدر: 36Kr)

الذكاء الاصطناعي يجتاح مجال الإجابة على الأسئلة الطبية، هل فاز حقًا؟ فريق جامعة أكسفورد يؤكد أوجه القصور السريرية للذكاء الاصطناعي

💡 أخرى

تقرير QuestMobile: سوق تطبيقات الذكاء الاصطناعي يُظهر ثلاثة أنواع من أشكال التطبيقات، ومساعدو شركات الهواتف المحمولة يتمتعون بنشاط عالٍ: أظهر تقرير سوق تطبيقات الذكاء الاصطناعي الشامل لعام 2025 الصادر عن QuestMobile أنه حتى مارس 2025، تنقسم تطبيقات الذكاء الاصطناعي بشكل أساسي إلى تطبيقات أصلية للأجهزة المحمولة (591 مليون مستخدم نشط شهريًا)، وإضافات تطبيقات الأجهزة المحمولة (In-App AI، 584 مليون مستخدم نشط شهريًا)، وتطبيقات الويب لأجهزة الكمبيوتر (209 مليون مستخدم نشط شهريًا). من بينها، يعد مساعدو الذكاء الاصطناعي الشاملون، ومحركات البحث بالذكاء الاصطناعي، وتصميم وإنشاء المحتوى بالذكاء الاصطناعي، هي المسارات الأعلى نسبة في جميع المنصات. كان أداء مساعدي الذكاء الاصطناعي الأصليين لشركات الهواتف المحمولة لافتًا للنظر، حيث احتل Huawei Celia (157 مليون مستخدم نشط شهريًا) و OPPO Breeno (148 مليون مستخدم نشط شهريًا) المرتبة الثانية بعد DeepSeek (193 مليون مستخدم نشط شهريًا)، متجاوزين Doubao (115 مليون مستخدم نشط شهريًا). أشار التقرير إلى أن محركات البحث بالذكاء الاصطناعي، ومساعدي الذكاء الاصطناعي الشاملين، والتفاعل الاجتماعي بالذكاء الاصطناعي، والمستشارين المتخصصين بالذكاء الاصطناعي، أصبحت أربعة مسارات بمستوى المليار مستخدم. (المصدر: 36Kr)

تقرير سوق تطبيقات الذكاء الاصطناعي الشامل لعام 2025 من QuestMobile: ثلاثة أنواع من التطبيقات و"أربعة مسارات بمستوى المليار مستخدم"، ونشاط Celia و Breeno الشهري يأتي بعد DeepSeek فقط

إنتاج الأفلام الإعلانية بالذكاء الاصطناعي: العلامات التجارية الكبرى تجرب بنشاط، ولكن التحديات التقنية والأخلاقية قائمة: أظهر تقرير CTR أن أكثر من نصف المعلنين يستخدمون AIGC في إنشاء المحتوى الإبداعي، وما يقرب من 20% يستخدمون الذكاء الاصطناعي في أكثر من 50% من مراحل إنتاج الفيديو. تجرب العلامات التجارية الكبرى مثل Lenovo و Taotian و JD.com بشكل متكرر الأفلام الإعلانية بالذكاء الاصطناعي، لعرض الابتكار أو تحقيق تأثيرات بصرية محددة. تتبنى شركات الإعلان مثل WPP و Publicis أيضًا الذكاء الاصطناعي، من خلال تدريب الفرق أو تطوير الأدوات. ومع ذلك، لا يزال إنتاج الأفلام الإعلانية بالذكاء الاصطناعي يواجه تحديات: من الناحية الفنية، تتطلب مشكلات مثل عدم استقرار الصورة، وسهولة تغير ملامح الشخصيات، وضعف معالجة الديناميكيات المعقدة، تدخلًا بشريًا؛ من ناحية الرأي العام، يمكن أن يؤدي الترويج المفرط للتكنولوجيا أو الافتقار إلى الصدق الإبداعي إلى ردود فعل سلبية؛ من الناحية القانونية والأخلاقية، لا توجد حتى الآن معايير موحدة لحقوق نشر المواد، وحماية الخصوصية، وملكية حقوق الطبع والنشر للمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، والمسؤولية عن الانتهاكات. غالبًا ما تركز الحالات الناجحة على نقل الاهتمام “الإنساني”، والاستفادة من نقاط القوة التقنية وتجنب نقاط الضعف، والتوافق مع هوية العلامة التجارية. (المصدر: 36Kr)

تقدم الأفلام الإعلانية بالذكاء الاصطناعي: من يحب استخدامها، وكيف تستخدم، وهل هي مفيدة حقًا؟

100 عالم يوقعون على “إجماع سنغافورة”، ويقترحون مبادئ توجيهية عالمية لأبحاث سلامة الذكاء الاصطناعي: خلال المؤتمر الدولي لتعلم التمثيل (ICLR) الذي عقد في سنغافورة، أصدر أكثر من 100 عالم من جميع أنحاء العالم (بما في ذلك Yoshua Bengio و Stuart Russell وغيرهم) بشكل مشترك “إجماع سنغافورة بشأن أولويات أبحاث سلامة الذكاء الاصطناعي العالمية”. يهدف هذا المستند إلى توفير إرشادات لباحثي الذكاء الاصطناعي، لضمان أن تكون تكنولوجيا الذكاء الاصطناعي “جديرة بالثقة وموثوقة وآمنة”. اقترح الإجماع ثلاث فئات بحثية: تحديد المخاطر (مثل تطوير مقاييس لقياس الأضرار المحتملة، وإجراء تقييمات كمية للمخاطر)، وبناء أنظمة ذكاء اصطناعي بطرق تتجنب المخاطر (مثل جعل الذكاء الاصطناعي موثوقًا به من خلال التصميم، وتحديد نوايا البرنامج والآثار الجانبية غير المرغوب فيها، وتقليل الهلوسة، وزيادة المتانة ضد التلاعب)، والحفاظ على السيطرة على أنظمة الذكاء الاصطناعي (مثل توسيع تدابير السلامة الحالية، وتطوير تقنيات جديدة للتحكم في أنظمة الذكاء الاصطناعي القوية التي قد تحاول بنشاط تقويض محاولات السيطرة). تهدف هذه الخطوة إلى مواجهة تحديات السلامة التي يفرضها التطور السريع لقدرات الذكاء الاصطناعي، وتدعو إلى زيادة الاستثمار في أبحاث السلامة. (المصدر: 36Kr)

هل بدأ الذكاء الاصطناعي في الخروج عن السيطرة؟ 100 عالم يتعاونون لإصدار أول إجماع عالمي بشأن سلامة الذكاء الاصطناعي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *