كلمات مفتاحية:AI, OpenAI, o3/o4-mini模型, Gemini 2.5 Pro, AI编程工具, 多模态AI技术, AI智能体
🔥 أبرز الأخبار
OpenAI تطلق نموذجي o3 و o4-mini المذهلين، فاتحةً عصرًا جديدًا لـ “التفكير بالصور”: أعلنت OpenAI رسميًا عن إطلاق أحدث نماذجها الرائدة في “الاستدلال” (reasoning)، o3، والنسخة المصغرة o4‑mini. هذان النموذجان هما الأولان اللذان يحققان “التفكير باستخدام الصور”، حيث يمكنهما تضمين ومعالجة الصور (مثل التكبير والتدوير) ضمن سلسلة الاستدلال، ودمجها مع النصوص للتحليل. كما أنهما قادران لأول مرة على استخدام جميع الأدوات المتاحة داخل ChatGPT بشكل مستقل ومدمج (مثل البحث على الويب، تنفيذ كود Python، تحليل الملفات، توليد الصور) لحل المشكلات المعقدة. حقق o3 نتائج متطورة (SOTA) في العديد من اختبارات الأداء (benchmarks) مثل Codeforces و SWE-bench و MMMU، ويتفوق بشكل خاص في مهام الاستدلال البصري والمهام متعددة الخطوات، مع انخفاض معدل الأخطاء الجسيمة بنسبة 20% مقارنة بـ o1. بينما يتفوق o4-mini على o3-mini في مهام الرياضيات والبرمجة والرؤية الحاسوبية، مع زمن استجابة (latency) وتكلفة أقل. في الوقت نفسه، أطلقت OpenAI المصدر المفتوح لـ Codex CLI، وهو وكيل ذكاء اصطناعي خفيف الوزن للبرمجة يعمل في الطرفية (terminal)، وأطلقت برنامج تمويل بقيمة مليون دولار. النماذج الجديدة متاحة الآن لمستخدمي ChatGPT Plus/Pro/Team ومطوري الـ API، مما يمثل خطوة مهمة للذكاء الاصطناعي نحو قدرات متعددة الوسائط (multi-modal) وقدرات وكيل (agent) أقوى. (المصدر: OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰,首用图像思考,十倍算力爆表、openai、sama、karminski3、karminski3、sama、gdb、karminski3、sama、dotey、openai、karminski3、op7418、gdb、
)

جوجل تطلق Gemini 2.5 Pro Experimental، ويتصدر الأداء في Chatbot Arena: أطلقت جوجل أول نموذج في عائلة Gemini 2.5 وهو Gemini 2.5 Pro Experimental، وأعلنت عن نسخة قادمة بزمن استجابة منخفض Gemini 2.5 Flash. يدعم النموذج إدخال النصوص والصوت والصور والفيديو (حتى مليون token، مع خطط مستقبلية لـ 2 مليون)، وإخراج النصوص (حتى 65 ألف token). ميزته البارزة هي قدرته القوية على الاستدلال (reasoning)، والتي يحققها عن طريق توليد رموز استدلال مخفية (سلسلة التفكير – chain of thought) قبل الاستجابة. في Chatbot Arena، تفوق Gemini 2.5 Pro Experimental على GPT-4o و Grok 3 Preview بنتيجة 1437 Elo، ليحتل المرتبة الأولى. في 12 اختبار أداء (benchmarks)، تفوق في 7 منها على نماذج رائدة بما في ذلك o3-mini و GPT-4.5 و Claude 3.7 Sonnet. يشير هذا إلى أن نماذج الذكاء الاصطناعي، وخاصة نماذج الاستدلال، لا تزال تتقدم بسرعة. تخطط جوجل لتزويد جميع نماذجها الجديدة المستقبلية بقدرات الاستدلال. (المصدر: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

🎯 التوجهات
OpenAI تطلق سلسلة نماذج GPT-4.1، مع التركيز على التكلفة المنخفضة والكفاءة العالية: أطلقت OpenAI سلسلة GPT-4.1، التي تشمل GPT-4.1 و GPT-4.1 Mini و GPT-4.1 Nano. الميزة الأساسية هي خفض التكلفة وزيادة السرعة. يتفوق GPT-4.1 Mini على GPT-4o في اختبارات أداء متعددة، مع انخفاض كبير في زمن الاستجابة (latency) وتخفيض في التكلفة بنسبة 83%. GPT-4.1 Nano هو أول نموذج صغير جدًا، يدعم سياق مليون token، ومناسب للمهام التي تتطلب زمن استجابة منخفض. جميع النماذج الثلاثة ترفع نافذة السياق (context window) من 128 ألف إلى مليون token. من حيث الأسعار، تبلغ تكلفة GPT-4.1 للإدخال/الإخراج 2 دولار/8 دولارات لكل مليون token، وهو أرخص بنسبة 26% من GPT-4o؛ بينما تبلغ تكلفة Nano للإدخال/الإخراج 0.1 دولار/0.4 دولار. يُنظر إلى هذه الخطوة على أنها رد على حرب الأسعار من المنافسين مثل DeepSeek. في الوقت نفسه، تم تعليق مشروع GPT-4.5 المكلف. (المصدر: 压力给到梁文锋、
)
بروتوكول سياق النموذج (MCP) يحصل على دعم OpenAI، وتسارع تكامل النظام البيئي: أعلنت OpenAI عن دعمها لبروتوكول سياق النموذج (Model Context Protocol – MCP) في Agents SDK وتطبيق ChatGPT لسطح المكتب و Responses API. تم إطلاق MCP بواسطة Anthropic في نهاية العام الماضي بهدف توفير معيار مفتوح لربط نماذج الذكاء الاصطناعي بالأدوات ومصادر البيانات. من خلال MCP، يمكن للنماذج الوصول إلى نظام بيئي متنامي من الموارد، بما في ذلك أكثر من 6000 خادم وموصل تم بناؤها بواسطة المجتمع (مثل البحث على الويب، عمليات نظام الملفات). سابقًا، قامت Microsoft بدمج MCP في CoPilot Studio، ودعمت Cloudflare نشر خوادم MCP عن بُعد، كما دعمه محرر الكود Cursor. انضمام OpenAI سيدفع بقوة MCP ليصبح المعيار الفعلي لبناء تطبيقات وكلاء الذكاء الاصطناعي (AI Agent)، مما يبسط عملية دمج المطورين لمختلف الأدوات ومصادر البيانات التابعة لجهات خارجية. (المصدر: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

ByteDance تطلق Kling 2.0، لتحسين تأثيرات توليد الفيديو: Kling 2.0 هو أحدث نموذج لتوليد الفيديو أطلقته ByteDance. وفقًا لتعليقات المستخدمين والعروض التوضيحية، يُظهر Kling 2.0 أداءً متميزًا في توليد مشاهد فيديو سلسة وواقعية، مع تحسين مقارنة بالإصدارات السابقة والمنافسين مثل Sora، خاصة في تحويل الصور إلى فيديو. يمكن للمستخدمين أولاً استخدام أدوات مثل ChatGPT لتوليد صور ذات دقة نصية جيدة، ثم استخدام Kling 2.0 لتحويلها إلى فيديو ديناميكي. يشير هذا إلى استمرار التقدم في تقنية توليد الفيديو من حيث اتساق المشهد والواقعية. (المصدر:
)
جوجل تطلق DolphinGemma، لاستكشاف لغز تواصل الدلافين: أطلقت Google AI مشروع DolphinGemma، بهدف استخدام تقنية الذكاء الاصطناعي لفك شفرة طرق تواصل الدلافين. جمع المشروع مجموعة بيانات ضخمة لأصوات الدلافين، ودرب نموذجًا بـ 400 مليون معلمة (يمكن تشغيله على هاتف Pixel 9) لتحليل هذه الأصوات، بحثًا عن أنماط وقواعد قد تشير إلى وجود لغة. البحث حاليًا في مرحلة استكشافية، ولا يُعرف بعد ما إذا كانت الدلافين تمتلك لغة معقدة شبيهة بلغة الإنسان، ولكن تم تحديد أنواع أصوات مرتبطة بسلوكيات معينة (مثل التسمية، القتال، التزاوج). الهدف النهائي هو فهم بنية أصوات الدلافين ومعانيها المحتملة، ومحاولة إجراء تواصل بسيط ثنائي الاتجاه مع الدلافين عن طريق توليد أصوات محددة. (المصدر:
)
IBM تطلق سلسلة نماذج Granite 3.3، بما في ذلك التعرف على الكلام: أطلقت IBM سلسلة نماذج Granite 3.3، والتي تتضمن نموذجًا للتعرف على الكلام بـ 8 مليارات معلمة (Granite Speech 3.3). يعتمد النموذج نهجًا من مرحلتين، يهدف إلى معالجة الكلام دون المساس بقدرات LLM الأساسية. تهدف عائلة النماذج الجديدة إلى توفير قدرات استدلال (reasoning) أكثر دقة وأداء محسن لـ RAG (التوليد المعزز بالاسترجاع)، وتدعم الضبط الدقيق (fine-tuning) باستخدام LoRA. يمكن دمج هذه النماذج في مساعدي الذكاء الاصطناعي في مختلف المجالات. (المصدر: Reddit r/LocalLLaMA)

ثورة في التنبؤ بالطقس مدفوعة بالذكاء الاصطناعي، مع تحسن كبير في كفاءة التنبؤ: يغير الذكاء الاصطناعي بهدوء مجال التنبؤ بالطقس. المهام التي كانت تتطلب تقليديًا فرقًا ضخمة من الخبراء وأجهزة كمبيوتر عملاقة يمكن الآن تحقيقها بواسطة نماذج الذكاء الاصطناعي على جهاز كمبيوتر محمول. يستطيع الذكاء الاصطناعي معالجة وتحليل كميات هائلة من بيانات الأرصاد الجوية، وتحديد الأنماط المعقدة، وبالتالي توليد تنبؤات جوية أسرع وربما أكثر دقة. يمثل هذا تطبيقًا مهمًا للذكاء الاصطناعي في مجالات الحوسبة العلمية والتنبؤ، ومن المتوقع أن يحسن من توقيت التنبؤات وتغطيتها. (المصدر: Reddit r/ArtificialInteligence)
تطبيق Google Gemini يضيف دعم LaTeX: تم تحديث تطبيق Google Gemini لإضافة دعم LaTeX. يمكن للمستخدمين الآن استخدام صيغة LaTeX في تطبيق Gemini لعرض الصيغ الرياضية والرموز العلمية وما إلى ذلك. يغطي هذا التحديث نموذجي Gemini 2.0 Flash و 2.5 Pro، مما يعزز من فائدة Gemini في سيناريوهات التواصل الأكاديمي والتقني. (المصدر: JeffDean)
Meta تقترح Byte Latent Transformer (BLT)، لتعزيز متانة LLM ضد المدخلات المشوشة: قدم باحثون من Meta ومؤسسات أخرى Byte Latent Transformer (BLT)، بهدف استبدال أدوات التقطيع التقليدية (tokenizer). يعالج BLT مباشرة تسلسلات البايت (الأحرف)، من خلال Transformer صغير على مستوى البايت يتنبأ باحتمالية البايت التالي، ويستخدم الإنتروبيا (entropy) لتجميع البايتات ديناميكيًا: الإنتروبيا المنخفضة (قابلية تنبؤ عالية) تعني الإضافة إلى المجموعة الحالية، والإنتروبيا العالية (قابلية تنبؤ منخفضة) تعني بدء مجموعة جديدة. يتضمن النظام مشفرًا (encoder)، و Latent Transformer، ومفكك تشفير (decoder)، بإجمالي 8 مليارات معلمة. أظهرت التجارب أن BLT يتفوق قليلاً على Llama 3 بنفس الحجم في معايير اللغة العامة والترميز، ويظهر متانة أقوى بكثير ضد المدخلات المشوشة مثل الأخطاء الإملائية واللغات النادرة، لأنه يفهم بشكل أفضل التشابه على مستوى الأحرف. (المصدر: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

بحث جديد يستكشف التوسع في وقت الاختبار للاستدلال التعاوني متعدد الوكلاء: تم تقديم ورقة بحثية بعنوان “Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning” إلى arXiv. يركز البحث على كيفية تحسين أداء المهام الاستدلالية المعقدة من خلال جعل وكلاء ذكاء اصطناعي متعددين يتعاونون في وقت الاختبار (الاستدلال)، مستكشفًا مسارًا لتوسيع قدرات النموذج دون زيادة تكاليف التدريب. (المصدر: Reddit r/MachineLearning)
حوكمة وكلاء الذكاء الاصطناعي تصبح محور تركيز جديد: مع تعزيز قدرات وكلاء الذكاء الاصطناعي (Agentic AI)، أصبحت كيفية إدارتها بفعالية قضية مهمة. يتضمن ذلك ضمان توافق سلوك الوكيل مع التوقعات، وأن يكون آمنًا وقابلًا للتحكم، ويلتزم بالمعايير الأخلاقية. هناك حاجة لإنشاء أطر ومعايير وآليات تنظيمية مناسبة لإدارة هذه “العقول الاصطناعية” القادرة على العمل واتخاذ القرارات بشكل مستقل. (المصدر: Ronald_vanLoon)

الذكاء الاصطناعي يولد صورًا عالية الجودة بسرعة تفوق أحدث الطرق الحالية (SOTA): طور باحثون في معهد ماساتشوستس للتكنولوجيا (MIT) أداة ذكاء اصطناعي جديدة قادرة على التفوق على أحدث الطرق الحالية (SOTA) في توليد صور عالية الجودة، وبسرعة أكبر. يشير هذا إلى استمرار تحقيق اختراقات في الكفاءة والجودة في مجال توليد الصور. (المصدر: Ronald_vanLoon)

xAI تقدم ميزة شبيهة بـ Canvas لـ Grok AI: أضافت xAI ميزة تشبه ChatGPT Canvas إلى روبوت الدردشة الخاص بها Grok AI. توفر ميزات من نوع Canvas عادةً واجهة قماشية لا نهائية، مما يسمح للمستخدمين بتنظيم المعلومات والتفاعل معها بطريقة أكثر حرية وبصرية، مع دمج النصوص والرموز والصور وما إلى ذلك. تجعل هذه الخطوة Grok يلحق بـ ChatGPT في تجربة تفاعل المستخدم، وهذه الميزة متاحة مجانًا. (المصدر: Reddit r/ArtificialInteligence)

🧰 الأدوات
Anx Reader: قارئ كتب إلكترونية متعدد المنصات مدمج بمحركات ذكاء اصطناعي متعددة: Anx Reader هو قارئ كتب إلكترونية يدعم تنسيقات متعددة مثل EPUB, MOBI, AZW3, FB2, TXT، ويعمل على iOS/macOS/Windows/Android. يتميز بدمج قدرات ذكاء اصطناعي متعددة من OpenAI, Claude, Gemini, DeepSeek، والتي يمكن استخدامها لتلخيص المحتوى وطرح الأسئلة والحصول السريع على المعلومات. يدعم التطبيق مزامنة تقدم القراءة وملفات الكتب والملاحظات عبر WebDAV، ويوفر تخصيصًا عاليًا لأنماط القراءة (تباعد الأسطر، الخطوط، الألوان، إلخ)، ويتضمن ميزات مثل القراءة بصوت عالٍ (TTS)، والترجمة، والبحث، وتسجيل الأفكار. يهدف إلى توفير تجربة قراءة ذكية ومركزة وشخصية. (المصدر: Anxcye/anx-reader – GitHub Trending (all/daily))

OpenAI تفتح مصدر Codex CLI: وكيل ذكاء اصطناعي خفيف الوزن للبرمجة يعمل محليًا: بالتزامن مع إطلاق o3/o4-mini، فتحت OpenAI مصدر Codex CLI، وهو وكيل ذكاء اصطناعي للبرمجة يمكن تشغيله في الطرفية (terminal). يسمح للمطورين باستخدام أوامر اللغة الطبيعية لجعل الذكاء الاصطناعي ينفذ مهام الترميز مباشرة على أجهزة الكمبيوتر المحلية، مثل كتابة التعليمات البرمجية، وتثبيت التبعيات، وتكوين البيئات، وإصلاح الأخطاء. يهدف Codex CLI إلى الاستفادة الكاملة من قدرات الاستدلال القوية لنماذج مثل o3/o4-mini، ويمكنه دمج المدخلات متعددة الوسائط (مثل لقطات الشاشة) مع الوصول إلى الكود المحلي. تهدف الأداة إلى تبسيط عملية التطوير، وهي سهلة الاستخدام بشكل خاص للمبتدئين. أطلقت OpenAI أيضًا برنامج تمويل بقيمة مليون دولار لدعم المشاريع القائمة على هذه الأداة. (المصدر: OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰,首用图像思考,十倍算力爆表、sama、karminski3、dotey、sama、dotey)

نماذج Cohere تصل إلى Hugging Face Hub، وتوفر خدمات الاستدلال: أعلنت Cohere أن نماذجها أصبحت أول مزود استدلال (inference) تابع لجهة خارجية مدعوم على Hugging Face Hub. يمكن للمستخدمين الآن الوصول مباشرة إلى نماذج Cohere مفتوحة المصدر (مثل سلسلة Aya) ونماذج المؤسسات (مثل سلسلة Command) على Hub وإجراء استدلال سريع. تتفوق هذه النماذج بشكل خاص في استخدام الأدوات والقدرات متعددة اللغات، وتوفر واجهات متوافقة مع OpenAI، مما يسهل على المطورين دمجها وبناء التطبيقات. (المصدر: huggingface、huggingface、huggingface)

إصدار LocalAI v2.28.0، وإطلاق منصة وكلاء الذكاء الاصطناعي المحلية LocalAGI: تم تحديث LocalAI، وهو خادم لتشغيل LLM محليًا وتوفير واجهة برمجة تطبيقات متوافقة مع OpenAI، إلى الإصدار v2.28.0. في الوقت نفسه، تم إطلاق منصة LocalAGI الجديدة كليًا. LocalAGI هي منصة تنسيق لوكلاء الذكاء الاصطناعي ذاتية الاستضافة (self-hosted) مع واجهة مستخدم ويب (WebUI)، تسمح للمستخدمين ببناء تدفقات عمل معقدة ومتعددة الخطوات لوكلاء الذكاء الاصطناعي (مشابهة لـ AutoGPT). النقطة الأساسية هي أن هذه الوكلاء يمكن تشغيلها بواسطة LLMs محلية مقدمة عبر LocalAI أو واجهات برمجة تطبيقات متوافقة أخرى (مثل llama-cpp-python). بالاقتران مع مستودع الذاكرة المحلي LocalRecall، يمكن للمستخدمين تشغيل وكلاء ذكاء اصطناعي مستقلين في بيئة محلية بالكامل، لتنفيذ مهام مثل البحث والترميز ومعالجة المحتوى. (المصدر: Reddit r/LocalLLaMA)

إطار عمل Droidrun مفتوح المصدر: التحكم في هواتف Android باستخدام الذكاء الاصطناعي: Droidrun هو إطار عمل يسمح للمستخدمين بالتحكم في هواتف Android لتنفيذ المهام باستخدام الذكاء الاصطناعي (مثل نماذج اللغة الكبيرة)، وهو الآن مفتوح المصدر على GitHub. يمكن للمستخدمين إعطاء أوامر باللغة الطبيعية لجعل الذكاء الاصطناعي يكمل العمليات على الهاتف، مثل فتح التطبيقات، والنقر على الأزرار، وإدخال النصوص. يتطلب ذلك تثبيت أداة ADB (Android Debug Bridge). يعرض هذا الإطار إمكانيات جديدة للذكاء الاصطناعي في أتمتة الأجهزة المحمولة والتفاعل معها. (المصدر: karminski3)

إطلاق LLManager: سير عمل للموافقة الآلية قائم على الذاكرة: LLManager هو سير عمل مفتوح المصدر تم بناؤه باستخدام LangGraph، يهدف إلى أتمتة مهام الموافقة باستخدام وكلاء ذكاء اصطناعي يتمتعون بقدرات الذاكرة. يمكن للنظام توليد ذاكرة من خلال التعاون بين الإنسان والآلة (human-in-the-loop)، وبالتالي التعلم وتحسين قرارات الموافقة بمرور الوقت. تم تصميم البنية لمعالجة عمليات الموافقة المتكررة، مما يزيد من الكفاءة. (المصدر: LangChainAI)

LangGraph.js يتكامل مع Hono، لدعم توجيه HTTP المخصص والبرامج الوسيطة: يمكن الآن دمج LangGraph.js (نسخة JS من مكتبة LangChain لبناء تطبيقات متعددة الوكلاء ذات حالة) مع Hono (إطار عمل ويب خفيف الوزن). يتيح ذلك للمطورين إضافة توجيه HTTP مخصص وبرامج وسيطة (middleware) لتطبيقات LangGraph.js، مما يسمح ببناء خدمات خلفية أكثر تعقيدًا، مثل معالجة webhooks، وإنشاء تطبيقات API كاملة، وتوسيع نطاق سيناريوهات تطبيق LangGraph.js. (المصدر: LangChainAI)

بدء بيع الروبوت البشري مفتوح المصدر Reachy 2: أعلن Clem Delangue، المؤسس المشارك لـ Hugging Face، أن أول روبوت بشري مفتوح المصدر شارك فريقه في تطويره، Reachy 2، بدأ بيعه هذا الأسبوع. يبلغ سعر الروبوت 70 ألف دولار، ويستهدف سوق البحث والتعليم، ويستخدم بالفعل في جامعة كورنيل وجامعة كارنيجي ميلون ومختبرات الذكاء الاصطناعي الرئيسية. يتميز بشكل شبيه بالإنسان، وقاعدة متحركة متعددة الاتجاهات، ومستشعرات غنية (كاميرات، ميكروفونات، ليدار، إلخ)، ويعتمد على ROS 2 و LeRobotHF، ويدعم Python SDK، وتصميمه المعياري يسمح بالتخصيص. (المصدر: huggingface)

Perplexity تطلق متصفح Comet، لاستكشاف تجربة تصفح أصلية للذكاء الاصطناعي: يقوم Arav Srinivas، الرئيس التنفيذي لشركة Perplexity، بتطوير متصفح يسمى Comet ويطلب أفكارًا حول نمو المنتج وميزاته. يهدف Comet إلى أن يكون تجسيدًا لـ “نظام تشغيل وكيل” (agentic OS)، من خلال التحكم في تطبيقات الويب والبيانات عبر المتصفح، واستخدام الذكاء الاصطناعي للإجابة على الأسئلة وتنفيذ المهام. الفكرة هي أنه نظرًا لأن معظم التطبيقات موجودة على الويب، فإن الذكاء الاصطناعي الذي يتحكم في المتصفح يمكنه التحكم في معظم الحياة الرقمية. يؤكد المشروع على البدء صغيرًا وتجنب الوعود المفرطة بالقدرات العامة. (المصدر: AravSrinivas、AravSrinivas、AravSrinivas、AravSrinivas、AravSrinivas)

تطبيق Claude يدعم نصًا برمجيًا للموافقة التلقائية على طلبات MCP: شارك مستخدم مجتمعي نصًا برمجيًا JavaScript يمكن تشغيله في وحدة تحكم أدوات المطور لتطبيق Claude، والذي يمكنه الموافقة تلقائيًا على طلبات MCP (بروتوكول سياق النموذج) من قائمة أدوات موثوقة محددة مسبقًا. بالنسبة للمستخدمين الذين يستخدمون بشكل متكرر أدوات محلية أو بعيدة محددة، يمكن أن يوفر هذا عناء النقر يدويًا على “السماح” في كل مرة، مما يحسن كفاءة سير العمل. ولكن يجب على المستخدمين الانتباه إلى المخاطر الأمنية، وتمكينه فقط للأدوات الموثوقة تمامًا. (المصدر: Reddit r/ClaudeAI)

توصيات بخوادم MCP أساسية، للمساعدة في الترميز وأتمتة سير العمل: شارك مستخدم مجتمعي سلسلة من خوادم MCP (بروتوكول سياق النموذج) الموصى بها، والتي يمكن دمجها مع نماذج الذكاء الاصطناعي التي تدعم MCP (مثل Claude) أو أطر عمل الوكلاء (Agent)، لتعزيز كفاءة الترميز وقدرات الأتمتة. تشمل قائمة التوصيات: Sequential Thinking MCP للتفكير المنظم، و Puppeteer MCP للتفاعل مع الويب، و Memory Bank MCP لإدارة معرفة المشروع، و Playwright MCP للاختبار عبر المتصفحات، و GitHub MCP لعمليات GitHub، و Knowledge Graph Memory MCP للذاكرة المستمرة، و DuckDuckGo MCP للبحث بدون مفتاح API، و MCP Compass لاكتشاف المزيد من أدوات MCP. (المصدر: Reddit r/ClaudeAI)

📚 التعلم
مستودع GitHub: دليل شامل لتقنيات RAG المتقدمة: يوفر مستودع GitHub RAG_Techniques
الذي أنشأه Nir Diamant المجموعة الأكثر شمولاً حاليًا من الدروس التعليمية حول تقنيات التوليد المعزز بالاسترجاع (RAG) المتقدمة. يهدف المستودع إلى تحسين دقة وكفاءة وثراء سياق أنظمة RAG، ويغطي أكثر من 30 تقنية بدءًا من التنفيذ الأساسي (LangChain/LlamaIndex)، وتحسين تقسيم النص (الحجم الثابت، تقسيم الاقتراحات، التقسيم الدلالي)، وتعزيز الاستعلام (التحويل، HyDE، HyPE)، وإثراء السياق (رؤوس الكتل، استخراج المقاطع ذات الصلة، توسيع النافذة، تعزيز المستندات)، إلى الاسترجاع المتقدم (الدمج، إعادة الترتيب، التصفية متعددة الجوانب، الفهرسة الهرمية، التكامل، الوسائط المتعددة)، والتقنيات التكرارية (حلقات التغذية الراجعة، التكيف، الاسترجاع التكراري)، والتقييم (DeepEval، GroUSE)، وقابلية التفسير، بالإضافة إلى البنى المتقدمة (Graph RAG، RAPTOR، Self-RAG، CRAG)، ويوفر تطبيقات Jupyter Notebook أو Python. المشروع مدفوع بالمجتمع ويشجع المساهمات. (المصدر: NirDiamant/RAG_Techniques – GitHub Trending (all/daily))
DeepLearning.AI تطلق دورة جديدة: بناء وكلاء متصفح الذكاء الاصطناعي: أعلن Andrew Ng (Wu Enda) عن إطلاق دورة قصيرة جديدة بالتعاون مع AGI Inc. بعنوان “Building AI Browser Agents”. يقدم الدورة المؤسسان المشاركان لـ AGI Inc.، Div Garg و Naman Garg، وتهدف إلى تعليم كيفية بناء وكلاء ذكاء اصطناعي يمكنهم التفاعل مع مواقع الويب وتنفيذ المهام (مثل استخلاص المعلومات، وملء النماذج، والنقر، وتقديم الطلبات). يتضمن محتوى الدورة مبادئ عمل وكيل الويب، وبنيته، وقيوده، واستراتيجيات اتخاذ القرار، وبناء عملي لوكيل ويب لاستخلاص دورات DeepLearning.AI وتنظيم المخرجات، وبناء وكيل مستقل لإكمال مهام متعددة (البحث عن ملخصات صفحات الويب، وملء النماذج، والاشتراك)، واستكشاف إطار عمل AgentQ (الذي يجمع بين بحث شجرة مونت كارلو MCTS وتحسين التفضيل المباشر DPO لتحقيق التصحيح الذاتي)، والتعمق في مبادئ MCTS، ومناقشة الوضع الحالي ومستقبل وكلاء الذكاء الاصطناعي. (المصدر: AndrewYNg)
Hugging Face تحدث وثائق التكميم (Quantization)، وتوفر دليلًا للمفاهيم ومعايير للاختيار: قامت Hugging Face بتحديث كبير لوثائقها المتعلقة بتكميم النماذج (model quantization). تهدف الوثائق الجديدة إلى مساعدة المستخدمين على فهم مفاهيم التكميم بشكل أفضل واختيار التقنية المناسبة لاحتياجاتهم. تشمل التحديثات: شرح أساسيات التكميم (مثل المخططات، int4، FP8)، ودليل اختيار جديد (للمساعدة في الاختيار بين تقنيات مثل bnb، AWQ، GPTQ، HQQ بناءً على الاحتياجات والأجهزة)، وبيانات مقارنة للدقة والأداء لطرق التكميم الشائعة لنماذج Llama 3.1 8B و 70B. يوفر هذا مرجعًا قيمًا للمطورين الذين يرغبون في ضغط النماذج وتحسين كفاءة الاستدلال (inference). (المصدر: huggingface)

طريقة جديدة MODE: بديل خفيف الوزن وقابل للتفسير لـ RAG: اقترح الباحث المستقل Rahul Anand طريقة جديدة تسمى MODE (Mixture of Document Experts)، كبديل خفيف الوزن لعملية RAG التقليدية. لا تعتمد MODE على قواعد بيانات المتجهات (vector databases) أو أدوات إعادة الترتيب (re-rankers)، بل تستخلص المعلومات عن طريق تجميع المستندات واستخدام طريقة استرجاع قائمة على النقاط المركزية (centroids). يُقال إن هذه الطريقة فعالة وقابلة للتفسير بشكل كبير، خاصة لمجموعات البيانات الصغيرة والمتوسطة. يسعى المؤلف للحصول على تأييد من arXiv (مجال cs.AI) لنشر الورقة البحثية. (المصدر: Reddit r/MachineLearning)

مستودع GitHub Beyond-NanoGPT: مورد متقدم للانتقال من مبتدئ LLM إلى باحث في الذكاء الاصطناعي: قام Tanishq Kumar بفتح مصدر مستودع GitHub يسمى beyond-nanoGPT. يهدف المشروع إلى مساعدة المتعلمين الذين أتقنوا أساسيات LLM على مستوى nanoGPT على فهم وتنفيذ أفكار معقدة تقترب من طليعة أبحاث التعلم العميق. يحتوي المستودع على آلاف الأسطر من كود PyTorch المشروح، وينفذ من الصفر العديد من التطورات البحثية الحديثة في تعلم الآلة، بما في ذلك فك التشفير التخميني (speculative decoding)، و visual/diffusion Transformers، والانتباه الخطي/المتفرق (linear/sparse attention). هدف المشروع هو مساعدة المزيد من الأشخاص على الانتقال إلى مجال أبحاث الذكاء الاصطناعي. (المصدر: Reddit r/MachineLearning)
درس تعليمي: استخدام AI Scraper و LLM لتدريب روبوت محادثة قائم على مستودع GitHub: مقال منشور على مدونة Stackademic يشرح كيفية استخدام AI Scraper (أداة استخلاص بيانات الويب) ونماذج اللغة الكبيرة (LLM) لتدريب روبوت محادثة قادر على الإجابة على أسئلة حول مستودع GitHub معين. تتضمن هذه الطريقة عادةً استخلاص الكود والوثائق (مثل README) والمشكلات (Issues) من المستودع، ومعالجتها إلى تنسيق مناسب لفهم LLM، ثم استخدام RAG (التوليد المعزز بالاسترجاع) أو الضبط الدقيق (fine-tuning) لتمكين روبوت المحادثة من الإجابة على الأسئلة بناءً على هذه المعلومات. (المصدر: Reddit r/ArtificialInteligence)

شرح ورقة بحثية: استخدام انتشار الأهمية على مستوى الطبقات (LRP) لتحقيق الذكاء الاصطناعي القابل للتفسير (XAI) للبيانات الجدولية: مقال مدونة يناقش كيفية استخدام تقنية انتشار الأهمية على مستوى الطبقات (Layer-Wise Relevance Propagation, LRP) لتفسير عملية اتخاذ القرار لنماذج التعلم العميق عند معالجة البيانات الجدولية. LRP هي طريقة إسناد تهدف إلى تحليل تنبؤات مخرجات النموذج وصولاً إلى ميزات الإدخال، وبالتالي الكشف عن الميزات التي ساهمت بشكل أكبر في القرار النهائي. يساعد تطبيقها على البيانات الجدولية في فهم سلوك النموذج وتعزيز الشفافية والموثوقية. (المصدر: Reddit r/deeplearning)

💼 الأعمال
Zhipu AI تبدأ الاستعداد للإدراج في البورصة، وتعتزم إتمامه خلال العام: بدأت شركة الذكاء الاصطناعي الصينية Zhipu AI رسميًا في إجراءات الإعداد للإدراج في البورصة، مع تعيين شركة CICC كمستشار للإدراج. وفقًا لتقرير الإيداع، تخطط Zhipu AI لإكمال عملية الإعداد للاكتتاب العام الأولي (IPO) بين أغسطس وأكتوبر 2025. صرح الرئيس التنفيذي للشركة Zhang Peng سابقًا بأن الطريق إلى تحقيق الذكاء الاصطناعي العام (AGI) طويل، وأن التمويل الذي تم جمعه هو مجرد “نفقات سفر”، وأن هناك حاجة إلى مزيد من الأموال لدعم المستقبل. يُنظر إلى هذا الاكتتاب العام على أنه خطوة حاسمة للحصول على “المزيد من نفقات السفر”. تعد Zhipu AI لاعبًا مهمًا في مجال النماذج الكبيرة في الصين، ويحظى تقدم عملية الاكتتاب العام باهتمام كبير. (المصدر: 压力给到梁文锋)
شركة ناشئة مكونة من شخصين Gumloop تجمع تمويلاً يتجاوز 100 مليون يوان باستخدام الذكاء الاصطناعي: أكملت منصة Gumloop التي لا تتطلب برمجة (no-code)، والتي تضم مؤسسيها الاثنين فقط كموظفين رسميين، مؤخرًا جولة تمويل A بقيمة 17 مليون دولار (حوالي 124 مليون يوان صيني). نشأت الشركة من توفير واجهة مستخدم سهلة لـ Auto-GPT، ثم تطورت لتصبح منصة بناء تدفقات عمل الذكاء الاصطناعي AgentHub الموجهة لغير التقنيين، والتي يمكنها دمج أدوات مثل GitHub و Gmail، وأتمتة معالجة المستندات، واستخلاص بيانات الويب، وتحسين محركات البحث (SEO)، وإدارة علاقات العملاء (CRM)، والتسويق عبر البريد الإلكتروني. تستخدم Gumloop نفسها وكلاء الذكاء الاصطناعي (AI Agents) بكثافة لمعالجة أعمال الشركة، ويهدف المؤسسون إلى بناء شركة بقيمة مليار دولار بفريق لا يتجاوز 10 أشخاص. يعكس هذا إمكانية تحقيق الفرق الصغيرة لكفاءة وقيمة عالية باستخدام أدوات الذكاء الاصطناعي في عصر الذكاء الاصطناعي، وفرص ريادة الأعمال في حل مشكلة “الميل الأخير” لتطبيق الذكاء الاصطناعي. (المصدر: 把AI当成“牛马”,2人创业团队,拿下了超1亿元融资)
أنباء عن نية OpenAI الاستحواذ على شركة أدوات البرمجة بالذكاء الاصطناعي Windsurf (Codeium سابقًا) مقابل 3 مليارات دولار: وفقًا لوكالة بلومبرج نقلاً عن مصادر مطلعة، تجري OpenAI محادثات للاستحواذ على شركة أدوات البرمجة المدعومة بالذكاء الاصطناعي Windsurf (المعروفة سابقًا باسم Codeium) مقابل حوالي 3 مليارات دولار. إذا تمت الصفقة، فستكون أكبر عملية استحواذ في تاريخ OpenAI، وتهدف إلى تعزيز قدرتها التنافسية في سوق مساعدي البرمجة بالذكاء الاصطناعي، ومنافسة Anthropic و GitHub Copilot و Anysphere (Cursor) بشكل مباشر. تأسست Windsurf في عام 2021، وبلغت قيمتها التقديرية السابقة 1.25 مليار دولار، وحصلت بالفعل على تمويل يزيد عن 200 مليون دولار. تشير شائعات الاستحواذ هذه أيضًا إلى احتمال تزايد الاندماج في مجال أدوات البرمجة بالذكاء الاصطناعي. (المصدر: dotey)
شركة Safe Superintelligence التابعة لـ Ilya Sutskever تقدر قيمتها بـ 32 مليار دولار حسب التقارير: وفقًا لـ TechCrunch، بلغت قيمة شركة Safe Superintelligence (SSI) الجديدة، التي أسسها المؤسس المشارك لـ OpenAI إيليا سوتسكيفر، 32 مليار دولار في جولة تمويل حديثة. يُقال إن الشركة حصلت على استثمار بقيمة 2 مليار دولار. هدف SSI هو بناء الذكاء الخارق (superintelligence) بأمان، وتعكس قيمتها العالية توقعات السوق الكبيرة للمواهب الرائدة في مجال الذكاء الاصطناعي ورؤية الذكاء الاصطناعي العام (AGI)، على الرغم من أن الشركة لم تصدر أي منتج حتى الآن. (المصدر:
)
الحرب التجارية بين الولايات المتحدة والصين قد تؤثر على تطوير الذكاء الاصطناعي، وإمدادات الرقائق محور الاهتمام: يرى بعض المحللين أن الحرب التجارية الأمريكية ضد الصين، وخاصة القيود المفروضة على تصدير رقائق الذكاء الاصطناعي المتطورة (مثل سلسلة H100/B200 من NVIDIA)، والرد المحتمل من الصين بتقييد صادرات المعادن الأرضية النادرة، تشكل تحديًا لتطوير الذكاء الاصطناعي العالمي. تشير التقارير إلى أن شركات الذكاء الاصطناعي (مثل OpenAI) شعرت بالفعل بقيود نقص إمدادات وحدات معالجة الرسومات (GPU). في الوقت نفسه، تحقق الصين تقدمًا في تصنيع الرقائق (مثل اختراقات تقنية 3nm و 1nm)، وقد تتمكن من إنتاج رقائق ذكاء اصطناعي عالية الجودة في السنوات القليلة المقبلة. يرى المقال أن القيود التجارية الحالية قد تبطئ سرعة تطوير الذكاء الاصطناعي في الولايات المتحدة، بل وقد تسمح للصين بالتفوق في مجال الذكاء الاصطناعي، ويدعو إلى تعزيز تطوير الذكاء الاصطناعي من خلال التجارة الحرة. (المصدر: Reddit r/ArtificialInteligence)
مناقشة التطبيقات العملية لوحدات TPU في بيئات الإنتاج: أطلقت جوجل مؤخرًا جيلًا جديدًا من وحدات معالجة الموترات (TPU) المحسّنة للاستدلال (inference). ومع ذلك، تشير مناقشات المجتمع إلى أنه على الرغم من وجود TPU لسنوات عديدة وتقديم جوجل لبرنامج موارد سخي للباحثين (TRC)، يبدو أن استخدام TPU في بيئات الإنتاج الصناعية أقل انتشارًا من وحدات معالجة الرسومات (GPU) من NVIDIA. قد تشمل الأسباب تعقيد الإعداد، وعدم وضوح مزايا الأداء، ونقص الميزات ذات الصلة بمنصة GCP (مثل IP الثابت، وأدوات المراقبة)، وصعوبة التصحيح (XLA)، والمخاوف بشأن الارتباط بمورد واحد بسبب إمكانية استئجارها فقط عبر GCP. تدعو المناقشة المستخدمين ذوي الخبرة العملية في الإنتاج لمشاركة استخدامات وتحديات TPU. (المصدر: Reddit r/MachineLearning)

الذكاء الاصطناعي يثير فجوة ثقة في قطاع التأمين: يشير تقرير بحثي صادر عن Swiss Re إلى أن تطبيق الذكاء الاصطناعي التوليدي في قطاع التأمين يواجه تحديات تتعلق بالثقة. على الرغم من الإمكانات الهائلة للذكاء الاصطناعي، إلا أن هناك مخاوف بشأن خصوصية البيانات والأمن السيبراني وشفافية اتخاذ القرار، مما قد يؤدي إلى فجوة ثقة بين شركات التأمين والعملاء. يستكشف التقرير كيفية الاستفادة من مزايا الذكاء الاصطناعي مع معالجة المخاطر والقضايا الأخلاقية ذات الصلة، لبناء الثقة لدى المستخدمين والحفاظ عليها. (المصدر: Ronald_vanLoon)
🌟 المجتمع
OpenAI o3/o4-mini تثير نقاشًا حادًا، بين القوة الحقيقية والمبالغة: بعد إطلاق OpenAI لـ o3 و o4-mini، كانت ردود فعل المجتمع حماسية. أشاد المختبرون الأوائل (مثل Dan Shipper) بسرعتهما وذكائهما وقدراتهما كوكلاء (agents)، وأصبحا نموذجه المفضل، حيث يمكنهما إكمال اختبارات أداء الكود، وتخصيص الدورات التدريبية، والتعرف على الصور غير الواضحة، وتحليل الكتابة. قام Sam Altman بإعادة التغريد وأكد على أنهما “يقتربان أو يصلان إلى مستوى العبقرية”. ومع ذلك، أشارت تعليقات أخرى (مثل فيديو AI Explained) إلى أنه على الرغم من قوة النماذج، فإن مصطلحات مثل “AGI” و “خالٍ من الهلوسة” مبالغ فيها، ولا تزال النماذج ترتكب أخطاء في بعض جوانب المنطق السليم والاستدلال الفيزيائي، وقد لا تكون فعالة من حيث التكلفة مثل Gemini 2.5 Pro. يعترف المجتمع عمومًا بتقدمهما، خاصة في الترميز واستخدام الأدوات، ولكنه يحافظ على نظرة فاحصة لقدراتهما وحدودهما الحقيقية. (المصدر:
、
、sama、sama、karminski3、gdb、natolambert)

نقاش مجتمعي: هل يعتمد الذكاء الاصطناعي بشكل أساسي على تقدم قوة الحوسبة للوصول إلى AGI؟: أطلق مستخدمو Reddit نقاشًا حول ما إذا كان تحقيق الذكاء الاصطناعي العام (AGI) يعتمد بشكل أساسي على زيادة القدرة الحاسوبية الأولية. ترى وجهة نظر أن زيادة القدرة الحاسوبية بمقدار كبير آخر قد تؤدي إلى فائدة تقترب من AGI، حتى لو لم تكن AGI “حقيقية”، على الرغم من القيود الحالية لـ LLM. النقطة الحاسمة هي ما إذا كانت مشكلة AGI “قابلة للمعالجة” (tractable) بطبيعتها، وإذا كان الأمر كذلك، فقد تكون الحوسبة بالقوة الغاشمة (brute force) كافية. لكن هناك تعليقات تعارض ذلك، معتبرة أن قوة الحوسبة وحدها لا يمكنها التغلب على القيود الأساسية لـ LLM، وأن AGI يتطلب المزيد من الاختراقات في النماذج الفكرية (paradigm shifts). (المصدر: Reddit r/ArtificialInteligence)
نقاش مجتمعي: ما هي الصناعات التي ستكون أول من يتعطل بسبب الذكاء الاصطناعي؟: أطلق مستخدمو Reddit نقاشًا لتخمين الصناعات التي ستكون أول من يتأثر بالذكاء الاصطناعي و “ينهار”. تشمل الصناعات المرشحة: الترجمة/كتابة النصوص الإعلانية، ودعم العملاء، وتعليم اللغات، وإدارة المحافظ الاستثمارية، والرسم التوضيحي/التصوير التجاري. أضافت التعليقات قطاعات النقل، والتصميم (الواجهات، العلامات التجارية، الشعارات)، والعلاقات العامة/التسويق/إدارة وسائل التواصل الاجتماعي، والتعليم (خاصة الدروس الخصوصية)، والمدونات/البودكاست (تغير طريقة إنشاء المحتوى)، وتنظيم وإدارة الفعاليات. أشارت بعض التعليقات أيضًا إلى أن ليس كل المجالات ستختفي تمامًا، على سبيل المثال، لا تزال هناك مساحة للترجمة المتخصصة للغاية أو الرسوم التوضيحية التي تتطلب إبداعًا بشريًا أساسيًا. (المصدر: Reddit r/ArtificialInteligence)
تجربة مستخدم: تصحيح الكود الذي تم إنشاؤه بواسطة الذكاء الاصطناعي مليء بالتحديات: شارك مطور تجربته في تصحيح كود تم إنشاؤه بواسطة LLM (للترحيل من SAS إلى SQL/Python). على الرغم من أن كود الذكاء الاصطناعي بدا “لائقًا”، إلا أنه كان مليئًا بالأخطاء: استدعاء وظائف غير محددة، الخلط بين منطق كود متشابه ولكنه مختلف، تخطي SQL صحيح ولكنه سيئ التنسيق، استبدال قيم رئيسية بشكل عشوائي، وعدم اتساق النتائج عند التشغيل عدة مرات. كان الاستنتاج النهائي أن الكود غير قابل للاستخدام تمامًا ويتطلب إعادة كتابة، وأن إصلاحه أكثر خطورة من إعادة كتابته. يسلط هذا الضوء على القيود الحالية لقدرات توليد الكود بواسطة الذكاء الاصطناعي، ويؤكد على ضرورة المراجعة والتحقق البشري. (المصدر: Reddit r/ArtificialInteligence)
الذكاء الاصطناعي وعلاقات العمل: كيف يجب أن تستجيب النقابات؟: تشير المناقشة إلى أنه مع تعزيز قدرات الأتمتة للذكاء الاصطناعي في مختلف الصناعات، تحتاج النقابات العمالية إلى التعامل بشكل أكثر نشاطًا مع تأثيره المحتمل على العمال. يستشهد المقال بأحداث إضرابات واحتجاجات سابقة تتعلق بالذكاء الاصطناعي، مثل اقتراح المدارس استخدام الذكاء الاصطناعي كبديل بعد إضراب طلاب الدراسات العليا، واستخدام الذكاء الاصطناعي لمراقبة احتجاجات الطلاب، والمخاوف بشأن أتمتة خدمات الصحة العقلية، واحتمال إضراب المعلمين بسبب تطبيق الذكاء الاصطناعي في المدارس. ترى وجهة النظر أن العمال (والمنظمات التي تمثلهم) يجب ألا ينتظروا، بل يجب عليهم وضع استراتيجيات بشكل استباقي لمواجهة التغييرات التي يجلبها الذكاء الاصطناعي. (المصدر: Reddit r/artificial)

إطلاق مجموعة بيانات RealHarm: جمع حالات فشل وكلاء الذكاء الاصطناعي في العالم الحقيقي: أطلق فريق Giskard مجموعة بيانات RealHarm، التي تسجل حالات حقيقية تم الإبلاغ عنها علنًا تتعلق بمشاكل ظهرت في التطبيقات العملية لوكلاء الذكاء الاصطناعي (AI Agents)، وخاصة تلك القائمة على LLM. من خلال تحليل هذه الحالات، وجد الفريق أن الإضرار بالسمعة هو الضرر التنظيمي الأكثر شيوعًا، وأن المعلومات المضللة والهلوسة هي أنواع المخاطر الأكثر شيوعًا، وأن الحواجز الوقائية الحالية فشلت في منع العديد من الحوادث بفعالية. تهدف مجموعة البيانات هذه إلى مساعدة الباحثين والمطورين على فهم مخاطر الذكاء الاصطناعي في العالم الحقيقي والوقاية منها بشكل أفضل. (المصدر: Reddit r/LocalLLaMA)

تقرير يكشف المخاطر الأمنية لخوادم Ollama العامة: يعرض موقع freeollama.com عددًا كبيرًا من خوادم Ollama المكشوفة على الإنترنت العام. يشير هذا إلى أن العديد من المستخدمين عند نشر خدمات LLM المحلية، يفشلون في تكوين تدابير الأمان بشكل صحيح (مثل تعيين عنوان الاستماع إلى 0.0.0.0 دون إضافة مصادقة)، مما يعرض نماذجهم وبياناتهم المحتملة لخطر الوصول والاستغلال غير المصرح به. تذكير للمستخدمين بضرورة الانتباه إلى تكوين أمان الشبكة عند نشر خدمات الذكاء الاصطناعي المحلية. (المصدر: Reddit r/LocalLLaMA)

وجهة نظر: لا ينبغي تقسيم النماذج بشكل مطلق إلى نماذج استدلال ونماذج غير استدلال: يقترح باحث الذكاء الاصطناعي Nathan Lambert أنه لا ينبغي تصنيف النماذج بشكل صارم إلى فئتين “استدلال” (reasoning) و “غير استدلال”، بل يجب تقييم جميع النماذج في جميع المجالات. “نماذج الاستدلال” عادة ما يكون أداؤها ممتازًا أيضًا في معايير غير الاستدلال، والعكس ليس صحيحًا. يشير هذا إلى أن النماذج ذات القدرة على الاستدلال قد تكون أكثر عمومية. في الوقت نفسه، يشير إلى الحاجة إلى نماذج تسعير أفضل لتعكس القدرات والتكاليف المختلفة. (المصدر: natolambert)
المؤسس المشارك لـ DeepMind ديميس هاسابيس ضمن قائمة TIME100، ويؤكد على التعاون في أمن الذكاء الاصطناعي: تم اختيار ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، ضمن قائمة مجلة تايم لأكثر 100 شخصية مؤثرة لعام 2025. أكد في المقابلة أنه يأمل أن تتمكن الدول والشركات المتنافسة من تنحية خلافاتها جانبًا والتعاون في مجال أمن الذكاء الاصطناعي، لأن ضمان تطور الذكاء الاصطناعي نحو الأفضل يصب في مصلحة الجميع. (المصدر: demishassabis)

مسؤول تنفيذي في Google DeepMind: التعلم المعزز يحتاج إلى تجاوز المعرفة البشرية: يعتقد David Silver، نائب رئيس التعلم المعزز في Google DeepMind، أن أبحاث الذكاء الاصطناعي يجب أن تتجاوز المعرفة البشرية المعروفة، وتتجه نحو أنظمة قادرة على التعلم الذاتي وحتى اكتشاف المعرفة العلمية الجديدة. يؤكد هذا على إمكانات التعلم المعزز في دفع الاستكشاف والاكتشاف المستقل للذكاء الاصطناعي. (المصدر: GoogleDeepMind)
وجهة نظر: عنق الزجاجة في تطوير الذكاء الاصطناعي تحول من قوة الحوسبة إلى البيانات والتقييم: في فيديو يحلل تقدم نماذج مثل Kling 2.0 و GPT-4.1 و o3، يستشهد مقدم قناة AI Explained بوجهة نظر مسؤول تنفيذي في OpenAI تشير إلى أن العوامل المقيدة لتطوير الذكاء الاصطناعي حاليًا تحولت بشكل أكبر من قوة الحوسبة إلى البيانات، وخاصة البيانات عالية الجودة والمتخصصة في مجال معين وطرق التقييم الفعالة (Evals). يعتمد تحسين أداء النموذج بشكل متزايد على إيجاد بيانات أفضل وطرق أفضل لقياس التقدم. (المصدر:
)
مخطط مقارنة السعر والأداء للنماذج غير الاستدلالية: شارك مجتمع Reddit مخططًا يقارن أسعار (يفترض أنها تكاليف API) لنماذج LLM غير استدلالية مختلفة مع درجات أدائها على LiveBench (منصة اختبار أداء في الوقت الفعلي). يعرض المخطط بشكل مرئي فعالية التكلفة لكل نموذج في معيار محدد، على سبيل المثال، يظهر أن سلسلة Gemma/Gemini تبرز من حيث فعالية التكلفة. (المصدر: Reddit r/LocalLLaMA)

💡 أخرى
تقدم جديد في واجهة الدماغ والحاسوب: تحويل موجات الدماغ مباشرة إلى كلام: يظهر بحث جديد زرعة واجهة دماغ وحاسوب (BCI) قادرة على فك تشفير موجات دماغ الشخص المصاب بالشلل في الوقت الفعلي وتوليفها إلى كلام طبيعي. توفر هذه التقنية إمكانية تواصل جديدة للأشخاص الذين فقدوا القدرة على الكلام بسبب إصابة عصبية أو مرض، وهي اختراق كبير في مجال التقاطع بين الذكاء الاصطناعي والتكنولوجيا المساعدة وعلم الأعصاب. (المصدر: Ronald_vanLoon、Ronald_vanLoon)

استكشاف مؤسس Mihoyo تساي هاويو لألعاب الذكاء الاصطناعي: أصدرت شركة Anuttacon للذكاء الاصطناعي، التي أسسها الرئيس التنفيذي السابق لشركة Mihoyo تساي هاويو، عرضًا تشويقيًا وتجريبيًا للعبة الذكاء الاصطناعي التجريبية “Whispers From The Star”. تتمحور اللعبة حول الحوار في الوقت الفعلي المدفوع بالذكاء الاصطناعي، حيث يتفاعل اللاعبون مع شخصية الذكاء الاصطناعي Stella عبر النص أو الصوت أو الفيديو لتوجيهها للبقاء على قيد الحياة. تستخدم اللعبة تقنية الذكاء الاصطناعي متعدد الوسائط، حيث يتم إنشاء مشاعر Stella وردود أفعالها وحركاتها بواسطة الذكاء الاصطناعي في الوقت الفعلي، مع تعابير وجه وحركات طبيعية. يعكس هذا استكشاف تساي هاويو لكيفية تغيير AIGC لتطوير الألعاب، ولكنه يواجه تحديات مثل نضج التكنولوجيا ونماذج الأعمال وقبول اللاعبين. يقارن المقال أيضًا الاستراتيجيات المختلفة للشركات الكبرى مثل Tencent و NetEase في تطبيق الذكاء الاصطناعي في الألعاب. (المصدر: 原神之后,蔡浩宇的 AIGC 游戏野望)

Unitree تقوم بترقية الروبوت الصناعي ذي العجلات B2-W: عرضت Unitree Robotics القدرات المطورة لروبوتها الصناعي ذي العجلات B2-W. على الرغم من عدم تفصيل الترقيات المحددة، إلا أن هذا النوع من الروبوتات يدمج عادةً تقنية الذكاء الاصطناعي للملاحة وتجنب العقبات وتنفيذ المهام، وقد تتضمن هذه الترقية استقلالية أقوى أو قدرة حمولة أكبر أو تطبيقات في سيناريوهات صناعية محددة. (المصدر: Ronald_vanLoon)
الروبوتات تتعلم المهارات البشرية: عرضت Circuit Robotics كيف تتعلم الروبوتات المهارات البشرية. يتضمن هذا عادةً طرق الذكاء الاصطناعي مثل التعلم بالتقليد (imitation learning) والتعلم المعزز (reinforcement learning)، مما يسمح للروبوتات بإتقان مهام التشغيل المعقدة من خلال مراقبة العروض التوضيحية أو التجربة والخطأ، وهو اتجاه بحثي مهم يجمع بين الروبوتات والذكاء الاصطناعي. (المصدر: Ronald_vanLoon)
روبوتات التسوق تصبح حقيقة واقعة: يشير الفيديو أو المعلومات التي شاركها Fabrizio Bustamante إلى أن استخدام الروبوتات للتسوق أصبح حقيقة واقعة. قد يشير هذا إلى روبوتات الفرز الآلي داخل المستودعات، أو روبوتات التوصيل للمستهلكين، أو روبوتات الإرشاد داخل المتاجر، والتي تتطلب عادةً الذكاء الاصطناعي لتخطيط المسار والتعرف على العناصر والتفاعل بين الإنسان والآلة. (المصدر: Ronald_vanLoon)
تطبيقات الذكاء الاصطناعي والروبوتات في الزراعة: يناقش JC Niyomugabo تطبيقات الذكاء الاصطناعي والروبوتات في الزراعة (AgriTech). يشمل ذلك استخدام الذكاء الاصطناعي لمراقبة المحاصيل وتشخيص الأمراض والآفات واتخاذ قرارات الري والتسميد الدقيقة، واستخدام الروبوتات للزراعة الآلية وإزالة الأعشاب الضارة والحصاد. يهدف ذلك إلى زيادة الكفاءة الزراعية والإنتاجية والاستدامة. (المصدر: Ronald_vanLoon)
روبوتات نانوية تحمل “أسلحة مخفية” يمكنها قتل الخلايا السرطانية: أظهر بحث شاركته Khulood Almani أن نوعًا من الروبوتات النانوية مجهز بـ “أسلحة مخفية” (الآلية المحددة غير مفصلة) قادر على استهداف وقتل الخلايا السرطانية. غالبًا ما تتضمن آليات الملاحة والاستهداف للروبوتات النانوية خوارزميات الذكاء الاصطناعي، المستخدمة لتحديد الأهداف في البيئات البيولوجية المعقدة وتنفيذ المهام، وهي تطبيق متطور في مجال الرعاية الصحية. (المصدر: Ronald_vanLoon)
تطوير اليد الاصطناعية COVVI: تهدف اليد الاصطناعية التي طورتها شركة COVVI إلى توفير أطراف اصطناعية أكثر مرونة وقدرة وظيفية للأشخاص مبتوري الأطراف. تدمج هذه الأيدي الاصطناعية المتقدمة عادةً مستشعرات وخوارزميات الذكاء الاصطناعي لتفسير إشارات عضلات المستخدم (مثل إشارات EMG الكهربائية للعضلات) أو الإشارات العصبية، لتحقيق تحكم أكثر طبيعية يعتمد على النية وتنفيذ عمليات دقيقة. (المصدر: Ronald_vanLoon)
روبوت بشري صيني ينفذ مهام فحص الجودة: أفادت WevolverApp أن الروبوتات البشرية الصينية تُستخدم الآن لتنفيذ مهام فحص الجودة. يتطلب هذا أن تتمتع الروبوتات بقدرات تعرف بصري متقدمة (قد تكون مدفوعة بالذكاء الاصطناعي)، وقدرات تحكم دقيقة، وقدرة معينة على اتخاذ القرار لتحديد ما إذا كان المنتج مؤهلاً، وهو مثال على تطبيق الروبوتات البشرية في مجال الأتمتة الصناعية. (المصدر: Ronald_vanLoon)
أول عملية جراحية بشرية في العالم يجريها طبيب أسنان آلي: أفادت Gigadgets عن أول عملية جراحية بشرية في العالم يتم إجراؤها بالكامل بواسطة طبيب أسنان آلي. على الرغم من عدم وضوح التفاصيل، إلا أن هذا يعني عادةً أن نظام الروبوت يقوم بتخطيط الجراحة وتحديد المواقع والتشغيل بمساعدة الذكاء الاصطناعي، بهدف تحسين دقة الجراحة واتساقها، وهو معلم بارز في الجمع بين الروبوتات الطبية والذكاء الاصطناعي. (المصدر: Ronald_vanLoon)
الذكاء الاصطناعي يقود التقدم الرقمي، لبناء دول ذكية: يستكشف مقال لـ Ronald van Loon بالتعاون مع Huawei كيفية دفع التقدم الوطني وبناء دول أكثر ذكاءً من خلال التقنيات الرقمية مثل الذكاء الاصطناعي وإنترنت الأشياء (IoT) والاتصال وتحليل البيانات. يؤكد على دور الذكاء الاصطناعي في تحسين الخدمات العامة وإدارة البنية التحتية والتنمية الاقتصادية. (المصدر: Ronald_vanLoon)

روبوت Velox القادر على الحركة البرمائية: روبوت Velox الذي شاركه Pascal Bornet هو روبوت برمائي قادر على الحركة في الماء وعلى اليابسة. قد تجعله هذه القدرة المتعددة مناسبًا لسيناريوهات معقدة مثل البحث والإنقاذ والمراقبة البيئية، وقد تكون قدرته على الملاحة المستقلة والتكيف مع البيئات المختلفة مدفوعة بالذكاء الاصطناعي. (المصدر: Ronald_vanLoon)