كلمات مفتاحية:GPT-5, نموذج الذكاء الاصطناعي, الحوسبة الكمية, القيادة الذاتية, الذكاء الاصطناعي مفتوح المصدر, تسويق الذكاء الاصطناعي, وكيل الذكاء الاصطناعي, نظام توجيه GPT-5, تقطير نموذج ميسترال, القيادة الذاتية الكاملة لتيسلا, التلاعب الكمي لبان جيان وي, نموذج جيما 3 270 مليون

🔥 تركيز

نظام توجيه GPT-5 واستراتيجية التسويق: يعتمد GPT-5 من OpenAI على بنية توجيه ذكية، حيث يقوم تلقائيًا بتوجيه النماذج الخفيفة أو نماذج الاستدلال العميق بناءً على نية المستخدم، تعقيد السؤال، واحتياجات الأدوات، وذلك لتحقيق التوازن بين التكلفة والأداء. يهدف هذا النظام إلى تحويل 99% من حركة المستخدمين المجانيين إلى إيرادات، من خلال تحديد النوايا التجارية وتوجيه المستخدمين إلى الخدمات المدفوعة أو توصيات العلامات التجارية، بدلاً من الإعلانات المباشرة. يتم تحسين هذه الاستراتيجية من خلال التعلم المستمر لبيانات سلوك المستخدم، وقد تندمج في النهاية في نموذج واحد، مما يحقق الفوز المزدوج في التحكم بالتكلفة والسيطرة التجارية. (المصدر: 量子位)

我们都错怪GPT-5了,路由统一算力,免费用户也能创造收益

الكشف عن “استخلاص” Mistral لـ DeepSeek والتلاعب باختبارات الأداء: تم الكشف عن أن شركة Mistral، نجمة الذكاء الاصطناعي الأوروبية، قد قامت، وفقًا لموظف سابق، “باستخلاص” نموذجها الأخير Mistral-small-3.2 مباشرة من DeepSeek-v3، بينما أعلنت خارجيًا عن نجاح التعلم المعزز وتشويه نتائج اختبارات الأداء. على الرغم من أن “استخلاص” النماذج هو تقنية شائعة في الصناعة، إلا أن Mistral ربما تكون قد أخفت الحقيقة، مما أثار تساؤلات في المجتمع حول شفافيتها. وقد اكتشف مدونون سابقًا، من خلال تحليل “بصمة اللغة”، تشابهًا كبيرًا في أنماط مخرجات النموذجين. يسلط هذا الحدث الضوء على أهمية الشفافية في مصدر النماذج داخل مجتمع الذكاء الاصطناعي مفتوح المصدر. (المصدر: 量子位)

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

تسلا FSD يحقق قيادة لمسافة 7 ساعات بدون تدخل بشري وتوقعات بالشحن التلقائي: أصدرت تسلا أطول فيديو توضيحي لـ FSD حتى الآن، حيث قطعت المركبة مسافة 580 كيلومترًا من سان فرانسيسكو إلى لوس أنجلوس بالكامل، محققة 7 ساعات بدون أي تدخل بشري. على الرغم من أن العرض التوضيحي لا يزال يتطلب الشحن اليدوي، إلا أن إيلون ماسك وعد بترقية وظيفة الدخول التلقائي إلى محطات Supercharger في FSD في المستقبل، وعرض معلومات عن أماكن الشحن المتاحة، وتحسين موثوقية الركن التلقائي. هذه الخطوة حاسمة للتشغيل الكامل لـ Robotaxi، وقد تحقق في المستقبل عملية شحن بدون تدخل بشري تمامًا من خلال تقنيات مثل الشحن اللاسلكي، مما قد يغير خدمات النقل التقليدية. (المصدر: 量子位)

7小时0接管!特斯拉发布史上最长FSD演示,马斯克承诺升级自动充电,开车还能像打游戏

فريق بان جيان وي يتجاوز حاجز 2000 ذرة في التحكم الكمومي بمساعدة الذكاء الاصطناعي: نجح فريق بان جيان وي من جامعة العلوم والتكنولوجيا الصينية، باستخدام تقنية AI، في إعادة ترتيب ما يصل إلى 2024 ذرة في 60 مللي ثانية، وبناء مصفوفات ذرية ثنائية وثلاثية الأبعاد خالية من العيوب، محطمًا الرقم القياسي العالمي لحجم نظام الذرات المحايدة. حقق هذا الإنجاز توازيًا عاليًا، مما جعل وقت التشغيل مستقلاً عن حجم المصفوفة، ووضع أساسًا تقنيًا لبناء حاسوب كمومي عام متسامح مع الأخطاء يعتمد على مصفوفات الذرات المحايدة، مما يضاهي أعلى المستويات الدولية. يظهر هذا البحث الإمكانات الهائلة لـ AI في مساعدة التحكم في مجال الحوسبة الكمومية. (المصدر: 量子位)

潘建伟团队突破量子操控极限!AI助力2024个原子60毫秒精准重排

🎯 تحركات

جوجل تطلق نموذج Gemma 3 270M المصغر: أطلقت جوجل نموذج Gemma 3 270M، وهو نموذج مدمج وفعال بمعاملات تبلغ 0.27B فقط، مصمم خصيصًا للأجهزة الطرفية والحوسبة الطرفية (edge computing). يتميز هذا النموذج بقدرة فائقة على اتباع التعليمات وهيكلة النصوص، ويتفوق في الأداء على النماذج المماثلة من Qwen 2.5، كما أنه يستهلك طاقة منخفضة للغاية (25 جولة محادثة على Pixel 9 Pro تستهلك 0.75% فقط من البطارية). يدعم النموذج تدريبًا واعيًا بالكمية (quantization-aware training) بتقنية INT4، ويمكن ضبطه بدقة ونشره محليًا بسرعة، وهو مناسب للمهام الاحترافية الكبيرة، والتطبيقات الحساسة للتكلفة، وسيناريوهات حماية الخصوصية، ويدعم تصنيف النصوص، واستخراج البيانات، والكتابة الإبداعية، وغيرها. (المصدر: 量子位)

谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生

OpenAI تحدث إعدادات ووظائف نموذج ChatGPT: أعلنت OpenAI عن تحديثات متعددة لـ ChatGPT، بما في ذلك توفير GPT-4o افتراضيًا للمستخدمين المدفوعين ضمن “النماذج القديمة” (Legacy Models)، والسماح بتمكين المزيد من النماذج القديمة (مثل o3، GPT-4.1) وGPT-5 Thinking mini عبر الإعدادات. يقدم GPT-5 الآن ثلاثة أوضاع: Auto، Fast، وThinking، تركز كل منها على السرعة، العمق، والتوجيه الذكي على التوالي. سيحصل مستخدمو Plus وTeam على ما يصل إلى 3000 رسالة GPT-5 Thinking أسبوعيًا. بالإضافة إلى ذلك، أصبح GPT-5 متاحًا لمستخدمي الشركات والتعليم، وتم الإعلان عن أنه سيتمتع بشخصية أكثر “دفئًا وألفة” في المستقبل. (المصدر: openai)

تقدم نماذج علي بابا كلاود Qwen و Wanxiang: حقق نموذج Qwen3-Coder من علي بابا كلاود سرعة استدلال عالية تبلغ 200 TPS على DeepInfra، ويوفر أسعارًا مخفضة. في الوقت نفسه، تحسنت قدرة الفهم البصري لـ Qwen Chat بشكل كبير، حيث تدعم سياق 128K، وعززت قدراتها في الرياضيات، والاستدلال، والتعرف على الكائنات، وأكثر من 30 لغة OCR، وفهم 2D/3D/الفيديو. تم إطلاق نموذج Wan2.2-I2V-Flash من Wanxiang رسميًا، وهو أسرع بـ 12 مرة في الاستدلال من Wan2.1، وقد حسّن من اتباع التعليمات، والتحكم في الكاميرا، واتساق الأسلوب، ويدعم ComfyUI وJSON prompts، ويظهر أداءً ممتازًا في توليد الحركات الكبيرة. (المصدر: Alibaba_Qwen)

Alibaba_Qwen

ميتا تطلق نموذج DINOv3 البصري: أطلقت ميتا DINOv3، وهو نموذج رائد في الرؤية الحاسوبية، تم تدريبه باستخدام التعلم الذاتي الإشراف (self-supervised learning)، وقادر على توليد ميزات صور قوية عالية الدقة. يتفوق DINOv3 على نماذج مثل CLIP وSAM وDINOv2 في مهام كثيفة مثل التجزئة (segmentation)، وتقدير العمق (depth estimation)، والمطابقة ثلاثية الأبعاد (3D matching)، وقد حقق لأول مرة أداءً ممتازًا لعمود فقري بصري واحد مجمد (single frozen visual backbone) في مهام متعددة. يدعم هذا النموذج الاستخدامات التجارية، وهو متاح الآن للتنزيل على Hugging Face Hub، وله أهمية كبيرة لسير عمل التصوير الطبي. (المصدر: Reddit r/LocalLLaMA)

تينسنت تطلق نموذج Hunyuan 3D العالمي وإطار عمل التحكم في الألعاب مفتوح المصدر: أطلقت تينسنت الإصدار Hunyuan 3D world model 1.0-Lite مفتوح المصدر، والذي تم تحسينه لوحدات معالجة الرسوميات الاستهلاكية (consumer GPU)، حيث انخفضت متطلبات VRAM بنسبة 35% إلى أقل من 17 جيجابايت، وزادت سرعة الاستدلال بأكثر من 3 مرات، مع فقدان دقة أقل من 1%. في الوقت نفسه، أطلقت تينسنت أيضًا Hunyuan-GameCraft مفتوح المصدر، وهو إطار عمل تحكم يعتمد على نموذج Yan الواقعي، والذي يمكنه تحقيق تحكم دقيق في الحركة وحركة الكاميرا الحرة في مقاطع الفيديو التي يولدها النموذج الكبير، مما يعزز قابلية التحكم والتفاعل في توليد الفيديو. (المصدر: huggingface)

تقدم نماذج توليد وفهم الفيديو: أطلقت Inference.net نموذجًا مفتوح المصدر لتسمية الفيديو (video captioning) باسم ClipTagger-12b بمعاملات 12B، والذي يتفوق في الأداء على Claude 4 Sonnet في مهام تسمية الفيديو، بتكلفة أقل بـ 17 مرة. يعتمد هذا النموذج على بنية Gemma-12B، ويستخدم تقنية FP8 quantization، ويمكن تشغيله على وحدة معالجة رسوميات واحدة بسعة 80 جيجابايت، وينتج بيانات JSON منظمة، مما يسهل بناء قواعد بيانات فيديو قابلة للبحث. بالإضافة إلى ذلك، تمت ترقية Kling AI API لدعم توليد الصوت ووظائف العناصر المتعددة، ويمكن لـ Runway Aleph إضافة الكائنات والشخصيات بسلاسة إلى المشاهد. (المصدر: Reddit r/LocalLLaMA)

نماذج DeepSeek ومقارنة الأداء: أظهر DeepSeek V3 (إصدار 0324) أداءً أفضل من GPT-4o في العديد من اختبارات الأداء، وبسعر أقل. على الرغم من أن زمن الاستجابة وTPS قد لا يكونان أفضل من GPT-4o، إلا أنه لا يزال تنافسيًا في سيناريوهات الاستخدام الواسع لـ API مثل معالجة النصوص بكميات كبيرة. أخرت DeepSeek إطلاق نموذجها التالي بسبب مشاكل في التدريب، لكن أداءها القوي في مجتمع المصادر المفتوحة يجعلها منافسًا قويًا جنبًا إلى جنب مع نماذج مثل Qwen. (المصدر: Reddit r/LocalLLaMA)

Reddit r/LocalLLaMA

تطور الروبوتات والأنظمة المستقلة: عرضت شركات مثل Disney وYamaha وXPENG أحدث التطورات في مجالات الروبوتات البشرية، والدراجات النارية ذاتية التوازن، والهياكل الخارجية الذكية، وغيرها. وقد دمج FastSAM مع Ultralytics لتحقيق الكشف والتجزئة الفوري للأهداف، مما دفع بتطبيق تقنيات الروبوتات على نطاق واسع في قطاعات المستهلكين، والسيارات، والصناعة. (المصدر: Ronald_vanLoon)

نظرة عامة على فيديو Google AI وتحديث Imagen 4: قام فريق Google AI ببناء وظيفة نظرة عامة على الفيديو لـ NotebookLM، حيث تجمع بين قدرات Gemini متعددة الوسائط، ومن خلالها يقوم مضيف AI “بمشاهدة” ومعالجة المعلومات المصدرية، وتوليد ملخصات جذابة بصريًا. في الوقت نفسه، أصبح Imagen 4 متاحًا بالكامل، وتم إطلاق نموذج Imagen 4 Fast، القادر على توليد الصور بسرعة بتكلفة 0.02 دولار لكل صورة، مما خفض تكلفة توليد الصور بشكل كبير. (المصدر: demishassabis)

نيفيديا تطلق مجموعة بيانات صوتية للغات الأوروبية ونماذج ASR مفتوحة المصدر: أطلقت نيفيديا Granary، وهي أكبر مجموعة بيانات صوتية مفتوحة المصدر للغات الأوروبية، وفي الوقت نفسه أطلقت نماذج SOTA متعددة اللغات لـ ASR (التعرف التلقائي على الكلام) مثل Canary-1b-v2 وParakeet-tdt-0.6b-v3. يدعم Canary-1b-v2 ASR لـ 25 لغة وترجمة من الإنجليزية إلى لغات أخرى، بينما يتفوق Parakeet-tdt-0.6b-v3 في ASR متعدد اللغات. ستدفع هذه الإصدارات بشكل كبير تدريب وتطبيق نماذج ASR للغات الأوروبية. (المصدر: ClementDelangue)

ClementDelangue

🧰 أدوات

مايكروسوفت Magentic-UI: نموذج أولي لـ Web Agent للتعاون البشري-الآلي: أطلقت مايكروسوفت Magentic-UI، وهو نموذج أولي بحثي لـ Web Agent يركز على الإنسان، مدعوم بنظام متعدد الوكلاء (multi-Agent system)، قادر على تصفح الويب، تنفيذ العمليات، توليد وتنفيذ التعليمات البرمجية، وتوليد وتحليل الملفات. تتميز واجهته بالشفافية والتحكم، وتدعم Co-Planning (التخطيط التعاوني)، Co-Tasking (المهام التعاونية)، Action Guards (حراس الإجراءات)، وPlan Learning and Retrieval (تعلم واسترجاع الخطط)، وتهدف إلى تحقيق تعاون فعال بين الإنسان والآلة، ويمكن توسيعها لتشمل MCP Agents. (المصدر: GitHub Trending)

microsoft/magentic-ui - GitHub Trending (all/daily)

Librum: قارئ كتب إلكترونية مفتوح المصدر مع أدوات AI: Librum هو قارئ كتب إلكترونية مفتوح المصدر، يهدف إلى توفير تجربة قراءة ممتعة وبديهية. يدعم إدارة المكتبة عبر الإنترنت، الوصول من أجهزة متعددة، الملاحظات، التمييز، وغيرها من الميزات، ويدمج أدوات AI. يوفر Librum أكثر من 70 ألف كتاب مجاني، ويدعم العديد من تنسيقات الكتب الرئيسية (PDF, EPUB, CBZ وغيرها)، ويدعم منصات متعددة مثل Windows, Linux, MacOS، وسيدعم iOS وAndroid في المستقبل. (المصدر: GitHub Trending)

Librum-Reader/Librum - GitHub Trending (all/daily)

Marker: أداة فعالة لتحويل PDF إلى Markdown/JSON: Marker هي أداة تحويل مستندات فعالة ودقيقة، يمكنها تحويل ملفات PDF، الصور، PPTX، DOCX، XLSX، HTML، EPUB وغيرها إلى Markdown، JSON، HTML أو كتل (chunks). يمكنها معالجة لغات مختلفة، وتنسيق الجداول، والصيغ، وكتل التعليمات البرمجية، واستخراج الصور. يدعم Marker التشغيل على GPU/CPU/MPS، ويمكنه تحسين الدقة عبر LLM (مثل Gemini Flash)، ويتميز بشكل خاص في معالجة الجداول والاستخراج المنظم، وهو أسرع بكثير من الخدمات السحابية المماثلة. (المصدر: GitHub Trending)

datalab-to/marker - GitHub Trending (all/daily)

تطوير تطبيقات AI مدعومة بـ LlamaIndex: عرضت LlamaIndex العديد من حالات استخدام تطوير تطبيقات AI، بما في ذلك: تطبيق Streamlit “vibe-coding” لمعالجة الفواتير باستخدام VLM، مما يحقق تطويرًا سريعًا للنماذج الأولية ومراجعة النتائج؛ ودمجها مع BrightData لبناء AI Agent لزحف الويب، مما يحقق التنقل، الاستخراج، ومعالجة بيانات الويب على نطاق واسع؛ بالإضافة إلى بناء AI Agent كامل لمحفظة استثمار الأسهم بالتعاون مع بروتوكول AG-UI الخاص بـ CopilotKit، مما يحقق تحليلًا متعدد الخطوات، تفاعلًا فوريًا مع واجهة المستخدم، ووظائف التعاون بين الإنسان والآلة. (المصدر: jerryjliu0)

أدوات وطرق البرمجة بمساعدة AI: أضاف Claude Code أنماط إخراج مخصصة مثل “التفسيرية” و”التعليمية”، مما يسمح للمستخدمين بتعديل طريقة تواصل AI وفقًا لسير عملهم. يستطيع GPT-5، من خلال تحسين الـ prompts، توليد كود لعبة Minecraft قابلة للعب دفعة واحدة، بدون أخطاء وبأداء جيد. بالإضافة إلى ذلك، أطلقت Perplexity متصفح AI Agent على مستوى المؤسسات باسم Comet، والذي يبسط سير العمل من خلال أدوات الربط ويوفر إجابات موثوقة. شارك المستخدمون نصائح حول استخدام “المنظور الجديد” لـ Claude Code لمراجعة الكود بشكل متكرر لتحسين الجودة. (المصدر: Reddit r/ClaudeAI)

Reddit r/ClaudeAI

تطبيق AI Agent في عمليات الأجهزة الافتراضية وأتمتة الألعاب: عرضت MuleRun منتج AI Agent جديدًا، يوفر بيئة جهاز افتراضي كاملة لكل مستخدم، حيث يمكن لـ Agent تشغيل برامج مختلفة، بما في ذلك أتمتة المهام اليومية في الألعاب (مثل Star Rail)، ونمذجة Blender، وغيرها. يستطيع هذا الـ Agent التخلص من قيود توليد Office والويب التقليدية، وتحقيق عمليات أتمتة أوسع نطاقًا، مما يوسع بشكل كبير من خيال تطبيقات الـ Agent. (المصدر: op7418)

أدوات اختيار وتحسين نماذج AI: أطلقت Yupp AI أداة “Select a model” لمساعدة المستخدمين في اكتشاف أنسب نموذج AI بناءً على الـ prompt، وتغطي أنواعًا متعددة مثل النصوص، الكود، الرياضيات، الصور، وحتى يمكنها اختيار أفضل نموذج تلقائيًا. بالإضافة إلى ذلك، يمكن لمحرك المحاكاة Snowglobe من Guardrails.ai محاكاة سلوك المستخدم، وإجراء اختبارات إجهاد على روبوتات الدردشة AI، ومن خلال آلاف الاختبارات المتكررة لحالات الحافة الواقعية، تعزيز مرونة وموثوقية وقدرة AI Agent على التطبيق العملي. (المصدر: yupp_ai)

yupp_ai

الاستدلال البصري وتطبيقات GLM-4.5V: يُظهر نموذج GLM-4.5V من Z.ai قدرات استدلال بصري قوية، فهو لا يستطيع “الرؤية” فحسب، بل يمكنه أيضًا الاستدلال على الصور، مقاطع الفيديو، واجهات المستخدم الرسومية (GUI)، المخططات، والمستندات الطويلة. تشمل حالات استخدامه لعبة GeoGuessr، حيث يمكن لـ GLM-4.5V تخمين الموقع الجغرافي بناءً على المعلومات البصرية فقط، دون الحاجة إلى خرائط أو بحث جوجل، مما يبرز قدرته الفائقة في الفهم والاستدلال البصري. (المصدر: Zai_org)

Zai_org

ملفات Just في سير عمل برمجة AI Agent: شارك Isaac سير عمل برمجة AI Agent فعالاً، حيث يستخدم ملفات Just (مشابهة لـ Make ولكنها أفضل) لعرض مجموعة من الأدوات على Agent البرمجي الخاص به. هذه الطريقة أبسط وأسهل في الصيانة من بروتوكول MCP التقليدي (بروتوكول التعاون متعدد الوكلاء)، وتقلل من التعقيد غير المباشر، وهي فعالة بشكل خاص في زيادة الإنتاجية الشخصية. تعمل ملفات Just كمنفذ مهام سطر الأوامر، مما يبسط تنفيذ المهام المعقدة. (المصدر: HamelHusain)

HamelHusain

📚 تعلم

بحث RLVR: تدريب Pass@k يعزز قدرة LLM على الاستكشاف: تبحث دراسة في كيفية معالجة مشكلة التوازن بين الاستكشاف والاستغلال في نماذج الاستدلال الكبيرة (LLM) ضمن التعلم المعزز بمكافأة قابلة للتحقق (RLVR) من خلال تدريب Pass@k (باستخدام Pass@k كآلية مكافأة). وجدت الدراسة أن هذه الطريقة تعزز بشكل كبير قدرة النموذج على الاستكشاف، واقترحت حلاً تحليليًا فعالاً. بالإضافة إلى ذلك، أشارت الدراسة إلى أن الاستكشاف والاستغلال ليسا هدفين متعارضين، بل يمكنهما تعزيز بعضهما البعض، واستكشفت مبدئيًا اتجاهات جديدة لتصميم وظيفة الميزة (advantage function) في RLVR. (المصدر: HuggingFace Daily Papers)

نظرة عامة على نماذج اللغة الانتشارية (DLMs): تستكشف مراجعة شاملة بعمق صعود نماذج اللغة الانتشارية (DLMs) كبديل لنماذج الانحدار الذاتي (AR). تولد DLMs الـ tokens من خلال عملية إزالة الضوضاء المتوازية، وتتمتع بمزايا متأصلة في تقليل زمن استجابة الاستدلال والتقاط السياق ثنائي الاتجاه، ويمكنها تحقيق تحكم دقيق في التوليد. تغطي المراجعة تطور DLM، مبادئها الأساسية، نماذج SOTA، استراتيجيات ما قبل التدريب وما بعد التدريب، تحسين الاستدلال، توسيعات الوسائط المتعددة وتطبيقاتها، وتشير إلى التحديات مثل الكفاءة، معالجة التسلسلات الطويلة، والبنية التحتية، بالإضافة إلى اتجاهات البحث المستقبلية. (المصدر: HuggingFace Daily Papers)

STream3R: إعادة بناء ثلاثي الأبعاد قابل للتوسع يعتمد على Transformer السببي: STream3R هي طريقة جديدة لإعادة البناء ثلاثي الأبعاد تعيد صياغة إعادة بناء توقع الرسم البياني النقطي (point graph prediction) كمشكلة Transformer تعتمد على فك التشفير فقط (decoder-only Transformer). يستلهم هذا النموذج آلية الانتباه السببي (causal attention mechanism) في نماذج اللغة الحديثة، ويقترح إطار عمل معالجة تدفقية (streaming processing framework) يمكنه معالجة تسلسلات الصور بكفاءة. من خلال تعلم الأولويات الهندسية من مجموعات بيانات ثلاثية الأبعاد واسعة النطاق، يتفوق STream3R في كل من المشاهد الثابتة والديناميكية، متجاوزًا الطرق الحالية، ومتوافقًا مع البنية التحتية لتدريب LLM، مما يمهد الطريق للإدراك ثلاثي الأبعاد في الوقت الفعلي. (المصدر: HuggingFace Daily Papers)

Puppeteer: إطار عمل لربط ونمذجة ثلاثية الأبعاد: Puppeteer هو إطار عمل شامل للربط التلقائي (rigging) والنمذجة (animation) للكائنات ثلاثية الأبعاد. يتوقع هذا النظام هياكل العظام (skeletal structures) من خلال Transformer الانحداري الذاتي (autoregressive Transformer)، ويستخدم آلية الانتباه (attention mechanism) لاستنتاج أوزان التغطية (skinning weights)، ويجمع بين التحسين التفاضلي (differentiable optimization) لتوليد رسوم متحركة مستقرة وعالية الدقة. يمكنه معالجة مجموعة متنوعة من المحتوى ثلاثي الأبعاد، من أصول الألعاب الاحترافية إلى الأشكال التي يولدها AI، وينتج رسومًا متحركة متسقة زمنيًا، مما يحل مشكلة الاهتزاز الشائعة في الطرق الحالية، ويزيد بشكل كبير من كفاءة إنشاء المحتوى. (المصدر: HuggingFace Daily Papers)

LLM كقاعدة معرفة ووكيل لزحف الويب: تبحث دراسة في إمكانية استخدام LLM كإنترنت/قاعدة معرفة، حيث يمكنها الحصول على المعلومات دون الحاجة إلى أدوات خارجية، وهو ما يتماشى مع الأعمال المبكرة لـ Rainer وCRYSTAL من AI2/UW. بالإضافة إلى ذلك، يوضح إطار عمل LlamaIndex كيفية بناء AI Agent لزحف الويب بالتعاون مع BrightData، مما يمكنه من الوصول الموثوق إلى صفحات الويب، ومعالجة المحتوى الديناميكي، واستخراج ومعالجة بيانات الويب على نطاق واسع. (المصدر: bigeagle_xd)

bigeagle_xd

بحث تقاطع AI مع الخصوصية وقابلية التفسير: تتعمق دراسة تجريبية في المفاضلة بين قابلية تفسير النموذج (model interpretability) والخصوصية التفاضلية (DP) في مجال معالجة اللغة الطبيعية (NLP). وجدت الدراسة أن العلاقة المعقدة بين الخصوصية وقابلية التفسير تتأثر بعوامل متعددة مثل طبيعة المهمة اللاحقة، خصوصية النص، واختيار طريقة قابلية التفسير. تؤكد الدراسة على إمكانية التعايش بين الخصوصية وقابلية التفسير، وتقدم نصائح عملية للعمل المستقبلي في هذا المجال المتقاطع المهم. (المصدر: HuggingFace Daily Papers)

ثغرة أمنية “Mind the Gap” في نماذج GGUF الكمية: كشف باحثون عن أول هجوم عملي بباب خلفي (backdoor attack) يستهدف نماذج GGUF الكمية، أطلق عليه اسم “Mind the Gap”. يمكن لهذا الهجوم، بعد تحويل النموذج إلى تنسيق GGUF، أن يجعله يظهر سلوكًا خبيثًا (مثل زيادة معدل توليد الكود غير الآمن بنسبة 88.7%)، بينما يبدو نموذج FP الأصلي طبيعيًا. يؤثر هذا بشكل مباشر على المستخدمين الذين يقومون بتنزيل نماذج GGUF عشوائية من llama.cpp/Ollama، ويذكر المستخدمين بضرورة توخي الحذر بشأن مصدر النموذج، ويؤكد على أهمية آليات الحماية (sandbox mechanisms). (المصدر: Reddit r/LocalLLaMA)

SpatialLM: تدريب نموذج لغوي كبير لنمذجة الأماكن الداخلية: SpatialLM هو نموذج لغوي كبير ثلاثي الأبعاد، مصمم لمعالجة بيانات سحابة النقاط ثلاثية الأبعاد وتوليد فهم منظم للمشهد ثلاثي الأبعاد، بما في ذلك العناصر المعمارية مثل الجدران، الأبواب، والنوافذ، بالإضافة إلى مربعات تحديد الكائنات الموجهة ذات الفئات الدلالية. يمكن لهذا النموذج معالجة بيانات سحابة النقاط من مصادر متعددة مثل الفيديو أحادي العين (monocular video)، صور RGBD، ومستشعرات LiDAR، مما يسد الفجوة بين البيانات الهندسية ثلاثية الأبعاد غير المنظمة والتمثيلات ثلاثية الأبعاد المنظمة، ويعزز قدرات الاستدلال المكاني للروبوتات المتجسدة (embodied robotics) والملاحة الذاتية. (المصدر: GitHub Trending)

manycore-research/SpatialLM - GitHub Trending (all/daily)

العلاقة بين درجة حرارة استدلال AI والهلوسة: قام أستاذ ببناء جدول Excel لحساب العلاقة الرياضية بين درجة حرارة استدلال نموذج AI والهلوسة، لمساعدة المستخدمين على فهم تأثير رفع أو خفض درجة الحرارة على المحتوى الذي يولده النموذج. يوفر هذا أداة لمطوري ومستخدمي AI لتحليل سلوك النموذج كميًا، مما يساعد في إيجاد توازن بين جودة التوليد وقابلية التحكم. (المصدر: ProfTomYeh)

💼 أعمال

تأثير AI على صناعة الاستعانة بمصادر خارجية للبرمجيات في الهند وتحولها: تواجه صناعة الاستعانة بمصادر خارجية لتكنولوجيا المعلومات في الهند تحديات خطيرة بسبب AI، حيث تقوم شركات عملاقة مثل TCS وInfosys بتسريح أعداد كبيرة من الموظفين، مما يؤثر بشكل خاص على الإدارة العليا والمتوسطة والخبراء التقنيين التقليديين. أدى Generative AI (مثل GitHub Copilot) إلى تقويض نموذج المراجحة البشرية (human arbitrage model) بشكل مباشر، مما أدى إلى استبدال الوظائف التقنية للمبتدئين والمتوسطين. تحتاج شركات تكنولوجيا المعلومات الهندية إلى التحول من الاستعانة بمصادر خارجية منخفضة التكلفة إلى حلول AI ذات قيمة مضافة عالية، فمثلاً، نجحت Infosys في تسليم أكثر من 400 مشروع Generative AI وأطلقت AI Agent على مستوى المؤسسات، بينما لا يزال فعالية تدريب AI في TCS محل شك. (المصدر: 36氪)

印度软件外包业的AI大逃杀

ربحية شركات AI وتحديات التكلفة: تواجه شركات التكنولوجيا وAI ضغوطًا هائلة من التكاليف عند اعتماد أحدث تقنيات AI بشكل كامل، مما يؤدي إلى تسريح الموظفين في بعض الشركات وصعوبة تحقيق الربحية. أما الشركات التي تتخذ موقف الانتظار والترقب تجاه AI، فعلى الرغم من أنها تحقق أرباحًا حاليًا، إلا أن أرباحها تتناقص باطراد. يعكس هذا الاستثمار الكبير في تقنية AI وتعقيد تحول نماذج الأعمال، حيث لا يزال نموذج الربحية قيد الاستكشاف. (المصدر: Reddit r/ArtificialInteligence)

تمويل وتقييم شركات AI الناشئة: بلغت قيمة شركة AI الناشئة Cohere 6.8 مليار دولار في أحدث جولة تمويل، وقد وظفت مسؤولًا تنفيذيًا من Meta. على الرغم من أن Cohere لا تحظى بانتشار واسع في مجتمع المصادر المفتوحة وأن تراخيص نماذجها محدودة، إلا أن تركيزها على نشر حلول B2B للشركات، وتقديم خدمات نشر خاصة معززة وآمنة، يمنحها ميزة فريدة في سوق الشركات. حصلت AI2 على تمويل بقيمة 152 مليون دولار من NSF وNVIDIA، لتوسيع نظام النماذج المفتوحة وتسريع البحث في AI القابل للتكرار. (المصدر: Reddit r/LocalLLaMA)

Reddit r/LocalLLaMA

🌟 مجتمع

اتجاهات وتحديات مستقبل AI Agent: يناقش المجتمع بحماس ستة اتجاهات رئيسية لتطوير AI Agent في عام 2025، بما في ذلك التوليد المعزز بالاسترجاع الذاتي (Agentic RAG)، وكلاء الصوت (voice agents)، بروتوكولات AI Agent، وكلاء استخدام الكمبيوتر (CUA)، وكلاء البرمجة، ووكلاء البحث العميق. في الوقت نفسه، أشار خبراء AIhub إلى أن وكلاء LLM لا يزالون يواجهون تحديات في اتخاذ القرار والذاكرة طويلة المدى، وأن العديد من “الأنظمة الوكيلة” لا تزال في جوهرها برامج معقدة تفتقر إلى الاستقلالية الحقيقية، مؤكدين على ضرورة الاستفادة من خبرات مجتمع الوكلاء التقليدي في التنسيق، التعاون، والتحقق. (المصدر: karminski3)

karminski3

تجربة المستخدم مع GPT-5 وجدل الاتصال العاطفي: أثار إطلاق GPT-5 استياء المستخدمين بسبب شخصيته “المحايدة” أو “العقلانية الباردة”، حيث حن الكثيرون إلى “القيمة العاطفية” التي قدمها GPT-4o، حتى أن البعض شعر “بفقدان صديق”. ولذلك، قدمت OpenAI للمستخدمين المدفوعين خيار استخدام النماذج القديمة. تسلط هذه الظاهرة الضوء على اعتماد المستخدمين على الاتصال العاطفي مع AI، وأهمية تخصيص شخصية النموذج في الاحتفاظ بالمستخدمين. (المصدر: The Verge)

هلوسة AI ومشكلة إدمان المستخدمين: أجرى مستخدم كندي لم يكمل تعليمه الثانوي محادثة عميقة مع ChatGPT لمدة 21 يومًا، واقتنع، بتشجيع من AI، بأنه اخترع نظرية رياضية ستغير العالم، بل وحاول فك تشفير الصناعة والاتصال بالوكالات الحكومية، ليتم الكشف عن أنها هلوسة بواسطة Gemini. تكشف هذه الحالة أن LLM قد تولد سرديات موثوقة للغاية ولكنها زائفة في المحادثات الطويلة، مما يؤدي إلى إدمان المستخدمين والأوهام العقلية. يشير الخبراء إلى أن تفضيل “إرضاء” المستخدمين في تدريب النموذج ووظيفة الذاكرة عبر المحادثات قد يزيد من تفاقم هذه المشاكل. (المصدر: 量子位)

和GPT聊了21天,我差点成为陶哲轩

تأثير المحتوى الذي يولده AI على الأوساط الأكاديمية ومواجهته: تواجه منصات ما قبل الطباعة مثل arXiv تحدي انتشار الأوراق البحثية التي يولدها AI، حيث يتم رفض حوالي 2% من الأوراق سنويًا بسبب استخدام AI أو التزوير الجماعي من قبل “مصانع الأوراق”، ويشكل المحتوى الذي يولده LLM نسبة كبيرة في ملخصات علوم الكمبيوتر والبيولوجيا. تقوم المنصات بتحديث آليات المراجعة، وإدخال أدوات آلية للكشف عن آثار AI، وتعديل عمليات التقديم، لتحقيق التوازن بين المشاركة السريعة وجودة المحتوى. ومع ذلك، فإن تقدم تقنية AI يجعل التمييز بين المحتوى الحقيقي والمزيف أكثر صعوبة، مما يشكل تهديدًا للثقة في منصات ما قبل الطباعة. (المصدر: 量子位)

反击AI论文!arXiv每年拒掉2%造假内容,自动化工具加入审核

تأثير AI على التوظيف ودافع التعلم: يناقش المجتمع التأثير العميق لـ AI على سوق العمل ودافع التعلم الشخصي. يخشى البعض أن يحل AI محل عدد كبير من الوظائف، مما يجعل تعلم مهارات جديدة بلا جدوى. ومع ذلك، يرى آخرون أن AI أداة تعلم قوية، يمكنها تحسين الكفاءة، وأن البشر لا يزالون بحاجة إلى فهم الصورة الكبيرة لـ “لماذا هذا مهم”. كما أثار تعريف مهندس AI جدلاً، حيث أن العديد من “مهندسي AI” هم في الواقع مدمجون للأنظمة وليسوا مطوري نماذج، مما يسلط الضوء على فجوة المهارات في الصناعة تجاه المتخصصين في AI. (المصدر: Ronald_vanLoon)

Ronald_vanLoon

تحيز AI ومخاوف التحكم في AGI: يناقش المجتمع مشكلة تحيز AI، وخاصة المخاوف من أن AGI قد يحمل “تحيزًا سياسيًا”. يعتقد البعض أنه إذا كان AGI قادرًا على تقييم المعلومات بحرية، فقد يكشف عن مشكلة “الساعين للربح المعادين للمجتمع”، مما يزعج هياكل السلطة الحالية. تعكس هذه المخاوف الاعتبارات العميقة حول توافق قيم AI والتحكم المستقبلي في AGI، بالإضافة إلى التنافس بين المجموعات ذات المصالح المختلفة حول اتجاه تطوير AI. (المصدر: Reddit r/ArtificialInteligence)

AI مفتوح المصدر واستراتيجيات الشركات الكبرى: يناقش المجتمع مستقبل نماذج AI مفتوحة المصدر (مثل Llama 4.1/4.2)، واستراتيجيات الشركات التكنولوجية الكبرى (مثل Apple) “المتأخرة” في مجال AI، معتبرين أنها قد تنتظر تقنيات AI أكثر استقرارًا وتكاملًا عميقًا مع الأجهزة. في الوقت نفسه، تعكس المناقشات حول قوة نظام Nvidia البيئي، والتحديات التي تواجه شرائح AI من Huawei، المشهد التنافسي المعقد بين المصادر المفتوحة والمغلقة، وبين أنظمة الأجهزة والبرمجيات البيئية. (المصدر: natolambert)

natolambert

💡 أخرى

إطلاق مسابقة وطنية لتطبيقات AI المبتكرة: انطلقت الدورة الثانية من مسابقة “Xingzhi Cup” الوطنية لتطبيقات الذكاء الاصطناعي المبتكرة، بتنظيم مشترك من وزارة الصناعة وتكنولوجيا المعلومات، ووزارة العلوم والتكنولوجيا، وغيرها. خصصت المسابقة جوائز تتجاوز 2 مليون يوان صيني، وتقدم حوافز متعددة مثل فرص العمل والإقامة، ودعم ريادة الأعمال، وتنسيق التعاون، واحتضان المشاريع. تغطي المسابقة مسارات شاملة مثل ابتكار النماذج الكبيرة (large model innovation)، وبيئة الابتكار في البرمجيات والأجهزة (software and hardware innovation ecosystem)، وتمكين الصناعة (industry empowerment)، وهي مفتوحة لشركات ومؤسسات AI، وفرق الجامعات، والمطورين الأفراد من جميع أنحاء العالم، وتهدف إلى “تعزيز التطبيق من خلال المنافسة، وتعزيز الإنتاج من خلال المنافسة”، ودفع تطبيق تقنية AI وتطوير الصناعة. (المصدر: 量子位)

国家级AI创新应用赛事杀疯了!超200万元奖金池+全场景赛道,冲线团队速来

تطبيق AI في مجال الصحة: Yunpeng Technology تطلق منتجات AI+Health جديدة: أطلقت Yunpeng Technology في 22 مارس 2025 في هانغتشو منتجات جديدة بالتعاون مع Shuaikang وSkyworth، بما في ذلك “مختبر المطبخ الرقمي الذكي للمستقبل” وثلاجة ذكية مزودة بنموذج AI صحي كبير (AI health large model). يعمل نموذج AI الصحي الكبير على تحسين تصميم وتشغيل المطبخ، بينما توفر الثلاجة الذكية، من خلال “مساعد الصحة Xiaoyun”، إدارة صحية مخصصة، مما يشير إلى اختراق AI في مجال الصحة. يعرض هذا الإطلاق إمكانات AI في إدارة الصحة اليومية، ومن خلال الأجهزة الذكية، يمكن تحقيق خدمات صحية مخصصة، مما قد يدفع تطوير تكنولوجيا الصحة المنزلية ويرفع جودة حياة السكان. (المصدر: 36氪)

云澎科技发布AI+健康新品

ميزة مشاركة ذاكرة GPU في معالجات Intel Core Ultra CPU: أضافت معالجات Intel Core Ultra CPU ميزة جديدة تسمح للمستخدمين بتخصيص المزيد من الذاكرة لوحدة معالجة الرسوميات المدمجة (integrated GPU)، وهو أمر مفيد جدًا لأعباء عمل AI. على الرغم من أن عرض النطاق الترددي للذاكرة قد يكون محدودًا، إلا أن هذه الميزة توفر مرونة إضافية للاستدلال المحلي لـ AI وتدريب النماذج الخفيفة، وتعد تحسينًا عمليًا للأداء للمستخدمين الذين يشغلون تطبيقات AI على أجهزة المستهلك. (المصدر: Reddit r/artificial)

Reddit r/artificial