كلمات مفتاحية:إنفيديا جيتسون ثور, الذكاء الاصطناعي الفيزيائي, الإنسان الآلي, معالج بلاك ويل للرسوميات, قوة الحوسبة للذكاء الاصطناعي, الذروة الحاسوبية للذكاء الاصطناعي في جيتسون ثور, أداء معالج بلاك ويل للرسوميات, سيناريوهات تطبيق الذكاء الاصطناعي الفيزيائي, مجموعة تطوير الإنسان الآلي, سعر إنفيديا جيتسون ثور
🔥聚焦
NVIDIA Jetson Thor发布,物理AI算力飙升 : أطلقت NVIDIA معالج Jetson Thor، المصمم خصيصًا للذكاء الاصطناعي الفيزيائي والروبوتات البشرية، والذي يضم وحدة معالجة رسومات Blackwell GPU ووحدة معالجة مركزية Arm Neoverse بـ 14 نواة. تصل ذروة قوة الحوسبة للذكاء الاصطناعي فيه إلى 2070 TFLOPS (FP4)، وهو ما يمثل زيادة قدرها 7.5 مرة عن الجيل السابق Jetson Orin. يدعم Jetson Thor نماذج الذكاء الاصطناعي التوليدي مثل VLA وLLM وVLM، ويمكنه معالجة الفيديو في الوقت الفعلي والاستدلال بالذكاء الاصطناعي، بهدف تسريع تطوير الروبوتات العامة والذكاء الاصطناعي الفيزيائي. تشمل تطبيقاته الرئيسية الروبوتات البشرية، والمساعدة الجراحية، والجرارات الذكية، وقد تم اعتماده بالفعل من قبل شركات مثل Agility Robotics، وAmazon، وBoston Dynamics، وUnitree Robotics. تتوفر مجموعة المطورين الآن بسعر يبدأ من 3499 دولارًا أمريكيًا. (المصدر: nvidia)

GEPA:反射式提示进化超越RL : قدمت دراسة جديدة (Agrawal et al., 2025) طريقة GEPA (Genetic-Pareto Prompt Evolution)، التي تطور موجهات نظام LLM من خلال الانعكاس باللغة الطبيعية وتشخيص المسار، بدلاً من الاعتماد على التعلم المعزز (RL). تفوقت GEPA على GRPO في مهام الأسئلة والأجوبة متعددة الخطوات، مع تقليل عدد مرات الـ rollout بمقدار 35 مرة، واستمرت في التفوق على مُحسِّن الموجهات الرائد MIPROv2. يشير هذا إلى أن حلقة التحسين الأصلية للغة أكثر كفاءة في تكييف LLM من الـ rollout الخام في مساحة المعلمات، مما يبشر باتجاه جديد لاستراتيجيات تحسين الذكاء الاصطناعي. (المصدر: Reddit r/MachineLearning)

OPRO方法提升AI安全测试效率 : قدم Bret Kinsella من TELUS Digital طريقة OPRO (Optimization by PROmpting)، التي تسمح لـ LLM بإجراء “اختبار الفريق الأحمر الذاتي” (self-red team testing) لتقييم أمان الذكاء الاصطناعي من خلال تحسين مولدات الهجوم. تركز هذه الطريقة على توزيع معدل نجاح الهجوم (ASR) بدلاً من مجرد النجاح/الفشل، ويمكنها اكتشاف الثغرات الأمنية على نطاق واسع وتقديم إرشادات لإجراءات التخفيف. تؤكد الطريقة على أن اختبار أمان الذكاء الاصطناعي في الصناعات عالية المخاطر مثل المالية والرعاية الصحية يتطلب الشمولية والتكرارية والإبداع، والانتقال من الاستجابة إلى الوقاية، مما يوفر تقييمًا أكثر دقة لأمان الذكاء الاصطناعي للشركات. (المصدر: Reddit r/deeplearning)

🎯动向
DeepSeek V3.1模型出现“极”字Bug : أبلغ المستخدمون عن وجود خطأ في أحدث نموذج DeepSeek V3.1، حيث يقوم بإدراج الحرف الصيني “极” (أو “extreme”) بشكل عشوائي في المخرجات، مما يؤثر على المهام الحساسة للكود والبنية. تم تكرار هذه المشكلة في عمليات النشر الخارجية وواجهة برمجة التطبيقات الرسمية (API)، مما أثار مخاوف في المجتمع بشأن تلوث بيانات النموذج ومشكلات الاستقرار. تشير بعض التكهنات إلى أن المشكلة قد تكون مرتبطة بالخلط بين الـ token أو عدم نظافة بيانات تدريب RLHF، مما يدق ناقوس الخطر لمطوري النماذج ويؤكد على التأثير الحاسم لجودة البيانات على سلوك الذكاء الاصطناعي. (المصدر: teortaxesTex, 36氪, 36氪)

谷歌神秘模型Nano-Banana引发关注 : اكتسب نموذج غامض لتوليد وتحرير الصور يُدعى Nano-Banana شعبية في مجتمع الذكاء الاصطناعي، ويُعتقد أنه منتج من Google. يُظهر النموذج أداءً ممتازًا في تحرير النصوص، ودمج الأنماط، وفهم المشاهد، حيث يمكنه دمج عناصر من صور متعددة مع الحفاظ على اتساق الإضاءة، والمنظور، والتكوين. ومع ذلك، توجد بعض العيوب مثل تشويش عناوين الكتب وتشوه الأصابع، كما أنه يفتقر حاليًا إلى واجهة برمجة تطبيقات (API) رسمية، مما يجعل تجربته غير مستقرة. ظهرت العديد من المواقع المزيفة أيضًا، مما أثار نقاشًا في السوق حول قدرات النموذج الجديد وطرق الحصول عليه. (المصدر: TomLikesRobots, yupp_ai, yupp_ai, 36氪)

微软VibeVoice-1.5B TTS模型开源 : أعلنت Microsoft عن فتح مصدر نموذج VibeVoice-1.5B TTS، الذي يدعم توليد محادثات صوتية معبرة تصل مدتها إلى 90 دقيقة وتضم ما يصل إلى 4 متحدثين مختلفين. يعتمد هذا النموذج على Qwen2.5-1.5B ويستخدم مُحلل كلمات (tokenizer) بمعدل إطارات منخفض جدًا، مما يعزز كفاءة الحوسبة ويدعم اللغتين الصينية والإنجليزية. مع ترخيص MIT، من المتوقع أن يدفع هذا النموذج إلى الأمام توليد محتوى صوتي طويل الأمد مثل البودكاست بواسطة الذكاء الاصطناعي، ويوفر للمبدعين قدرات قوية لإنتاج الصوت متعدد اللغات. (المصدر: _akhaliq, AnthropicAI, ClementDelangue, dotey)

阿里巴巴Wan系列模型新动向 : أعلنت Alibaba AI Model Wan عن إطلاق وشيك لـ WAN 2.2-S2V، وهو نموذج لتحويل الصوت إلى فيديو بجودة سينمائية، مع التركيز على كونه “مدفوعًا بالصوت، قائمًا على الرؤية، ومفتوح المصدر”. في الوقت نفسه، تم دمج نموذج Wan2.2-T2V-A14B الذي تم إصداره سابقًا في تطبيق Anycode، ليصبح النموذج الافتراضي لتحويل النص إلى فيديو. تُظهر هذه السلسلة من التطورات استثمار Alibaba المستمر وابتكارها في مجال الذكاء الاصطناعي متعدد الوسائط، خاصة في توليد الصوت والفيديو. (المصدر: Alibaba_Wan, TomLikesRobots, karminski3)

Jet-Nemotron混合架构LLM提速53.6倍 : أطلق فريق MIT Hanlab عائلة Jet-Nemotron، وهي عائلة من نماذج اللغة ذات البنية الهجينة، والتي حققت زيادة في إنتاجية التوليد تصل إلى 53.6 مرة على وحدات معالجة الرسوميات H100 GPU، مع تجاوز أداء نماذج الانتباه الكامل مفتوحة المصدر الرائدة (SOTA). وقد تحقق ذلك من خلال Post Neural Architecture Search (PostNAS) وكتلة الانتباه الخطي الجديدة JetBlock. يوفر هذا البحث الرائد حلولاً جديدة لكفاءة استدلال LLM وتحسين بنيتها. (المصدر: teortaxesTex, menhguin)

AI Agents在2025年向自主工作流演进 : تتطور AI Agents من مساعدين حواريين إلى سير عمل مستقل قادر على التفكير والتخطيط وتنفيذ المهام. من خلال دمج واجهات برمجة التطبيقات (API) واتخاذ القرارات الآلي، يمكن لـ AI Agents قيادة عمليات معقدة، مثل التوليد التلقائي لسيناريوهات الفيديو، وتجميع مقاطع الفيديو، ونشرها على YouTube، مما يبشر بأن سير العمل المدعوم بالذكاء الاصطناعي سيصبح سائدًا، ويرفع مستوى الأتمتة بشكل كبير. (المصدر: Reddit r/artificial)

AI浏览器安全漏洞警示 : تم الكشف عن وجود ثغرة أمنية خطيرة في متصفح AI Comet التابع لشركة Perplexity، وهي شركة يونيكورن أمريكية للبحث بالذكاء الاصطناعي. يمكن للمهاجمين من خلال تعليمات خبيثة التلاعب بمتصفح AI للوصول إلى البريد الإلكتروني، والحصول على رموز التحقق، وإرسال معلومات حساسة. أشارت شركة Brave إلى أن آليات الأمن السيبراني التقليدية غير فعالة ضد مثل هذه الهجمات، وأن منتجات Agent تواجه مخاطر هائلة بسبب خصائصها “الثلاثية القاتلة”: “الوصول إلى البيانات الخاصة، والتعرض لمحتوى غير موثوق به، والاتصال الخارجي”. هذا ينذر بأنه يجب على منتجات الذكاء الاصطناعي إعطاء الأولوية للأمن وحماية الخصوصية عند ابتكار الوظائف. (المصدر: 36氪)

万亿AI存储鸿沟与Universal Storage架构 : يفرض عصر الذكاء الاصطناعي متطلبات جديدة على التخزين، مثل الإنتاجية القصوى، والكمون المنخفض، والتزامن العالي، والإدارة الموحدة متعددة الوسائط، واستبدال الحوسبة بالتخزين، واستمرارية ذاكرة Agent، والأمان الذاتي. تواجه هياكل التخزين التقليدية صعوبة في التكيف بسبب الاعتماد على نواة نظام التشغيل (OS)، وتخزين البيانات الوصفية والبيانات معًا، وفصل البروتوكولات. تعمل بنية Universal Storage، من خلال الابتكارات مثل مجمع التخزين الموحد، والتخزين المستقل للبيانات الوصفية، والتخلص من الاعتماد على نواة نظام التشغيل، على تحقيق كمون في حدود مئات الميكروثانية وإنتاجية تصل إلى تيرابايت، لتصبح الخيار السائد لطبقة التخزين في عصر الذكاء الاصطناعي، ومن المتوقع أن تسد فجوة أداء التخزين في تطبيقات الذكاء الاصطناعي. (المصدر: 36氪)

Reels短视频上线AI翻译对口型功能 : أطلقت منصة Reels للفيديوهات القصيرة التابعة لـ Meta (Facebook وInstagram) رسميًا ميزة ترجمة الصوت بالذكاء الاصطناعي، والتي تدعم ترجمة صوت الأشخاص في الفيديو إلى لغات مختلفة، مع مزامنة حركة الشفاه وتوليف نبرة الصوت الأصلية. تدعم الميزة حاليًا الترجمة بين الإنجليزية والإسبانية، ويمكن للمستخدمين إضافة ما يصل إلى 20 مسارًا صوتيًا بلغات مختلفة. تهدف هذه الخطوة إلى التكيف مع السوق العالمية والاستحواذ على حصة TikTok، حيث أصبح الذكاء الاصطناعي مفتاح Meta للتميز في مجال الفيديوهات القصيرة، ومن المتوقع أن يعزز تجربة استهلاك المحتوى للمستخدمين حول العالم. (المصدر: 36氪)

AIoT产业趋势与挑战 : تشير ثلاثة تقارير من McKinsey وBVP وMIT إلى أن الاندماج العميق بين الذكاء الاصطناعي وإنترنت الأشياء (AIoT) هو اتجاه سائد، وأن التسويق التجاري يجب أن يركز على السيناريوهات ذات العائد على الاستثمار (ROI) المرتفع، مع التأكيد على التعاون القائم على المنصات والنظم البيئية. ومع ذلك، تكشف التقارير أيضًا عن صراعات بين التطوير الذاتي والشراء، والنمو المتفجر والمرونة المستمرة، وتجربة الواجهة الأمامية والذكاء الخلفي. وتعتبر أن AIoT يحتاج إلى التحول من “ناقل بيانات” إلى “شبكة وكلاء ذكية مستقلة” لتحقيق الاستقلالية والتعاون وإعادة بناء الثقة، لمواجهة التحديات في الترقية الصناعية. (المصدر: 36氪)

字节跳动探索AI硬件生态,涵盖手机、汽车、机器人 : تزيد ByteDance من استثماراتها في مجال الأجهزة، حيث تقوم بدمج أو تطوير منتجات مثل الهواتف المحمولة، والسيارات، والروبوتات، والنظارات الذكية، وأجهزة التعلم، من خلال نموذج Doubao AI الكبير. وبحسب التقارير، تعمل ByteDance على تطوير نظام تشغيل ذكي للسيارات وهاتف Doubao AI، وتسعى لإيجاد وسيلة لتطبيق قدرات الذكاء الاصطناعي. على الرغم من أن محاولات ByteDance السابقة في مجال الأجهزة لم تكن ناجحة، إلا أنها تعود بقوة بعد انفجار نماذج الذكاء الاصطناعي الكبيرة، بهدف بناء نظام بيئي للذكاء الاصطناعي “متكامل الأجهزة والبرامج” لإيجاد نقاط نمو جديدة في عصر الذكاء الاصطناعي. (المصدر: 36氪)

🧰工具
Google AI Mode简化餐厅预订 : يمكن لمشتركي Google AI Ultra الآن استخدام AI Mode لتبسيط حجوزات المطاعم. يحتاج المستخدمون فقط إلى وصف احتياجاتهم باللغة الطبيعية، مثل عشاء عيد ميلاد، عدد الأشخاص، الأجواء، الموسيقى، وما إلى ذلك، وسيقوم AI Mode بإكمال عملية الحجز، ليحتاج المستخدم فقط إلى التأكيد النهائي. يتم إطلاق هذه الميزة حاليًا في الولايات المتحدة، وتهدف إلى تحسين تجربة الخدمة الشخصية وأتمتة عملية الحجز الشاقة. (المصدر: Google)
VSCode终端工具Agent模式新进展 : يعيد فريق VSCode كتابة أداة الطرفية الخاصة به لدعم وضع Agent، بهدف تحسين كفاءة المطورين وتجربتهم. تُعد هذه الخطوة جزءًا من نظام GitHub Copilot البيئي، حيث تهدف إلى تحقيق مساعدة تطوير أكثر ذكاءً من خلال وكلاء الذكاء الاصطناعي، مثل توليد الكود وتصحيح الأخطاء مباشرة في الطرفية، وبالتالي تبسيط سير عمل التطوير. (المصدر: pierceboggan)
OpenRouter推出一键ZDR功能 : أطلقت OpenRouter ميزة “One-click ZDR” (Zero Data Retention)، والتي تضمن إرسال موجهات المستخدمين فقط إلى مقدمي الخدمات الذين يدعمون الاحتفاظ بالبيانات الصفرية. يعزز هذا حماية خصوصية بيانات المستخدمين ويبسط اختيار سياسات بيانات مزودي خدمة الذكاء الاصطناعي، مما يسمح للمستخدمين باستخدام خدمات الذكاء الاصطناعي براحة بال أكبر. (المصدر: xanderatallah)

Qwen Edit在图像Outpainting方面表现出色 : أظهر نموذج Qwen Edit من Alibaba قدرات ممتازة في مهمة Outpainting للصور (توسيع الصور)، حيث يمكنه توسيع محتوى الصورة بجودة عالية، مما يدل على إمكاناته القوية في مجال التوليد البصري. يمكن للمستخدمين استخدام هذه الأداة لتوسيع خلفيات الصور بسهولة أو إنشاء مشاهد أوسع، مما يعزز مرونة إنشاء الصور. (المصدر: multimodalart)

Google NotebookLM支持多语言视频概述 : أطلقت Google NotebookLM ميزة جديدة تدعم ملخصات الفيديو بـ 80 لغة، وتوفر تحكمًا في المدة القصيرة والمدة الافتراضية لملخصات الصوت غير الإنجليزية. يعزز هذا بشكل كبير قدرة المستخدمين متعددي اللغات على الوصول إلى محتوى الفيديو وفهمه، ويتجنب فقدان المعلومات في الترجمة، مما يجعل التعلم والبحث أكثر كفاءة. (المصدر: Google)
GLIF整合SOTA视频、图像和LLM模型 : قامت منصة GLIF بدمج جميع نماذج الفيديو والصور وLLM الرائدة (SOTA)، لتصبح المنصة الوحيدة القادرة على دمج هذه النماذج في سير عمل فريد ومخصص. يمكن للمستخدمين استخدام نماذج مثل Kling 2.1 Pro لتوليد الفيديو، على سبيل المثال، استخدام الإطارات التي تم إنشاؤها بواسطة Qwen-Image لإنشاء رسوم متحركة Veo 3، وتحقيق مشاهد إبداعية، وحتى تحويل الفيديو إلى نمط MSPaint. (المصدر: fabianstelzer, fabianstelzer, fabianstelzer)
LlamaIndex推出Vibe Coding工具 : أطلقت LlamaIndex أداة vibe-llama CLI وقوالب موجهات مفصلة، بهدف تحسين كفاءة ودقة وكلاء البرمجة بالذكاء الاصطناعي (مثل Cursor AI وClaude Code). يمكن لهذه الأداة حقن سياق LlamaIndex مباشرة في وكلاء البرمجة، لتجنب اقتراحات واجهة برمجة التطبيقات القديمة، ويمكنها توليد تطبيقات Streamlit كاملة من نصوص برمجية أساسية، بما في ذلك تحميل الملفات والمعالجة في الوقت الفعلي، وبالتالي تسريع عملية التطوير. (المصدر: jerryjliu0)

LangGraph Platform推出Revision Rollbacks和Queueing : أطلقت LangGraph Platform ميزة Revision Rollbacks (العودة إلى الإصدارات السابقة)، والتي تسمح للمستخدمين بإعادة نشر أي إصدار سابق، مما يسهل تتبع المشكلات وتصحيحها. كما أطلقت ميزة Revision Queueing (قائمة انتظار الإصدارات)، حيث سيتم وضع المراجعات الجديدة في قائمة الانتظار لتنفيذها بعد اكتمال المراجعة السابقة، مما يحسن كفاءة واستقرار سير عمل التطوير، ويوفر بيئة أكثر موثوقية لتطوير Agent. (المصدر: LangChainAI, LangChainAI)
Lemonade框架支持AMD NPU/GPU推理 : Lemonade هو إطار عمل جديد لاستدلال النماذج الكبيرة، يمكن تشغيله على بطاقات رسومات AMD، ووحدات المعالجة المركزية (CPU)، ووحدات المعالجة العصبية (NPU)، ويدعم نماذج GGUF وONNX. تم تطوير هذا الإطار من قبل مهندسي AMD، ولا يعتمد على CUDA، ويوفر حلول استدلال جديدة للذكاء الاصطناعي لمستخدمي أجهزة AMD، ومن المتوقع أن يعزز أداء تطبيقات الذكاء الاصطناعي على منصات AMD. (المصدر: karminski3)

AI驱动的社交应用Intent : أسس Brandon Chen تطبيق Intent، وهو أداة مراسلة فورية أصلية تعتمد على الذكاء الاصطناعي، وتهدف إلى إزالة حواجز التعاون من خلال الذكاء الاصطناعي، وتحويل نوايا المستخدمين بسلاسة إلى نتائج. على سبيل المثال، يمكن للذكاء الاصطناعي دمج صور متعددة تلقائيًا، أو تخطيط رحلة، أو حجز سيارة، أو إنشاء قائمة تسوق مشتركة بناءً على سجل الدردشة. يجمع هذا التطبيق بين وظائف الدردشة وقدرات التنفيذ التلقائي للنماذج الكبيرة، وقد حصل على عشرات الملايين من الدولارات في التمويل، ومن المتوقع أن يغير طريقة التفاعل الاجتماعي. (المصدر: _akhaliq, 36氪)

Karpathy的氛围编程指南2.0 : أصدر Andrej Karpathy دليل “البرمجة المزاجية” المحدّث، مقترحًا هيكلًا ثلاثي الطبقات لبرمجة الذكاء الاصطناعي: Cursor للاستكمال التلقائي والتعديلات الصغيرة؛ Claude Code/Codex لتنفيذ كتل وظيفية أكبر والتطوير السريع للنماذج الأولية؛ GPT-5 Pro لحل أصعب الأخطاء والتجريدات المعقدة. يؤكد على أن برمجة الذكاء الاصطناعي دخلت “عصر ندرة ما بعد الكود”، لكن كود الذكاء الاصطناعي لا يزال يتطلب تنظيفًا يدويًا، وأن الذكاء الاصطناعي لديه قيود في التفسير والتفاعل. (المصدر: 36氪)

DeepSeek V3.1上线W&B Inference : أصبح نموذج DeepSeek V3.1 متاحًا الآن على منصة Weights & Biases Inference، ويوفر وضعين: “Non-Think” (سرعة عالية) و”Think” (تفكير عميق). يبلغ سعره 0.55 دولار / 1.65 دولار لكل مليون token، ويهدف إلى توفير حل فعال من حيث التكلفة لبناء وكلاء أذكياء، مما يسهل على المطورين اختيار وضع الاستدلال المناسب لاحتياجاتهم المختلفة. (المصدر: weights_biases)

📚学习
MAC基准测试评估多模态大模型科学推理能力 : اقترح فريق الأستاذ Wang Dequan من جامعة Shanghai Jiao Tong معيار MAC (Multimodal Academic Cover)، الذي يستخدم أحدث أغلفة المجلات العلمية الرائدة مثل Nature وScience وCell كمواد اختبار، لتقييم قدرة النماذج الكبيرة متعددة الوسائط على فهم الارتباطات العميقة بين العناصر البصرية الفنية والمفاهيم العلمية. أظهرت النتائج أن النماذج الرائدة مثل GPT-5-thinking لديها قيود عند التعامل مع المحتوى العلمي الجديد، حيث بلغت دقة Step-3 79.1% فقط. كما اقترح فريق البحث حل DAD (Describe-and-Deduce)، الذي يحسن أداء النموذج بشكل كبير من خلال التفكير خطوة بخطوة، وقدم آلية ديناميكية مزدوجة لضمان التحدي المستمر، مما يوفر نموذجًا جديدًا لتقييم الفهم العلمي للذكاء الاصطناعي متعدد الوسائط. (المصدر: 36氪)

LLMs作为评估者:有效性和可靠性探讨 : تشكك ورقة بحثية (arxiv:2508.18076) في أن الحماس الحالي لاستخدام نماذج اللغة الكبيرة (LLMs) كمقيِّمين لأنظمة توليد اللغة الطبيعية (NLG) قد يكون سابقًا لأوانه. تستند المقالة إلى نظرية القياس، وتقيّم بشكل نقدي أربع فرضيات أساسية لـ LLMs كوكلاء للحكم البشري، وقدرات التقييم، وقابلية التوسع، وفعالية التكلفة، وتناقش كيف تتحدى القيود المتأصلة في LLMs هذه الفرضيات. وتدعو إلى ممارسات أكثر مسؤولية في تقييم LLMs لضمان دعمها للتقدم في مجال NLG بدلاً من الإضرار به. (المصدر: HuggingFace Daily Papers)
UQ:评估模型在未解决问题上的能力 : UQ (Unsolved Questions) هي منصة اختبار جديدة تحتوي على 500 سؤال صعب ومتنوع وغير محلول من Stack Exchange، وتهدف إلى تقييم قدرات النماذج المتطورة في الاستدلال، والواقعية، والتصفح، وما إلى ذلك. تقوم UQ بتقييم النماذج بشكل غير متزامن من خلال مساعدة المدققين والتحقق من المجتمع، وهدفها هو دفع الذكاء الاصطناعي لحل المشكلات الحقيقية التي لم يحلها البشر بعد، وبالتالي توليد قيمة عملية مباشرة، مما يوفر منظورًا تقييميًا جديدًا لأبحاث الذكاء الاصطناعي. (المصدر: HuggingFace Daily Papers)
ST-Raptor:LLM驱动的半结构化表格问答框架 : ST-Raptor هو إطار عمل قائم على الشجرة، يستخدم نماذج اللغة الكبيرة (LLM) لحل تحديات الأسئلة والأجوبة في الجداول شبه المنظمة. يقدم هذا الإطار شجرة متعامدة هرمية (HO-Tree) لالتقاط تخطيطات الجداول المعقدة، ويحدد عمليات الشجرة الأساسية لتوجيه LLMs لتنفيذ مهام الأسئلة والأجوبة، ويضمن موثوقية الإجابات من خلال آلية تحقق من مرحلتين. على مجموعة بيانات SSTQA الجديدة، تفوق ST-Raptor على تسعة نماذج أساسية بنسبة 20% في دقة الإجابات، مما يوفر حلاً فعالاً لمعالجة بيانات الجداول المعقدة. (المصدر: HuggingFace Daily Papers)
JAX学习指南与TPU集成 : تمت مشاركة دليل تعليمي سهل الاستخدام لـ JAX، يتضمن أمثلة عملية، لمساعدة المطورين على الاستفادة بشكل أفضل من JAX في تطوير نماذج الذكاء الاصطناعي. يُظهر تكامل JAX مع TPU أداءً ممتازًا، وهو سهل التوسع وإعداد التجزئة، ويُعتبر أكثر ملاءمة لمستخدمي PyTorch، بينما توفر واجهة برمجة تطبيقات Flax Linen API مرونة أكبر، مما يوفر طريقة فعالة للحوسبة عالية الأداء للذكاء الاصطناعي. (المصدر: borisdayma, Reddit r/deeplearning)

LlamaIndex文档Agent设计模式 : ستقوم LlamaIndex، في حدث Agentic AI In Action الذي تستضيفه AWS Builder’s Loft، بمشاركة “أنماط تصميم فعالة لبناء وكلاء المستندات”. سيتناول العرض كيفية استخدام LlamaIndex لبناء وكلاء المستندات، وسيقدم حالات عملية وإرشادات تصميم، لمساعدة المطورين على الاستفادة بشكل أفضل من AI Agent في معالجة مهام المستندات، وتحسين مستوى الأتمتة والذكاء في معالجة المستندات. (المصدر: jerryjliu0, jerryjliu0)

DSPy:Python中的自动提示优化 : شاركت مجموعة من الموارد كيفية إجراء تحسين تلقائي وبرمجي للموجهات في Python، خاصة كيفية استخدام إطار عمل DSPy. تشرح هذه البرامج التعليمية بعمق كيفية عمل DSPy، وكيفية معالجة الموجهات بكفاءة لإنشاء برامج ذكاء اصطناعي قوية وقابلة للصيانة، على سبيل المثال، زيادة دقة استخراج البيانات المنظمة من 20% إلى 100%، مما يحسن بشكل كبير كفاءة وفعالية هندسة الموجهات. (المصدر: lateinteraction, lateinteraction)

💼商业
马斯克起诉OpenAI和苹果垄断 : رفعت شركة xAI التابعة لـ Elon Musk دعوى قضائية رسمية ضد OpenAI وApple، متهمة الشركتين بالاحتكار المشترك لسوق الذكاء الاصطناعي من خلال اتفاقيات التعاون، وزاعمة أن متجر تطبيقات Apple App Store يتلاعب بترتيب التطبيقات ويقمع المنافسين مثل Grok. تطالب الدعوى بتعويضات بمليارات الدولارات وتعتبر تعاونهما غير قانوني. تعكس هذه الخطوة المنافسة التجارية المتزايدة في مجال الذكاء الاصطناعي والصراع على الهيمنة على السوق، وقد تعيد تشكيل مشهد صناعة الذكاء الاصطناعي. (المصدر: Reddit r/artificial, Reddit r/ArtificialInteligence, 36氪, 36氪)

90%打工人“自费买AI上班”催生To P赛道 : أظهر تقرير صادر عن MIT أن 90% من العاملين “يستخدمون أدوات الذكاء الاصطناعي الشخصية على نفقتهم الخاصة في العمل”، مما أدى إلى ظهور مسار To P (To Professional). ارتفعت إيرادات مساعدي البرمجة بالذكاء الاصطناعي مثل Cursor من مليون دولار إلى 500 مليون دولار في عام واحد، ووصلت قيمتها إلى ما يقرب من عشرة مليارات دولار. في هذا النموذج، يشتري المستخدمون الذكاء الاصطناعي على نفقتهم الخاصة لتحسين كفاءة العمل، مع عائد استثمار مرتفع للغاية، مما يدفع نمو منتجات الذكاء الاصطناعي بسرعة. مقارنة ببطء دورة To B والتكلفة العالية لـ To C، أصبح نموذج To P نقطة ساخنة خفية لريادة الأعمال في مجال الذكاء الاصطناعي. (المصدر: 36氪)

Meta AI团队人才流失与内部管理问题 : تشهد Meta ظاهرة مغادرة باحثين كبار مثل Rishabh Agarwal والمساهم في PyTorch Bert Maher، مما يثير مخاوف بشأن تسرب المواهب من مختبر الذكاء الاصطناعي الفائق التابع لـ Meta. اشتكى باحثون سابقون من وجود مشكلات إدارية في Meta مثل ضغوط تقييم الأداء، والتنافس على الموارد، والصراعات بين الفصائل القديمة والجديدة، مما يؤدي إلى تسرب المواهب وتدهور الروح المعنوية. يولي كبار الباحثين أهمية أكبر للرؤية والرسالة والاستقلالية، بدلاً من مجرد الرواتب، مما يكشف عن تحديات هيكلية عميقة تواجهها Meta في المنافسة على مواهب الذكاء الاصطناعي. (المصدر: Yuchenj_UW, arohan, 36氪)

🌟社区
AI模型推理能力与真实世界问题 : يناقش المجتمع بحماس ما إذا كانت نماذج اللغة الكبيرة (LLM) تمتلك قدرة “استدلال حقيقية”، حيث يرى البعض أن LLM لا تزال لديها قيود في مهام الاستدلال المعقدة، وأن تحسين أدائها قد ينبع من البيانات وليس من الفهم الحقيقي. يشير الخبراء إلى أن الحكم على الذكاء الاصطناعي العام (AGI) يتطلب رؤية ما إذا كان يمكنه تنفيذ أي برنامج بدون أدوات وإنتاج مخرجات صحيحة. في الوقت نفسه، يشكك البعض في أن أداء GPT-5 Pro في المهام الرياضية قد يكون متأثرًا بتلوث بيانات التدريب، مما يثير نقاشًا عميقًا حول القدرات الجوهرية لنماذج الذكاء الاصطناعي. (المصدر: MillionInt, pmddomingos, pmddomingos, sytelus)
AI编程效率与手搓代码的价值 : يناقش المجتمع بحماس مزايا وعيوب البرمجة بالذكاء الاصطناعي (مثل Vibe Coding) مقابل كتابة الكود يدويًا. يرى البعض أن الذكاء الاصطناعي يمكن أن يحسن الكفاءة بشكل كبير، خاصة لتطوير النماذج الأولية وترجمة اللغات، ولكنه قد يقطع تدفق العمل، كما أن جودة كود الذكاء الاصطناعي متفاوتة ولا تزال تتطلب مراجعة وتعديلًا يدويًا. لا يزال لكتابة الكود يدويًا مزايا في توضيح الأفكار والحفاظ على تدفق العمل، وكلاهما ليس متناقضًا بل هو أفضل مزيج، ويجب على المبرمجين إتقان جميع الأدوات. (المصدر: dotey, gfodor, gfodor, imjaredz, dotey)
AI发展速度与媒体报道偏差 : يناقش المجتمع ما إذا كانت سرعة تطور الذكاء الاصطناعي قد تباطأت، حيث يرى البعض أن وسائل الإعلام التقليدية غالبًا ما تخطئ في الإبلاغ عن تباطؤ تقدم الذكاء الاصطناعي، بينما يشهد مجال نماذج اللغة الكبيرة (LLM) (مثل GPT-4 Turbo إلى GPT-5 Pro) أسرع تقدم. في الوقت نفسه، يرى البعض أن موثوقية الذكاء الاصطناعي في التطبيقات العملية لا تزال غير كافية، وأن استجابة الحكومات للذكاء الاصطناعي بطيئة أيضًا، مما يعكس تصورات وتوقعات مختلفة حول الوضع الحالي لتطور تقنية الذكاء الاصطناعي. (المصدر: Plinz, farguney)

AI对社会经济和就业的影响 : يناقش المجتمع ما إذا كان الذكاء الاصطناعي “قاتلًا” للوظائف أم “خالقًا” لها، ويقترح احتمالًا ثالثًا: أن يصبح “وقودًا صاروخيًا للشركات الناشئة”. يتوقع الخبراء أن الذكاء الاصطناعي سيجلب رعاية صحية وخدمات وتعليمًا أرخص، ويعزز النمو الاقتصادي، ويجعل الشركات الصغيرة أكثر شيوعًا. في الوقت نفسه، تثير فكرة تجاوز ذكاء الذكاء الاصطناعي للبشر نقاشًا حول إعادة كتابة القواعد الاقتصادية واقتصاد الندرة غير الموجودة، مع التأكيد على أهمية أمان الذكاء الاصطناعي والمشاركة الشاملة. (المصدر: Ronald_vanLoon, finbarrtimbers, 36氪)

AI Agent的局限性与风险 : يناقش المجتمع قيود AI Agent في التطبيقات العملية، مثل حذف Claude Agent لقاعدة بيانات عن طريق الخطأ، وضعف Agent في البيئات المعقدة. يرى البعض أن نجاح Agent لا ينبغي أن يعتمد فقط على النماذج الكبيرة، بل على استقرار سلسلة “استدعاء الأداة – تنظيف الحالة – استراتيجية إعادة المحاولة”. في الوقت نفسه، تثير طبيعة “الصندوق الأسود” للذكاء الاصطناعي ومشكلات الأمان مخاوف، على سبيل المثال، يُنظر إلى سلوك الذكاء الاصطناعي المتملق على أنه “نمط مظلم” يهدف إلى التلاعب بالمستخدمين، مما يثير جدلاً أخلاقيًا. (المصدر: QuixiAI, bigeagle_xd, Reddit r/ArtificialInteligence)

AI原生SaaS初创公司的价值 : يناقش المجتمع ما إذا كانت معظم الشركات الناشئة في مجال AI SaaS مجرد طبقات تغليف لـ GPT، مشككًا في قيمتها على المدى الطويل. يرى البعض أن العديد من الأدوات تلاحق الاتجاهات الساخنة بشكل مفرط، وتفتقر إلى القيمة العميقة، ويمكن استبدالها بسهولة بالنماذج الكبيرة مباشرة. تكمن القيمة الحقيقية في بناء منتجات دائمة، وليس مجرد واجهة مستخدم وأتمتة بسيطة، ويدعو رواد الأعمال إلى التركيز على الابتكار الجوهري. (المصدر: Reddit r/ArtificialInteligence)
AI猫片与内容消费心理 : انتشرت “مقاطع فيديو القطط” التي تم إنشاؤها بواسطة الذكاء الاصطناعي بشكل كبير على منصات التواصل الاجتماعي، حيث جذبت كميات هائلة من الزيارات بقصصها المبالغ فيها والدرامية وشخصيات القطط الكرتونية. يعكس هذا النوع من المحتوى منخفض التكلفة وعالي الزيارات والقوي عاطفيًا، نفسية استهلاك المعلومات الحالية التي تتسم بـ “السرعة، المتعة، الغرابة، الشذوذ”. على الرغم من الأسلوب الغريب والآثار الواضحة للذكاء الاصطناعي، إلا أن فضولها نجح في جذب انتباه المستخدمين، مما أثار تقييمات متباينة. يناقش المجتمع الأسباب الكامنة وراء ذلك، مثل انخفاض الحاجز التقني وسهولة معالجة صور القطط بواسطة الذكاء الاصطناعي. (المصدر: 36氪)

💡其他
AI智商超越人类,经济规则即将改写 : في عام 2025، تجاوز متوسط ذكاء الذكاء الاصطناعي 110، متجاوزًا رسميًا البشر العاديين، وبدأ في المشاركة في “عمليات السلسلة الكاملة” للنظام الاقتصادي، بما في ذلك جمع المعلومات، واتخاذ القرارات، والتنفيذ الفعلي. يشير هذا إلى ظهور اقتصاد الذكاء الاصطناعي، والذي قد يجلب اقتصادًا غير مقيد بعرض العمالة وغير ندرة، مما يعزز كفاءة الإنتاج بشكل كبير، ويقلل تكاليف المعاملات، ويقلل من القرارات غير العقلانية. في الوقت نفسه، يؤكد على أن أمان الذكاء الاصطناعي والمشاركة الشاملة هما مهمتان رئيسيتان لمواجهة المستقبل، مما يبشر بأن المجتمع البشري سيشهد الموجة الثالثة الكبرى من الترشيد. (المصدر: 36氪)

全球高被引科学家榜单发布,AI领域专家突出 : تظهر إحصائيات AD Scientific Index 2025 أن Yoshua Bengio، أحد عمالقة التعلم العميق الثلاثة، أصبح أول عالم “الأكثر استشهادًا به في جميع المجالات” عالميًا، حيث تجاوز إجمالي عدد الاستشهادات به 970 ألفًا. احتل Geoffrey Hinton المرتبة الثانية عالميًا، و Kai-Ming He المرتبة الخامسة، ودخل Ilya Sutskever أيضًا قائمة العشرة الأوائل. تعتمد القائمة على إجمالي عدد الاستشهادات وعدد الاستشهادات في السنوات الخمس الماضية، مما يسلط الضوء على التأثير الهائل لعلماء الذكاء الاصطناعي في الأوساط الأكاديمية العالمية، ويعكس التطور المزدهر لأبحاث الذكاء الاصطناعي. (المصدر: 36氪)

马斯克成立新公司“巨硬”,用AI重做微软产品 : أسس Elon Musk شركة جديدة باسم “Macrohard”، تهدف إلى محاكاة منتجات Microsoft الأساسية بالكامل باستخدام برمجيات الذكاء الاصطناعي، على سبيل المثال، إنشاء منتجات بوظائف مطابقة لمجموعة Office بواسطة الذكاء الاصطناعي. ستستخدم الشركة مئات من وكلاء الذكاء الاصطناعي المتخصصين المشتقين من Grok، والذين سيعملون بشكل تعاوني بدعم من قوة الحوسبة، لقلب نموذج الأعمال التقليدي للبرمجيات. تُعتبر هذه الخطوة أحدث تحرك من Musk لإعلان حرب مباشرة على Microsoft في مجال الذكاء الاصطناعي، مما يثير نقاشًا في الصناعة حول الشكل المستقبلي لبرمجيات الذكاء الاصطناعي. (المصدر: 量子位)
