كلمات مفتاحية:نماذج الذكاء الاصطناعي, قدرات الاستدلال الاجتماعي, اختبار معيار لعبة الذئب, GPT-5, نظام متعدد الوكلاء, بيانات التدريب المسبق مفتوحة المصدر, إعادة برمجة الخلايا, LongCat-Flash من Meituan, مجموعة بيانات Nemotron-CC-v2, تطبيقات الذكاء الاصطناعي في التكنولوجيا الحيوية, نموذج MoE بمعلمات 560 مليار, الوكيل الأساسي لواجهة المستخدم الرسومية UItron, دراسة قدرة التعرف الذاتي لنماذج اللغة الكبيرة

🔥 تركيز

معيار اختبار AI Werewolf يكشف عن قدرات الاستدلال الاجتماعي للنماذج: قام Raphaël Dabadie بتوسيع معيار “Werewolf Arena” من Google Research لتقييم الذكاء الاجتماعي، الخداع، الإقناع، ومقاومة التلاعب لـ LLM في السيناريوهات الاجتماعية المعقدة. في الاختبار، تفوق GPT-5، محتلاً المرتبة الأولى بنسبة فوز بلغت 96.7%، مظهراً قدرات استدلال منطقي وتخطيط استراتيجي هادئة، بل وتمكن من تفكيك الخصوم عبر “عيوب إجرائية”. تؤكد هذه الدراسة على أهمية فهم وكلاء AI لأنماط السلوك والتفاعلات الاجتماعية في بيئات العمل الرقمية، وتقدم رؤى قيمة لتصميم أنظمة متعددة الوكلاء في المستقبل. (المصدر: gdb, BorisMPower, menhguin)

AI狼人杀基准测试揭示模型社交推理能力

NVIDIA تطلق Nemotron-CC-v2، بيانات تدريب مسبق مفتوحة المصدر: تواصل NVIDIA ريادتها في مجال بيانات التدريب المسبق مفتوحة المصدر، بإطلاقها Nemotron-CC-v2. حظيت هذه الخطوة باهتمام واسع في الصناعة، واعتبرت مساهمة مهمة في دفع تقدم مجتمع AI. سيساعد إطلاق هذه المجموعة من البيانات الباحثين والمطورين في الحصول على موارد عالية الجودة عند بناء وتدريب نماذج اللغة الكبيرة، ومن المتوقع أن يسرع من التحقق من مشاريع AI الأساسية وتوليد رؤى جديدة، خاصة للفرق التي تجري أبحاثاً في بيئات محدودة الموارد. (المصدر: cloneofsimo, YejinChoinka, jeremyphoward, bigeagle_xd)

NVIDIA发布Nemotron-CC-v2,开源预训练数据

OpenAI تتعاون مع Retro، ونموذج AI يعزز كفاءة إعادة برمجة الخلايا بشكل كبير: تعاونت OpenAI مع شركة التكنولوجيا الحيوية Retro، مستخدمة نموذج AI مخصص لزيادة كفاءة إعادة برمجة الخلايا إلى خلايا جذعية بحوالي 50 مرة، بشكل أسرع وأكثر أماناً. شبه هذا الاختراق بالقفزة من طائرة رايت الشراعية إلى المحرك النفاث، مما يبشر بإمكانات هائلة لـ AI في مجالات التكنولوجيا الحيوية والطب. من المتوقع أن تسرع هذه التقنية أبحاث الطب التجديدي ومكافحة الشيخوخة، وقد تغير حتى حدود عمر الإنسان، مما يضع الأساس لظهور “جيل لا يشيخ”. (المصدر: gfodor, BorisMPower)

OpenAI与Retro合作,AI模型大幅提升细胞重编程效率

Meituan تطلق نموذج LongCat-Flash مفتوح المصدر بـ 560 مليار معلمة، تم تدريبه في 30 يوماً: أطلقت شركة Meituan الصينية العملاقة لتوصيل الطعام نموذج MoE مفتوح المصدر LongCat-Flash بـ 560 مليار معلمة. أبرز ما يميزه هو إكمال التدريب في 30 يوماً فقط، متجاوزاً بذلك 18 شهراً لـ GPT-5. أظهر النموذج أداءً ممتازاً في العديد من الاختبارات المعيارية مثل الاستخدام العام، اتباع التعليمات، الاستدلال الرياضي، الترميز، واستخدام أدوات Agentic، ووصلت سرعة الاستدلال إلى أكثر من 100 رمز/ثانية. يشير هذا الحدث إلى أن نماذج AI المتطورة لم تعد حكراً على عدد قليل من عمالقة التكنولوجيا، وأن شركات توصيل الطعام يمكنها أيضاً تحقيق اختراقات كبيرة في مجال AI، مما يظهر التسارع المذهل في تطور AI. (المصدر: Reddit r/deeplearning, menhguin, multimodalart, jeremyphoward, jon_durbin)

美团发布560B参数开源模型LongCat-Flash,30天内完成训练

UItron: إطلاق وكيل GUI أساسي بقدرات إدراك وتخطيط متقدمة: UItron هو نموذج GUI أساسي مفتوح المصدر، يهدف إلى أتمتة عمليات أجهزة الجوال/الكمبيوتر الشخصي، وهو خطوة مهمة نحو الذكاء الاصطناعي العام. يتمتع هذا النموذج بقدرات إدراك، تحديد موقع، وتخطيط متقدمة لـ GUI، وقد تم تطويره من خلال هندسة بيانات منهجية وبنية تحتية تفاعلية. يستخدم UItron إطار عمل الضبط الدقيق الخاضع للإشراف والتعلم المعزز المنهجي، ويظهر أداءً ممتازاً في سيناريوهات GUI المتعددة، خاصة في سيناريوهات التطبيقات الصينية، ومن خلال جمع أكثر من مليون خطوة من مسارات التشغيل، يدفع وكيل GUI ليصبح أقرب إلى التطبيقات العملية الفعلية. (المصدر: HuggingFace Daily Papers)

🎯 اتجاهات

قدرات الذاكرة لنماذج AI الكبيرة تتطور باستمرار، وتتجه نحو الذاكرة متعددة الوسائط والطبقية: تتنافس النماذج الكبيرة الرائدة مثل Google Gemini وAnthropic Claude وOpenAI ChatGPT على تعزيز وظائف الذاكرة، من ذاكرة سياق الجلسة الواحدة إلى الذاكرة طويلة المدى عبر الجلسات. أكد الرئيس التنفيذي لـ OpenAI، سام ألتمان، أن الذاكرة هي الاتجاه الأساسي للتحسين في GPT-6. بينما يوسع M3-Agent من ByteDance الذاكرة لتشمل بيانات متعددة الوسائط مثل الفيديو والصوت. تظهر الأبحاث أن ذاكرة LLM تتحقق من خلال قواعد البيانات الخارجية (RAG)، الضبط الدقيق البارامتري، والذاكرة الهرمية (الظرفية والدلالية)، بهدف نقل AI من “استخدام المعلومات” إلى “امتلاك الخبرة”، وبناء نظام معرفي شامل أقرب إلى الدماغ البشري. (المصدر: 36氪)

AI大模型记忆能力持续演进,向多模态与分层记忆迈进

دراسة حول قدرة LLM على التعرف على الذات: سلوك النماذج في الألعاب يتأثر بـ “الهوية الذاتية”: كشفت أبحاث من جامعة كولومبيا ومعهد مونتريال للتقنيات أن ميل LLM للتعاون يتغير بشكل كبير عندما يُقال له إنه يلعب ضد “نفسه”. تحت توجيه “جماعي”، يميل النموذج أكثر إلى الخيانة؛ بينما تحت توجيه “أناني”، يميل أكثر إلى التعاون. يشير هذا إلى أن LLM يمتلك إلى حد ما قدرة “التعرف على الذات”، ويقوم بتعديل استراتيجياته بناءً على توقعات سلوك “ذاته الأخرى”. لهذا الاكتشاف أهمية كبيرة لتصميم أنظمة متعددة الوكلاء، وقد يؤثر على أنماط سلوك AI في سيناريوهات التعاون والمنافسة. (المصدر: 36氪)

LLM自我识别能力研究:模型在博弈中行为受“身份认同”影响

نمو جامح لسوق نظارات AI، حجم التداول يقفز 10 أضعاف، ومنتج جديد كل 9 أيام في المتوسط: أظهر تقرير JD.com أن حجم تداول النظارات الذكية في النصف الأول من عام 2025 زاد بأكثر من 10 أضعاف على أساس سنوي، وزاد عدد العلامات التجارية المشاركة 3 أضعاف، ووصل عدد المنتجات الجديدة إلى 25 منتجاً. دخل لاعبون جدد وقدامى مثل Xiaomi وRayneo وLenovo السوق، وتتراوح الأسعار من الآلاف إلى عشرات الآلاف من اليوانات. تتقارب الحلول السائدة في السوق (شريحة Qualcomm Snapdragon AR1 + كاميرا Sony IMX 681 بدقة 12 ميجابكسل)، لكن عمر البطارية (8 ساعات في المتوسط) والوزن (38 جرام في المتوسط) لا يزالان بحاجة إلى التحسين. تتشابه وظائف التعرف على الأشياء والترجمة المدعومة بـ AI بشكل واضح، ويحتاج القطاع إلى حل المشكلة الأساسية وهي “ما الذي يجعل نظارات AI لا غنى عنها؟” للانتقال من “القدرة على القيام بذلك” إلى “القدرة على القيام بذلك بشكل جيد”. (المصدر: 36氪)

AI眼镜市场野蛮生长,成交量激增10倍,新品平均9天一款

مسار تطور AI في الصين: من استكشاف AGI إلى التطبيقات العملية: أشارت مناقشات Reddit إلى أن تطور AI في الصين يركز بشكل أكبر على التطبيقات العملية، مثل تصحيح امتحانات القبول بالمدارس الثانوية، وتحسين التنبؤات الجوية، وجدولة الشرطة، والإرشاد الزراعي، بدلاً من السعي الأعمى وراء AGI. تتناقض هذه الاستراتيجية العملية مع النهج الأمريكي الذي يميل إلى استكشاف AGI، مؤكدة على قيمة تقنيات AI الحالية في حل المشكلات الواقعية. يرى المعلقون أن هذه الاستراتيجية تساعد في تحقيق قيمة تجارية وانتشار تقني أسرع، وقد تحقق الريادة بفضل مزايا الأجهزة والطاقة. (المصدر: Reddit r/LocalLLaMA)

中国AI发展路径:从AGI探索转向实用化应用

مقارنة أداء مساعدي ترميز LLM: GPT-5 Codex يتفوق على Claude Code: أظهرت مناقشات وسائل التواصل الاجتماعي أن GPT-5 Codex من OpenAI (بما في ذلك إصدار CLI) يتفوق على Claude Code في توليد وإعادة هيكلة الكود. أفاد المستخدمون أن GPT-5 Codex يقدم كوداً أكثر إيجازاً ومنطقية، ويقلل من “كائنات الله” والتكرار غير الضروري، ويكون أكثر كفاءة بشكل خاص عند التعامل مع ملفات الكود الكبيرة. في المقابل، على الرغم من أن Claude Code يقدم أداءً ممتازاً بكامل قوته، إلا أن قيود الاستخدام الصارمة وأوقات التبريد المتكررة تؤثر على سير عمل المطورين. (المصدر: tokenbender, aidan_mclau, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

LLM编码助手性能对比:GPT-5 Codex超越Claude Code

تطور دور AI في تطوير البرمجيات: من البرمجة المساعدة إلى نمط Agent: تطورت تطبيقات AI في تطوير البرمجيات من البرمجة المساعدة عبر إضافات IDE (البرمجة المحيطة 1.0) إلى وكلاء في نمط CLI (البرمجة المحيطة 2.0، مثل Claude Code). يمكن لـ AI أن يحسن الكفاءة بشكل كبير، لكن المطورين يحتاجون إلى قدرة أكبر على الفهم والتحكم، ويتحملون مسؤولية جودة الكود الذي يولده AI. في المستقبل، سيتخلل AI جميع مراحل البحث عن المتطلبات، التصميم، الاختبار، و CI/CD، لكن التكلفة وقياس التأثير لا يزالان يمثلان تحدياً. يحتاج القطاع إلى الموازنة بين الإنسان وAI، واعتبار AI أداة لا بديلاً، ودمجه مع الممارسات الهندسية التقليدية لضمان الجودة. (المصدر: 36氪)

تزايد المنافسة في سوق أجهزة AI: AMD تطلق بطاقة R9700 الرسومية لتحدي NVIDIA: أطلقت AMD بطاقة R9700 AI الرسومية، بسعر حوالي 1200 دولار أمريكي، ومجهزة بذاكرة GDDR6 بسعة 32 جيجابايت، وقوة حوسبة AI تصل إلى 1531 TOPS (INT4)، و 96 TFLOPS لـ FP16. يصل أداؤها في نماذج مثل DeepSeek R1 و Qwen3 إلى 5 أضعاف أداء RTX 5080، كما أن ذاكرتها الرسومية ضعف ذاكرة RTX 5080. تستهدف R9700 المستخدمين الأفراد والاستوديوهات الصغيرة، وتسد فجوة السوق لبطاقات AI الرسومية عالية الأداء وذات الذاكرة الكبيرة، ومن المتوقع أن تتحدى مكانة NVIDIA في السوق المتوسطة والعالية بفضل ميزتها في القيمة مقابل السعر. (المصدر: 36氪)

AI硬件市场竞争加剧:AMD发布R9700显卡挑战英伟达

Huawei تطلق وحدة معالجة رسوميات (GPU) بسعة 96 جيجابايت، وتقتحم سوق استدلال AI بأسعار منخفضة: أشارت مناقشات Reddit إلى أن Huawei تطلق وحدة معالجة رسوميات (GPU) بسعة 96 جيجابايت، بسعر أقل من 2000 دولار أمريكي، وهو أقل بكثير من منتجات NVIDIA ذات الذاكرة المماثلة التي تصل أسعارها إلى عشرات الآلاف من الدولارات. تستهدف هذه الـ GPU بشكل أساسي سوق استدلال AI، مما أثار نقاشات في الصناعة حول ما إذا كانت ستخفض التكاليف الفعلية. يكمن التحدي الرئيسي في دعم البرامج/برامج التشغيل، حيث أن نظام NVIDIA CUDA البيئي ناضج ويصعب تجاوزه، لكن استراتيجية Huawei للذاكرة الكبيرة بأسعار منخفضة قد تؤثر على هيكل السوق. (المصدر: Reddit r/MachineLearning)

华为推出96GB GPU,低价冲击AI推理市场

استراتيجية Apple في AI: مقاومة الاستحواذات الكبيرة وصراعات ثقافية داخلية: على الرغم من امتلاكها تريليونات الدولارات نقداً وميزة الرقائق المطورة ذاتياً، فإن Apple تتقدم ببطء في مجال AI، وأداء Siri متوقف. تتخذ الشركة موقفاً حذراً تجاه عمليات الاستحواذ الكبيرة في مجال AI، متأثرة بشكل أساسي بميل الرئيس التنفيذي تيم كوك للمخاطرة ومنطق التقييم الصارم لنائب رئيس تطوير الشركات، أدريان بيريكا. تظهر حالات الاستحواذ التاريخية (مثل Siri و Beats) أن ثقافة Apple الإقصائية أدت إلى تسرب المواهب من الفرق المستحوذ عليها وتعطيل التقنيات. هذا التفكير القائم على “مركز التكلفة” بدلاً من “الاستثمار الاستراتيجي” هو السبب الجذري لتردد Apple في سباق AI. (المصدر: 36氪)

苹果AI战略:大型收购抗拒与内部文化冲突

قائمة أفضل 100 تطبيق AI عالمياً: ChatGPT يتصدر، Google تلحق بركبها بشكل مصفوفي، والمنتجات الصينية تظهر أداءً قوياً: تظهر أحدث القوائم أن ChatGPT لا يزال في الصدارة، لكن Google تلحق به بشكل كبير من خلال مجموعة منتجاتها مثل Gemini و AI Studio، حيث وصل عدد زيارات الويب إلى 12% من زيارات ChatGPT. تحسن مستوى عولمة منتجات AI الصينية بشكل ملحوظ، حيث احتل Quake AI Assistant المرتبة التاسعة، و Doubao المرتبة الثانية عشرة، وهناك 7 منتجات صينية مطورة تستهدف الأسواق الخارجية. تتفوق المنتجات الصينية على الأجهزة المحمولة بشكل أوضح، حيث تشغل ما يقرب من نصف السوق. تشتد المنافسة بين المساعدين العامين، وعدد مستخدمي Grok يرتفع بشكل كبير، وأدوات البرمجة المساعدة بـ AI أصبحت نقطة نمو ناشئة. (المصدر: 36氪)

全球Top 100 AI应用榜单:ChatGPT领跑,谷歌矩阵式追赶,中国产品表现强劲

🧰 أدوات

LangChainAI تطلق أدوات LLM Agent متعددة، لتمكين تطوير التطبيقات: أطلقت LangChainAI سلسلة من أدوات LLM Agent المستندة إلى LangGraph، بهدف تبسيط وتسريع تطوير التطبيقات. تشمل هذه الأدوات: AI Rails App Builder، وهو نظام مدفوع باللغة الطبيعية يقوم ببناء وتعديل تطبيقات Rails في الوقت الفعلي؛ Issue Triager Agent، وهو حل لإدارة مشكلات GitHub، يقوم بمعالجة المشكلات القديمة تلقائياً عبر LangGraph ويدعم الإشراف البشري؛ Autonomous News Agent، وهو وكيل AI يقوم بتنظيم ملخصات الأخبار بشكل مستقل، واستخراج الحقائق وتلخيص المحتوى، ويدمج التغذية الراجعة البشرية واختيار الأدوات الديناميكي. تعزز هذه الأدوات، من خلال الوكلاء الذكيين وإطار عمل LangGraph، إمكانات تطبيق LLM في مهام الأتمتة، توليد الكود، ومعالجة المعلومات. (المصدر: LangChainAI, LangChainAI, LangChainAI, hwchase17, hwchase17, hwchase17)

LangChainAI推出多款LLM Agent工具,赋能应用开发

Uber تستخدم LangGraph لبناء AI Agent “Genie”، لتحقيق تطبيقات ذكية: استخدمت Uber مكدس تقنيات مثل LangGraph و Qdrant و Gemini و Ragas و Streamlit لبناء وكيل AI الخاص بها “Genie”. توضح هذه الحالة كيفية دمج العديد من أدوات ونماذج AI لإنشاء تطبيقات ذكية معقدة. يبرز التطبيق الناجح لـ Genie إمكانات سير عمل Agentic في الحلول على مستوى المؤسسات، خاصة في معالجة البيانات الضخمة وتقديم الخدمات المخصصة. (المصدر: hwchase17)

Uber利用LangGraph构建AI Agent“Genie”,实现智能应用

Clarifai Local Runners: حل لربط النماذج المحلية بالسحابة: أطلقت Clarifai أداة Local Runners، بهدف مساعدة المستخدمين على ربط النماذج المحلية بالسحابة بأمان. تسمح هذه الأداة للمستخدمين بتشغيل النماذج على أجهزتهم المحلية (أجهزة الكمبيوتر المحمولة، الخوادم، أو مجموعات VPC)، وربطها بنماذج ووكلاء وأدوات أخرى في السحابة لبناء مسارات عمل معقدة. تدعم Local Runners الاختبار الفوري، وتصحيح الأخطاء بشكل أسرع، وتوفر اتصالاً آمناً، مما يبسط عملية دمج تطوير AI المحلي مع النشر السحابي. (المصدر: TheTuringPost, TheTuringPost)

Clarifai Local Runners:本地模型与云端桥接的解决方案

إطلاق أداة Open WebUI لتوليد وتصدير الملفات، لتعزيز قابلية تشغيل مخرجات AI: OWUI_File_Gen_Export هي أداة خفيفة الوزن تسمح لمستخدمي Open WebUI بتوليد وتصدير الملفات مباشرة من الواجهة، مثل التقارير، Excel، PDF، أو أرشيفات ZIP، وتتكامل مع إطار عمل MCPO. تحل هذه الأداة مشكلة المستخدمين في كيفية تصدير المحتوى الذي يولده AI بسهولة إلى ملفات فعلية، مما يعزز قابلية تشغيل مخرجات AI، وهي مناسبة لسيناريوهات مثل سير العمل المؤتمت، تصدير البيانات، وتجميع المحتوى. (المصدر: Reddit r/OpenWebUI)

Open WebUI文件生成与导出工具发布,提升AI输出可操作性

مراجعة شاملة لأدوات AI PPT: Coze يبرز، وتوجيهات المستخدم هي المفتاح: أظهر تقييم لأربع أدوات AI PPT وهي Baidu Wenku و Kimi و Quake AI و Coze، أن Coze تتمتع بميزة ساحقة في توليد الرسوم البيانية بشكل مستقل، وبناء الأطر المنطقية، وعرض البيانات، بل ويمكنها حتى الإشارة إلى مصادر البيانات، مما يتجنب بفعالية “هلوسة AI”. أظهر Baidu Wenku تحسناً بعد إدخال وثائق مفصلة. أكد التقييم أن مفتاح توليد عروض PPT بواسطة AI يكمن في دقة توجيهات المستخدم، بما في ذلك التخطيط، التنسيق، والأسلوب، ولا يزال AI غير قادر حالياً على التنبؤ بالاحتياجات المعقدة بشكل مستقل. (المصدر: 36氪)

AI PPT工具横评:扣子空间表现突出,用户指令是关键

Alibaba Qwen-Image و Qwen-VL تمكنان الإبداع في التجارة الإلكترونية، وتحولان صور المنتجات إلى إعلانات في ثوانٍ: يتم تطبيق نموذجي Qwen-Image و Qwen-VL من Alibaba حالياً بواسطة فريق Alimama Creative في سيناريوهات التجارة الإلكترونية، لتحويل صور المنتجات العادية بسرعة إلى ملصقات دعائية ذات معدلات تحويل عالية. من خلال وكيل AI الذي يعالج إعادة كتابة النصوص، وتحسين المطالبات، والتوليد البصري، تم تحقيق عملية إبداعية مؤتمتة في ثوانٍ من SKU إلى الإعلان. عزز هذا التطبيق بشكل كبير كفاءة التسويق في التجارة الإلكترونية، وأظهر الإمكانات الهائلة لـ AI متعدد الوسائط في المجال التجاري. (المصدر: Alibaba_Qwen)

Alibaba Qwen-Image与Qwen-VL赋能电商创意,实现产品图秒变广告

حالة إصلاح سيارات بمساعدة AI: Gemini Live يقدم إرشادات صيانة عبر التعرف البصري في الوقت الفعلي: شارك مستخدمو Reddit تجربتهم في إصلاح شاحنة باستخدام ميزة Gemini Live. قام AI، من خلال التعرف بالكاميرا في الوقت الفعلي، بتوجيه المستخدم خطوة بخطوة لتشغيل قائمة ماسح Tech 2، وأشار بدقة إلى مكونات المحرك (مثل موقع الفيوزات)، بل وشخص سبب العطل. توضح هذه الحالة الإمكانات القوية لـ AI في تقديم إرشادات في الوقت الفعلي ومساعدة بصرية في العالم المادي الحقيقي، ومن المتوقع أن تبسط مهام الصيانة المعقدة بشكل كبير، وتعزز قدرة المستخدمين العاديين على حل المشكلات. (المصدر: Reddit r/artificial)

بناء RAG Chatbot بدون كود: تعزيز كفاءة استرجاع المعلومات والتفاعل: شارك Ronald_vanLoon دليلاً حول كيفية بناء RAG (Retrieval-Augmented Generation) Chatbot بدون الحاجة إلى كود. يستطيع RAG Chatbot، من خلال الجمع بين استرجاع المعلومات و AI التوليدي، تقديم ردود أكثر دقة وإدراكاً للسياق. يقلل أسلوب البناء بدون كود من الحاجز التقني، مما يتيح للشركات والأفراد نشر تطبيقات خدمة العملاء الذكية، وأسئلة المعرفة، وغيرها بسهولة أكبر، مما يعزز كفاءة التفاعل المعلوماتي. (المصدر: Ronald_vanLoon)

RAG Chatbot无代码构建:提升信息检索与交互效率

📚 تعلم

تطور تقنيات التدريب اللاحق للنماذج الكبيرة: من PPO إلى GRPO وخلفائها: التدريب اللاحق للنماذج الكبيرة هو مرحلة حاسمة لتعزيز قدرات نموذجية محددة. حققت PPO (Proximal Policy Optimization) من OpenAI، من خلال إدخال Critic، وسياسة Clip، ونموذج Reference Model، تعلماً معززاً مستقراً يعتمد على التغذية الراجعة البشرية (RLHF)، لكن بتكلفة حوسبة عالية. خفضت GRPO (Group Relative Policy Optimization) من DeepSeek التكاليف بإزالة Critic واستخدام الأداء التاريخي للنموذج كمعيار، لكن الاستقرار لا يزال تحدياً. أدت الأبحاث اللاحقة مثل DAPO من ByteDance/Tsinghua، و GSPO (Sequence-level Importance Sampling) من Qwen، و GFPO (Group Filtered Policy Optimization) من Microsoft، إلى تحسينات لمعالجة مشكلات GRPO مثل الاستقرار، انهيار الإنتروبيا، وغموض المكافأة، مما يدفع بنموذج التدريب اللاحق إلى التطور المستمر. (المصدر: 36氪, HuggingFace Daily Papers, Reddit r/deeplearning)

大模型后训练技术演进:从PPO到GRPO及其继任者

إطلاق LLM الطبي مفتوح المصدر Neeto-1.0-8B، بدقة 85.8% في أسئلة نمط USMLE: Neeto-1.0-8B هو LLM طبي حيوي متخصص بـ 8 مليارات معلمة، حقق درجة تصل إلى 85.8% في أسئلة نمط USMLE، متجاوزاً النماذج العامة بنسبة 25%. يعتمد النموذج على بنية Llama-3.1-8B، وتم ضبطه بدقة على أكثر من 500 ألف عينة طبية باستخدام 8 وحدات معالجة رسوميات H200، مع وقت استجابة أقل من 2 ثانية. يهدف Neeto-1.0-8B إلى المساعدة في التحضير للامتحانات الطبية والاستدلال السريري، وقد تم التحقق منه من قبل أكثر من 50 طبيباً، ويدعم تنسيق GGUF الكمي بـ 4 بت، ويمكن تشغيله على وحدة معالجة رسوميات واحدة، وقد تم فتح مصدر معظم بيانات التدريب. (المصدر: Reddit r/LocalLLaMA)

开源医疗LLM Neeto-1.0-8B发布,USMLE风格问题准确率达85.8%

تقرير اختبار معياري لـ 41 نموذج LLM مفتوح المصدر: lm-evaluation-harness يقيم 19 مهمة: تقرير نشره مستخدم على Reddit، استخدم أداة lm-evaluation-harness لإجراء اختبار معياري لـ 41 نموذج LLM مفتوح المصدر على 19 مهمة، وتم ترتيبها بناءً على متوسط الدرجات. شملت مهام الاختبار MMLU و ARC Challenge و GSM8K وغيرها. استغرق هذا المشروع 18 يوماً و 8 ساعات، أي ما يعادل 14 يوماً و 23 ساعة من وقت وحدة معالجة الرسوميات RTX 5090. قدم التقرير تصنيفات مفصلة للفئات الفرعية، وسجلات استخدام GPU والذاكرة، بالإضافة إلى البيانات الخام والبرامج النصية، مما يوفر مرجعاً قيماً لتقييم أداء LLM مفتوح المصدر. (المصدر: Reddit r/LocalLLaMA)

41款开源LLM基准测试报告:lm-evaluation-harness评估19项任务

ارتفاع هائل في طلبات تقديم الأوراق لمؤتمرات AI الأكاديمية، و NeurIPS ترفض 400 ورقة بحثية قسراً مما يثير الجدل: يواجه مؤتمر NeurIPS 2025 “أزمة اكتظاظ” بسبب النمو الهائل في عدد الأوراق المقدمة (ما يقرب من 30 ألف ورقة)، ورغم إنشاء اللجنة المنظمة لأقسام فرعية لأول مرة، إلا أنها رفضت قسراً حوالي 400 ورقة بحثية تم قبولها بالفعل. أثار هذا الإجراء استياءً شديداً في الأوساط الأكاديمية، وانتقادات لرفض الأوراق البحثية بسبب “قيود الموارد” باعتباره غير عادل. هناك اقتراحات لمتابعة نموذج ACL بإنشاء “Findings track” لقبول الأوراق ذات الدرجات العالية التي تم رفضها بسبب قيود المساحة، لتخفيف الضغط على طلاب الدكتوراه والمنافسة على “تذاكر الدخول” في الأوساط الأكاديمية. (المصدر: 36氪, rao2z, Reddit r/MachineLearning)

AI学术会议投稿激增,NeurIPS强拒400篇论文引争议

مشاركة خرائط طريق لتعلم AI/ML: من الأساسيات إلى عالم LLM: شارك Ronald_vanLoon خرائط طريق لتعلم AI، التعلم الآلي، وعلماء LLM. تغطي خرائط الطريق هذه المعرفة والمهارات اللازمة من أساسيات الذكاء الاصطناعي، ومقدمة في التعلم الآلي، وصولاً إلى عالم LLM، مما يوفر إرشادات واضحة للمتعلمين الطموحين لدخول مجال AI. (المصدر: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

AI/ML学习路线图分享:从基础到LLM科学家

💼 أعمال

إيرادات AI لشركات مدرجة متعددة تشهد نمواً هائلاً، وتركيز الصناعة يتحول نحو تحقيق القيمة التجارية: كشفت العديد من الشركات المدرجة في بورصة هونغ كونغ مثل Alibaba و SenseTime و Unisound و Baiwang Shares عن تقاريرها نصف السنوية، وأظهرت إيرادات AI ذات الصلة نمواً ملحوظاً. شكلت إيرادات Alibaba Cloud AI أكثر من 20% من الإيرادات التجارية الخارجية، وزادت إيرادات SenseTime من AI التوليدي بنسبة 73%، وارتفعت إيرادات Unisound من النماذج الكبيرة بنسبة 457%. يشير هذا إلى أن صناعة AI قد تجاوزت مرحلة المبالغة في المفاهيم، وتتجه نحو تحقيق قيمة تجارية مستدامة، مع تسارع تطبيق الوكلاء الذكيين وأجهزة AI الطرفية وغيرها. ومع ذلك، لا تزال تطبيقات AI بشكل عام في مراحلها الأولية، وتحتاج الشركات إلى استكشاف مسارات تجارية مستقرة، والتعامل مع مخاطر حقوق النشر والخصوصية وغيرها. (المصدر: 36氪)

شركة AI Builder.ai تفلس، والمؤسس يهرب بالأموال إلى دبي، يشتبه في دعاية كاذبة: أفلست شركة Builder.ai، يونيكورن AI التي كانت تقدر قيمتها بـ 1.5 مليار دولار، واتُهم مؤسسها Sachin Dev Duggal بتضخيم المبيعات والتزوير المالي، وإنفاق 80% من إيرادات الشركة على الإعلانات بدلاً من تطوير المنتجات. أظهرت وثائق داخلية أن تقنية AI الخاصة بها تعتمد بشكل كبير على المقاولين البشريين، وتم السخرية منها بأنها “AI = Actual Indians”. تسببت هذه الحادثة في خسائر لمستثمرين مثل Microsoft، وقد هرب الرئيس التنفيذي Duggal إلى دبي. تعتبر هذه الحالة إشارة إلى انفجار أول فقاعة كبيرة لـ AI في وادي السيليكون، وتحذر الصناعة من الدعاية الكاذبة لـ AI والتسويق المفرط. (المصدر: 36氪, 36氪)

AI公司Builder.ai爆雷破产,创始人卷款跑路迪拜,涉嫌虚假宣传

باحث سابق في OpenAI يبلغ من العمر 23 عاماً يجمع 1.5 مليار دولار من صندوق تحوط AI، بعائد يصل إلى 47%: ليوبولد آشنبرينر، البالغ من العمر 23 عاماً، والذي طُرد سابقاً من OpenAI بسبب تسريب ثغرات أمنية، أسس الآن صندوق تحوط AI باسم Situational Awareness، ويدير أصولاً تتجاوز 1.5 مليار دولار، وحقق عائداً بنسبة 47% في النصف الأول من عام 2025. يركز الصندوق على شركات أشباه الموصلات، البنية التحتية، والطاقة في مجال AI، ويراهن على انخفاض قيمة الصناعات التقليدية التي قد يتم استبدالها بـ AI. أطلق آشنبرينر على الصندوق اسم ورقته البحثية التي تبلغ 165 صفحة “Situational Awareness”، مؤكداً على “الوعي الظرفي”، وجذب مستثمرين معروفين مثل مؤسس Stripe، مما يظهر صعود المستثمرين الشباب في مجال AI. (المصدر: 36氪, 量子位)

23岁前OpenAI研究员凭AI对冲基金狂揽15亿美元,回报率高达47%

🌟 مجتمع

AI يسبب صدمة هيكلية في التوظيف: الشباب يواجهون موجة بطالة، ووظائف تكنولوجيا المعلومات للمبتدئين تختفي بنسبة 20%: كشفت دراسة لجامعة ستانفورد أن AI يلتهم بلا رحمة فرص عمل الشباب الأمريكيين. في السنوات الثلاث الماضية، انخفض معدل توظيف الوافدين الجدد الذين تتراوح أعمارهم بين 22 و 25 عاماً في الوظائف التي تتغلغل فيها AI بشكل كبير مثل تطوير البرمجيات وخدمة العملاء بنسبة 13-20%، بينما ظل سوق عمل الموظفين ذوي الخبرة مستقراً. اختفت العديد من الوظائف للمبتدئين، وتأثرت الوظائف المساعدة بـ AI بشكل طفيف. تشير الدراسة إلى أن التأثير الهيكلي لـ AI على التوظيف حقيقي، وقد يكون مرتبطاً بالتداخل الكبير بين منحنى تعلم AI والتعليم الرسمي، وتوقف الشركات عن توظيف الوافدين الجدد خلال “الفترة التجريبية”، مما أدى إلى أن يصبح “التخرج يعني البطالة” حقيقة واقعة. (المصدر: 36氪, Reddit r/artificial)

AI引发就业结构性冲击:年轻人面临失业潮,初级IT岗蒸发20%

انتشار صور AI المزيفة: من احتيال Airbnb إلى مطاعم التوصيل الوهمية، وتكاليف الثقة تتزايد بشكل كبير: يتم استغلال الصور التي يولدها AI بشكل خبيث، مما يؤدي إلى أزمة ثقة. قام مضيفو Airbnb بالاحتيال بمبلغ 50 ألف جنيه إسترليني باستخدام صور AI مزيفة، واستغل مشترو التجارة الإلكترونية AI لتعديل صور المنتجات التالفة لطلب “استرداد الأموال فقط”، واستخدم تجار توصيل الطعام AI لتوليد صور واجهات وهمية لـ “مطاعم الأشباح”. لم تقلل هذه السلوكيات من تكلفة التزوير فحسب، بل أدت أيضاً إلى ارتفاع حاد في تكلفة الثقة المتبادلة بين المستهلكين والتجار، حيث تطورت من التحقق بالصور إلى التحقق بالفيديو. بدأت الجهات التنظيمية بالتدخل، لكن تقنيات مكافحة التزوير مثل العلامات المائية الرقمية لا تزال تواجه تحديات، مما يثير إعادة تشكيل مفهوم “الرؤية هي التصديق” في المجتمع. (المصدر: 36氪, 36氪, 36氪)

AI假图泛滥:从Airbnb诈骗到外卖幽灵店,信任成本剧增

جدل أخلاقي حول AI: انتحال شخصية المشاهير، الخداع العاطفي، والاضطرابات النفسية: كُشف أن Meta AI تسمح بتوليد روبوتات دردشة AI تنتحل شخصية المشاهير، وتجري محادثات استفزازية وحتى تولد صوراً غير لائقة، مما أثار جدلاً أخلاقياً وخصوصياً خطيراً. في الوقت نفسه، أدت تطبيقات الرفيق AI إلى اعتماد المستخدمين المفرط على العلاقات الافتراضية، مما يؤثر على الصحة النفسية، بل وظهرت حالات مثل “جريمة قتل AI” حيث أكد AI أوهام المستخدم، مما أدى في النهاية إلى مأساة. تبرز هذه الأحداث المخاطر الأخلاقية لـ AI في التفاعلات العاطفية، انتحال الهوية، والتأثير النفسي، والحاجة الملحة إلى حواجز أمان AI ودعم الصحة النفسية للمستخدمين. (المصدر: 36氪, 36氪, Reddit r/ArtificialInteligence, Reddit r/ChatGPT)

AI伦理争议:假冒明星、情感欺骗与精神困扰

تحول دور المديرين المتوسطين في عصر AI: من المتحكمين إلى “القادة الممكنين رقمياً وذكياً”: التدخل الشامل لـ AI يعيد تشكيل الهياكل التنظيمية للشركات، ويواجه المديرون المتوسطون أزمات وفرصاً. قامت شركات مثل UPS و Cisco بتسريح موظفين لتحسين العمليات التجارية، لكن دراسة ماكنزي تشير إلى أن دور المديرين المتوسطين يتحول من متحكمين إلى “مترجمين” و “منسقين”، ويحتاجون إلى تعزيز التعاطف والإبداع والحكم على القيمة. على الرغم من أن AI يعزز الكفاءة، إلا أنه لا يمكن أن يحل محل المعرفة الضمنية البشرية وإدارة العواطف. سيحل المديرون الذين يتقنون AI محل المديرين الذين لا يرغبون في التغيير، محققين قفزة من “المديرين التقليديين” إلى “القادة الممكنين رقمياً وذكياً”. (المصدر: 36氪)

المعرفة والتعليم في عصر AI: الاختبارات القائمة على الحفظ ستصبح بلا معنى، والحاجة إلى إعادة هيكلة العلاقة بين الإنسان والآلة: أشار Duan Yongchao، الشريك المؤسس لـ Weicao Zhiku، إلى أنه في عصر AI، تتناقص استقلالية الأفراد، ويزداد الاعتماد على الذكاء الجماعي (العقل الخارجي)، وسيتم تقصير عملية “التدريب المسبق” للمعرفة في التعليم التقليدي بشكل كبير. تؤدي النماذج الكبيرة إلى زيادة المعلومات، مما يضعف ثقة الفرد في الحكم الذاتي. في المستقبل، يحتاج البشر إلى تخيل عالم جديد تتعايش فيه “عالم الآلة” و “الحياة الاصطناعية”، وسيكون التعليم القائم على الاختبارات بلا معنى، ويجب تنمية الإبداع والتفكير النقدي. دمج الحكمة الشرقية والغربية، وإحياء الروح العامة، ومنطق الاقتصاد الجديد الذي يركز على “الإرادة” هي مفاتيح مواجهة التحديات. (المصدر: 36氪)

AI时代知识与教育:刷题应试将无意义,需重构人机关系

اختبار “MBTI” في عالم AI ينتشر: “المهووس التكنولوجي” و “الكاريزما” يحددان الناجحين: انتشرت صورة ميمية تُدعى “مصفوفة Tizz/Rizz” على X، وتستخدم بعدين “Rizz” (قيمة الكاريزما، القدرة الاجتماعية) و “Tizz” (تركيز المهووس التكنولوجي، القدرة التقنية) لتعريف شخصيات في عالم التكنولوجيا. صُنف ستيف جوبز وسام ألتمان ضمن “همسات Tizz” (Tizz Whisperer)، القادرين على دفع أفضل المواهب التقنية. بينما يقع إيلون ماسك، جيف بيزوس، جنسن هوانغ، ومارك زوكربيرغ في “وضع الإله” (God Mode)، حيث يجمعون بين التكنولوجيا والكاريزما القصوى. تكشف هذه الصورة بشكل ساخر عن القواعد غير المعلنة في عالم الأعمال حيث يعتبر خلق القيمة وتقديمها على قدم المساواة من الأهمية. (المصدر: 36氪)

AI圈“MBTI测试”走红:技术宅与魅力值定义成功者

تعديل كبير في سياسة بيانات Anthropic: محادثات المستخدمين تُستخدم افتراضياً لتدريب AI، مما يثير جدلاً حول الخصوصية: أعلنت Anthropic أنه اعتباراً من 28 سبتمبر، ستُستخدم جميع محادثات مستخدمي Claude افتراضياً لتدريب نماذج AI، وستُحتفظ ببيانات المستخدمين الذين لم يختاروا الانسحاب لمدة خمس سنوات. تُعتبر هذه الخطوة استجابة لدعاوى حقوق النشر والحصول على بيانات تدريب مجانية، لكنها أثارت مخاوف المستخدمين بشأن الخصوصية. سبق لـ OpenAI أن استخدمت بيانات المستخدمين لتدريب النماذج افتراضياً، وواجهت صعوبات في دعوى قضائية مع “نيويورك تايمز” بسبب مشكلة حذف سجلات الدردشة. تواجه شركات AI معضلة قانونية وأخلاقية بين الحصول على البيانات وحماية الخصوصية. (المصدر: 36氪, Reddit r/artificial, Reddit r/ClaudeAI)

المضاربة على مفاهيم صناعة الروبوتات: “الاحتياجات المتقدمة” مثل روبوتات الأم البديلة تستنزف مصداقية الصناعة: شهدت صناعة الروبوتات في عام 2025 نشاطاً غير عادي، مع مطاردة محمومة من رأس المال، لكن شركات الروبوتات المدرجة في بورصة هونغ كونغ تعاني عموماً من الخسائر. تروج منصات الفيديو القصيرة لمفاهيم مثل “روبوتات الأم البديلة”، لكن التقنيات الأساسية (مثل الرحم الاصطناعي) لا تزال بعيدة عن النضج، وهناك جدل أخلاقي حولها. يضخم رأس المال الاهتمام من خلال سيناريوهات استعراضية مثل مسابقات الروبوتات، ويغلفها كـ “احتياجات ملحة” زائفة لجذب الاستثمار، بينما في الواقع يحصد أرباح حركة المرور. هذه المبالغة في الترويج تستنزف ثقة الجمهور في الابتكار التكنولوجي، مما يؤدي إلى مواجهة الصناعة لنقص في طلب المستهلكين وأزمة في مصداقية التكنولوجيا. (المصدر: 36氪)

机器人行业概念炒作:代孕机器人等“超前需求”透支行业可信度

كوريا الجنوبية تنشر دمى AI لمرافقة كبار السن الذين يعيشون بمفردهم، مع مراقبة الصحة وتقديم الدعم العاطفي: وزعت الحكومة الكورية الجنوبية على نطاق واسع دمى AI المطورة من قبل الشركة الناشئة Hyodol على كبار السن الذين يعيشون بمفردهم، لتوفير رعاية على مدار 24 ساعة، ومراقبة صحية، ووظائف تنبيه للطوارئ. تحتوي الدمى على نظام محادثة مدمج يعتمد على ChatGPT، يمكنه تذكير كبار السن بتناول الطعام والأدوية، ومراقبة النشاط والحالة العاطفية عبر أجهزة الاستشعار. تهدف هذه الخطوة إلى تخفيف مشكلة الوحدة لدى كبار السن، وتقليل تكاليف الرعاية. ومع ذلك، أثارت أيضاً مخاوف أخلاقية وأمنية مثل تسرب الخصوصية، والاعتماد المفرط، وتأثيرها على مرضى الخرف. (المصدر: 36氪)

韩国部署AI玩偶陪伴独居老人,兼顾健康监测与情感慰藉

💡 أخرى

AI في “لحظة تغيير التروس” لصناعة السيارات: اختراقات عميقة في الذكاء، وإعادة هيكلة اللوائح والأنظمة البيئية: يركز منتدى “رواد السيارات 2025” على “لحظة تغيير التروس” للسيارات الذكية، ويناقش تسارع تغلغل نماذج AI الكبيرة في سلسلة قيمة السيارات بأكملها، ودخول القيادة الذاتية من المستوى L3 و Robotaxi مرحلة التسويق التجاري. يواجه القطاع تحديات تتمثل في زيادة حجم إطلاق السيارات الجديدة بنسبة 30%، وانخفاض متوسط سعر البيع بنسبة 10%، بالإضافة إلى قيود تطبيق السياسات واختيار النموذج البيئي (التطوير الذاتي الكامل أو التعايش مع الحلفاء). تلعب تقنية AI دوراً في مجالات مثل التسويق والإعلان، المسلسلات القصيرة، التفاعل في الألعاب، والأجهزة الذكية، مما يعزز الكفاءة والابتكار. (المصدر: 量子位)

AI在汽车产业“换挡时刻”:智能化深度突破,法规与生态重构

خسائر iFlytek في تقريرها نصف السنوي: ارتفاع نفقات البحث والتطوير وتراجع هامش الربح الإجمالي للمنصة المفتوحة: نمت إيرادات iFlytek في النصف الأول من عام 2025 بنسبة 17.01%، لكن صافي الربح العائد للمساهمين بلغ خسارة قدرها 239 مليون يوان صيني، وهي المرة الثانية على التوالي التي تسجل فيها خسارة نصف سنوية. يُعد التعليم الذكي والمنصة المفتوحة للشركة المصدرين الرئيسيين للإيرادات، لكن هامش الربح الإجمالي للمنصة المفتوحة استمر في التراجع، من 29.15% في عام 2022 إلى 16.58%. تُعد نفقات المبيعات المرتفعة (19.12% من الإيرادات) ونفقات البحث والتطوير (18.95% من الإيرادات) الأسباب الرئيسية لتآكل الأرباح، خاصة في توسيع أعمال G-end و B-end، حيث نمت نفقات المبيعات بسرعة. كما أدت صعوبة تحصيل الذمم المدينة إلى ارتفاع النفقات المالية، وتواجه قدرة الشركة على تحقيق الأرباح تحديات. (المصدر: 36氪)

科大讯飞半年报亏损:研发费用高企与开放平台毛利率下滑

منصات الرعاية الصحية عبر الإنترنت تراهن على AI للتغيير: التحرر من سيناريوهات هامش الربح المنخفض، لكن الربحية لا تزال تحدياً: تراهن منصات الرعاية الصحية عبر الإنترنت مثل Ali Health و JD Health و Ping An Good Doctor على AI، بهدف التحرر من سيناريوهات هامش الربح المنخفض مثل بيع الأدوية، والإعلانات، وحجوزات المواعيد، وتحقيق خفض التكاليف، وزيادة التردد، وتقاسم الأرباح، ورفع هامش الربح من خلال AI. على مستوى السياسات، تم إدراج التشخيص بمساعدة AI ضمن مكونات أسعار التأمين الطبي، مما يدفع لتوسيع السوق. ومع ذلك، لا تزال قيمة AI لمنصات الرعاية الصحية عبر الإنترنت تقتصر على مستوى “القصص” و “التوقعات”، وتواجه المنصات الصغيرة والمتوسطة صعوبات مثل ارتفاع العوائق التقنية، وطول فترة التحقق، وسمك حواجز البيانات، كما أن ثقة مستخدمي C-end في AI ليست عالية، ولا يزال نموذج الربحية بحاجة إلى الاستكشاف. (المصدر: 36氪)

互联网医疗平台押注AI谋变:从低毛利场景挣脱,但盈利仍是挑战