كلمات مفتاحية:جيميني 2.5 فلاش, أوبن إيه آي O3, استبدال الوظائف بالذكاء الاصطناعي, التجارية للذكاء الاصطناعي في الرعاية الصحية, نماذج الاستدلال المختلطة, ميزة ميزانية التفكير, قدرات O4-ميني متعددة الوسائط, مساعد الذكاء الاصطناعي للترميز ويندسرف, بوابة المنزل الذكية باستخدام الذكاء الاصطناعي الوكيلي, اختبار معيار الألغاز البصرية, موثوقية توصيات ديب سيك, النموذج المفتوح المصدر لذكاء تشايبو
🔥 أبرز الأخبار
جوجل تطلق نموذج الاستدلال المختلط Gemini 2.5 Flash، مع التركيز على فعالية التكلفة والتفكير القابل للتحكم: أطلقت جوجل نسخة المعاينة من Gemini 2.5 Flash، مُصنّفًا كنموذج استدلال مختلط عالي الفعالية من حيث التكلفة. ميزته الفريدة تكمن في تقديم وظيفة “ميزانية التفكير” (thinking_budget)، التي تسمح للمطورين (0-24 ألف توكن) أو النموذج نفسه بتعديل عمق الاستدلال بناءً على تعقيد المهمة. عند إيقاف التفكير، تكون التكلفة منخفضة للغاية (0.6 دولار/مليون توكن مخرجات)، ويتفوق الأداء على 2.0 Flash؛ عند تشغيل التفكير (3.5 دولار/مليون توكن مخرجات)، يمكنه التعامل مع المهام المعقدة، ويضاهي أداؤه o4-mini في العديد من المعايير (مثل AIME, MMMU, GPQA)، ويحتل مرتبة متقدمة في ساحة LMArena. يهدف هذا النموذج إلى الموازنة بين الأداء والتكلفة وزمن الاستجابة، وهو مناسب بشكل خاص لسيناريوهات التطبيق التي تتطلب المرونة والتحكم في التكاليف، وقد تم توفير واجهة برمجة التطبيقات (API) الخاصة به في Google AI Studio و Vertex AI. (المصدر: 谷歌首款混合推理Gemini 2.5登场,成本暴降600%,思考模式一开,直追o4-mini、谷歌大模型“性价比之王”来了,混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro、op7418、JeffDean、Reddit r/LocalLLaMA、Reddit r/LocalLLaMA、Reddit r/artificial)

OpenAI تطلق نموذجي o3 و o4-mini، معززة قدرات الاستدلال والوسائط المتعددة: أطلقت OpenAI أقوى سلسلة نماذج لها حتى الآن، o3 و o4-mini المحسّن، مع التركيز على تحسين قدرات الاستدلال والبرمجة والفهم متعدد الوسائط. بشكل خاص، تم تحقيق استدلال “سلسلة التفكير” المستند إلى الصور لأول مرة، مما يتيح تحليل تفاصيل الصور لإجراء أحكام معقدة، مثل استنتاج موقع التصوير الدقيق بناءً على صورة (GeoGuessing). سجل نموذج o3 درجة 136 في اختبار منسا للذكاء، محققًا رقمًا قياسيًا جديدًا، وأظهر أداءً متميزًا في اختبارات قياس البرمجة. بينما أظهر o4-mini قدرات قوية في حل المسائل الرياضية (مثل مسائل أويلر) ومعالجة الرؤية، مع الحفاظ على الكفاءة العالية والتكلفة المنخفضة. تم إتاحة هذه النماذج لمستخدمي ChatGPT Plus و Pro و Team، مما يدل على أن OpenAI تدفع النماذج للتطور من اكتساب المعرفة إلى استخدام الأدوات وحل المشكلات المعقدة. (المصدر: 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实、智商136,o3王者归来,变身福尔摩斯“AI查房”,一张图秒定坐标、满血版o3探案神技出圈,OpenAI疯狂暗示:大模型不修仙,要卷搬砖了)

كفاءة الذكاء الاصطناعي تثير مخاوف بشأن الوظائف، وبعض الشركات تبدأ في استبدال الوظائف بالذكاء الاصطناعي: تدفع الكفاءة العالية لتقنية الذكاء الاصطناعي شركات مثل PayPal و Shopify و United Wholesale Mortgage إلى التفكير أو البدء فعليًا في استخدام الذكاء الاصطناعي ليحل محل الوظائف البشرية، خاصة في مجالات خدمة العملاء، والمبيعات للمبتدئين، ودعم تكنولوجيا المعلومات، ومعالجة البيانات. على سبيل المثال، قام روبوت الدردشة بالذكاء الاصطناعي الخاص بـ PayPal بمعالجة 80% من طلبات خدمة العملاء، مما أدى إلى خفض التكاليف بشكل كبير. تستخدم United Wholesale Mortgage الذكاء الاصطناعي لمعالجة مستندات الرهن العقاري، مما أدى إلى زيادة الكفاءة بشكل كبير ومضاعفة حجم الأعمال دون الحاجة إلى زيادة الموظفين. حتى أن بعض الشركات طرحت مفهوم “فرق العمل بدون موظفين”، مطالبة بإثبات عدم قدرة الذكاء الاصطناعي على أداء المهام قبل تعيين موظفين جدد. على الرغم من أن العديد من الشركات تتجنب الاعتراف علنًا بأن تسريح الموظفين يرجع إلى الذكاء الاصطناعي، إلا أن تباطؤ التوظيف وتقليص الوظائف أصبح اتجاهًا، خاصة في ظل ضغوط التكلفة، ومن المتوقع أن يكون تأثير استبدال الذكاء الاصطناعي لوظائف ذوي الياقات البيضاء أكثر وضوحًا في المستقبل. (المصدر: 招聘慢了、岗位少了,AI效率太高迫使人类员工“让位”)

OpenAI تخطط لاستثمار 3 مليارات دولار للاستحواذ على مساعد الترميز بالذكاء الاصطناعي Windsurf، معززةً انتشارها في طبقة التطبيقات: تخطط OpenAI لاستثمار حوالي 3 مليارات دولار للاستحواذ على شركة Windsurf الناشئة في مجال الترميز بالذكاء الاصطناعي (المعروفة سابقًا باسم Codeium)، وسيكون هذا أكبر استحواذ لها. تقدم Windsurf أداة مساعدة للترميز بالذكاء الاصطناعي مشابهة لـ Cursor، وتعتمد أيضًا على نماذج Anthropic. يُنظر إلى هذا الاستحواذ على أنه خطوة رئيسية لـ OpenAI للتوسع في طبقة التطبيقات وتعزيز سيطرتها على النظام البيئي، بهدف الحصول المباشر على المستخدمين وجمع بيانات التدريب والمنافسة مع أدوات مثل GitHub Copilot و Cursor. يعتقد المحللون أنه مع تحسن قدرات الذكاء الاصطناعي، أصبحت “برمجة الأجواء” (Vibe Coding، حيث يندمج الذكاء الاصطناعي بعمق في عملية التطوير) اتجاهًا، وأن السيطرة على مدخل طبقة التطبيقات وبيانات المستخدم أمر بالغ الأهمية للقدرة التنافسية طويلة الأجل لشركات النماذج. تشير هذه الخطوة من OpenAI إلى أن أهدافها الاستراتيجية قد تجاوزت كونها مجرد مزود للنماذج، وتهدف إلى بناء منصة تطوير ذكاء اصطناعي متكاملة. (المصدر: 有了一天涨万星的开源项目 Codex,OpenAI为何仍砸 30 亿美元重金收购 Windsurf ?)

🎯 اتجاهات
ByteDance تطلق نموذج التفكير العميق Doubao 1.5 وتحديثات متعددة الوسائط، مسرعةً تخطيطها لوكلاء الذكاء الاصطناعي (Agent): أطلقت Volcano Engine التابعة لـ ByteDance نموذج التفكير العميق Doubao 1.5، الذي يتمتع بقدرة شبيهة بالبشر على “المشاهدة والتفكير والبحث في نفس الوقت”، ويمكنه التعامل مع المهام المعقدة، ويدعم الإدخال متعدد الوسائط (نص، صور)، ويمتلك قدرات البحث عبر الإنترنت والاستدلال البصري. في الوقت نفسه، أطلقت نموذج تحويل النص إلى صورة Doubao 3.0 (لتحسين تنسيق النص وواقعية الصور) ونسخة مطورة من نموذج الفهم البصري (لتحسين دقة تحديد المواقع وفهم الفيديو). تعتقد ByteDance أن التفكير العميق والوسائط المتعددة هما أساس بناء وكلاء الذكاء الاصطناعي (Agent)، وأطلقت حل OS Agent ومجموعة أدوات الاستدلال السحابية الأصلية للذكاء الاصطناعي، بهدف خفض العوائق والتكاليف أمام الشركات لبناء ونشر تطبيقات الوكلاء. يُنظر إلى هذه الخطوة على أنها إعادة تحديد ByteDance لاستراتيجيتها والتركيز على تطبيقات الوكلاء بعد تأثير المنافسين مثل DeepSeek. (المصدر: 字节按下 AI Agent 加速键、被DeepSeek打蒙的豆包,发起反攻了)

ByteDance و Kuaishou تتواجهان مجددًا في مجال توليد الفيديو بالذكاء الاصطناعي، مع التركيز على أداء النماذج والتطبيق العملي: أطلقت ByteDance نموذج توليد الفيديو Seaweed-7B، مؤكدة على المعلمات المنخفضة (7B) والكفاءة العالية (66.5 مليون ساعة تدريب على H100 GPU) وتكلفة النشر المنخفضة (يمكن لوحدة معالجة رسومات واحدة توليد فيديو بدقة 1280×720). بينما أطلقت Kuaishou نموذج توليد الفيديو “Keling 2.0” ونموذج توليد الصور “Ketu 2.0”، مدعية أن الأداء يتجاوز Veo2 من جوجل و Sora، وأطلقت وظيفة التحرير متعدد الوسائط MVL. يدرك كلا الطرفين أن قدرة النموذج هي الحد الأقصى لمنتجات الذكاء الاصطناعي، وأن التركيز الاستراتيجي لعام 2025 يعود إلى صقل النماذج. على الرغم من اختلاف مسارات التسويق (يميل Jiemeng من ByteDance نحو المستخدمين النهائيين، بينما يركز Keling من Kuaishou على الشركات)، إلا أن كلاهما يركز على تحسين التطبيق العملي، مثل تأكيد Kuaishou على أهمية تحويل الصور إلى فيديو، بينما تستفيد ByteDance من ميزاتها في معالجة النصوص لضمان اتساق السرد في الفيديو، مما يجعل المنافسة تزداد حدة. (المصدر: 字节快手,AI视频“狭路又相逢”)

Zhipu AI تطلق ثلاثة نماذج مفتوحة المصدر، معززةً بناء النظام البيئي مفتوح المصدر: أعلنت Zhipu AI أن عام 2025 سيكون “عام المصدر المفتوح”، وأطلقت ثلاثة نماذج: GLM-Z1-Air (نموذج استدلال)، GLM-Z1-Air (يُعتقد أنه خطأ مطبعي، ربما يشير إلى نسخة سريعة أو أساسية)، GLM-Z1-Rumination (نموذج تأملي)، بأحجام تشمل 9B و 32B، وتستخدم ترخيص MIT. يتفوق أداء GLM-Z1-Air (32B) في بعض اختبارات القياس على DeepSeek-R1، مع انخفاض كبير في سعر الاستدلال. يستكشف النموذج التأملي Z1-Rumination مستويات أعمق من التفكير، ويدعم حلقة البحث المغلقة. في الوقت نفسه، أعلن صندوق Zhipu Z عن تخصيص 300 مليون يوان لدعم مجتمع الذكاء الاصطناعي مفتوح المصدر العالمي، دون التقيد بالمشاريع القائمة على نماذج Zhipu. تتماشى هذه الخطوة مع استراتيجية بكين لبناء “عاصمة المصدر المفتوح العالمية”. (المصدر: 智谱获2亿元新融资,连发3款开源模型,拿3亿元支持全球开源社区)

دمج Agentic AI في بوابات الشبكة المنزلية قد يصبح فرصة جديدة لمشغلي الاتصالات: مع تطور الذكاء الاصطناعي من التوليدي إلى الوكيل (Agentic AI)، أصبحت أنظمة الذكاء الاصطناعي التي تتمتع بقدرات تحديد الأهداف المستقلة وتنفيذ المهام محط التركيز. اقترح مسؤول تنفيذي في MediaTek أن دمج Agentic AI في بوابات الشبكة المنزلية يمكن أن يغير دور مشغلي الاتصالات في سوق إنترنت الأشياء. تعمل البوابة كمركز ذكاء حافة للشبكة المنزلية، وبالاقتران مع Agentic AI، يمكنها إدارة الشبكة بشكل استباقي (مثل تحسين مكالمات الفيديو)، وتشخيص الأعطال، وتعزيز أمن المنزل (مثل التعرف على سرقة الطرود، أو اقتراب الأطفال من مخاطر حمامات السباحة)، وبالتالي تقليل تكاليف خدمة العملاء للمشغلين (يمكن للذكاء الاصطناعي التعامل مع عدد كبير من الاستفسارات المتعلقة بشبكة Wi-Fi) وتقديم خدمات ذات قيمة مضافة. على الرغم من أن نموذج تحقيق الدخل لا يزال قيد الاستكشاف، إلا أن هذا يوفر للمشغلين مسارًا محتملاً لتجاوز دور “القناة” ليصبحوا ممكنين لخدمات Agentic AI. (المصدر: 将Agentic AI嵌入家庭网关,如何改变运营商在物联网市场的游戏规则?)
مايكروسوفت تطلق MAI-DS-R1، بناءً على DeepSeek R1 مع تدريب لاحق للأمان والامتثال: أطلق فريق الذكاء الاصطناعي في مايكروسوفت نموذج MAI-DS-R1، الذي يعتمد على DeepSeek R1 ويخضع لتدريب لاحق، بهدف سد فجوات المعلومات في النموذج الأصلي وتحسين وضعه من حيث المخاطر، مع الحفاظ على قدرات الاستدلال لـ R1. تتضمن بيانات التدريب 110 آلاف عينة أمان وعدم امتثال من Tulu 3 SFT، بالإضافة إلى حوالي 350 ألف عينة متعددة اللغات تم تطويرها داخليًا بواسطة مايكروسوفت، تغطي مواضيع مختلفة تنطوي على تحيز. فسر بعض أعضاء المجتمع هذه الخطوة على أنها جهود من مايكروسوفت لتعزيز أمان النماذج والامتثال، لكنها أثارت أيضًا نقاشات حول ما إذا كانت قد أضافت “رقابة على مستوى المؤسسات”. (المصدر: Reddit r/LocalLLaMA)

🧰 أدوات
OpenAI تفتح مصدر Codex CLI، مساعد ترميز بالذكاء الاصطناعي يعمل من الطرفية: أطلقت OpenAI مشروعًا جديدًا مفتوح المصدر باسم Codex CLI، وهو وكيل ذكاء اصطناعي مُحسّن لمهام الترميز، يمكن تشغيله على الطرفية المحلية للمطور. يستخدم افتراضيًا أحدث نموذج o4-mini، ولكن يمكن للمستخدمين اختيار نماذج OpenAI أخرى عبر واجهة برمجة التطبيقات (API). يهدف Codex CLI إلى توفير طريقة تطوير تعتمد على الدردشة، وفهم وتنفيذ عمليات على مستودعات الأكواد المحلية، مما يشكل منافسة لأدوات مثل Claude Code من Anthropic و Cursor و Windsurf. حصل المشروع على أكثر من 14 ألف نجمة على GitHub في غضون يوم واحد من إطلاقه، مما يدل على اهتمام المطورين بأدوات الترميز بالذكاء الاصطناعي الأصلية للطرفية. (المصدر: 有了一天涨万星的开源项目 Codex,OpenAI为何仍砸 30 亿美元重金收购 Windsurf ?)
تحديث Google AI Studio لدعم إنشاء ومشاركة تطبيقات الذكاء الاصطناعي مباشرة: قامت جوجل بتحديث منصتها AI Studio، مضيفةً ميزة إنشاء تطبيقات الذكاء الاصطناعي مباشرة داخل المنصة. لا يمكن للمستخدمين استخدام نماذج مثل Gemini للتطوير فحسب، بل يمكنهم أيضًا تصفح وتجربة تطبيقات مثال تم إنشاؤها بواسطة مستخدمين آخرين. هذا التحديث يحول AI Studio من ساحة لتجربة النماذج إلى منصة أكثر اكتمالاً لتطوير ومشاركة التطبيقات، مما يقلل من عوائق بناء التطبيقات القائمة على تقنيات الذكاء الاصطناعي من جوجل. (المصدر: op7418)

NVIDIA cuML تطلق وضع تسريع GPU بدون تغيير في الكود: أطلق فريق NVIDIA cuML وضع تسريع جديدًا يسمح للمستخدمين بتشغيل أكواد scikit-learn و umap-learn و hdbscan الأصلية مباشرة على وحدة معالجة الرسومات (GPU) دون تعديل أي كود. يتم تفعيل هذه الميزة عبر python -m cuml.accel your_script.py
أو عن طريق تحميل %load_ext cuml.accel
في Jupyter Notebook. تظهر اختبارات القياس أن خوارزميات مثل Random Forest و Linear Regression و t-SNE و UMAP و HDBSCAN يمكن أن تحصل على تسريع كبير يتراوح بين 25 ضعفًا و 175 ضعفًا. يستفيد هذا الوضع من ذاكرة CUDA الموحدة (UVM)، وعادة لا داعي للقلق بشأن حجم مجموعة البيانات، ولكن أداء مجموعات البيانات ذات الذاكرة الكبيرة جدًا سيتأثر. (المصدر: Reddit r/MachineLearning)

علي بابا تفتح مصدر نموذج الفيديو Wan 2.1 للإطارات الأولى والأخيرة: فتحت شركة علي بابا مصدر نموذج الفيديو الخاص بها Wan 2.1، والذي يركز على توليد محتوى الفيديو الوسيط بناءً على الإطارات الأولى والأخيرة. هذه تقنية محددة لتوليد الفيديو يمكن تطبيقها في سيناريوهات مثل إقحام الإطارات في الفيديو، أو نقل النمط، أو توليد الرسوم المتحركة بناءً على الإطارات الرئيسية. يوفر فتح مصدر هذا النموذج أداة جديدة للباحثين والمطورين لاستكشاف هذه التقنية والاستفادة منها. (المصدر: op7418)
ViTPose: نموذج تقدير وضعية الإنسان يعتمد على Vision Transformer: ViTPose هو نموذج جديد يستخدم بنية Vision Transformer (ViT) لتقدير وضعية الإنسان. يقدم المقال هذا النموذج ويناقش إمكانات ViT في مهام الرؤية الحاسوبية (مثل تقدير وضعية الإنسان هنا). تستفيد هذه النماذج عادةً من آلية الانتباه الذاتي في Transformer لالتقاط الاعتماديات بعيدة المدى بين أجزاء مختلفة من الصورة، مما قد يحسن دقة وقوة تقدير الوضعية. (المصدر: Reddit r/deeplearning)

ClaraVerse: مساعد ذكاء اصطناعي محلي أولاً مع تكامل n8n: ClaraVerse هو مساعد ذكاء اصطناعي محلي أولاً، يعتمد على Ollama، ويركز على الخصوصية والتحكم المحلي. يدمج التحديث الأخير منصة الأتمتة n8n، مما يسمح للمستخدمين ببناء وتشغيل أدوات وسير عمل مخصصة داخل المساعد (مثل التحقق من البريد الإلكتروني، وإدارة التقويم، واستدعاءات API، والاتصال بقواعد البيانات، وما إلى ذلك)، دون الحاجة إلى خدمات خارجية. هذا يمكّن Clara من تشغيل مهام الأتمتة المحلية عبر أوامر اللغة الطبيعية، بهدف توفير حل ذكاء اصطناعي وأتمتة محلي سهل الاستخدام ومنخفض الاعتمادية. (المصدر: Reddit r/LocalLLaMA)

نموذج CSM 1B TTS يحقق معالجة تدفقية في الوقت الفعلي وضبط دقيق: حقق مجتمع المصادر المفتوحة تقدمًا في نموذج تحويل النص إلى كلام (TTS) CSM 1B، حيث تم تحقيق معالجة تدفقية في الوقت الفعلي (real-time streaming) وتطوير قدرات الضبط الدقيق (بما في ذلك LoRA والضبط الدقيق الكامل). هذا يعني أن النموذج يمكنه الآن توليد الكلام بشكل أسرع ويمكن تخصيصه وفقًا لاحتياجات محددة. يوفر مستودع الأكواد عرضًا توضيحيًا للدردشة المحلية، حيث يمكن للمستخدمين تجربته ومقارنته بنماذج TTS الأخرى. (المصدر: Reddit r/LocalLLaMA)

Deebo: استخدام MCP لتصحيح أخطاء تعاون وكلاء الذكاء الاصطناعي: Deebo هو خادم MCP (Machine Collaboration Protocol) تجريبي للوكلاء، يهدف إلى تمكين وكلاء الذكاء الاصطناعي المخصصين للترميز من إسناد مهام تصحيح الأخطاء المعقدة إليه. عندما يواجه الوكيل الرئيسي صعوبة، يمكنه بدء جلسة Deebo عبر MCP. يقوم Deebo بإنشاء عمليات فرعية متعددة لاختبار حلول إصلاح مختلفة بالتوازي في فروع Git مختلفة، ويستخدم LLM للاستدلال. في النهاية، يعيد السجلات واقتراحات الإصلاح والتفسيرات. تستفيد هذه الطريقة من عزل العمليات، وتبسط إدارة التزامن، وتستكشف إمكانيات التعاون بين وكلاء الذكاء الاصطناعي لحل المشكلات. (المصدر: Reddit r/OpenWebUI)

📚 دراسات وأبحاث
جامعة كارنيجي ميلون تطلق معيار VisualPuzzles لتحدي قدرة الذكاء الاصطناعي على الاستدلال المنطقي البحت: أنشأ باحثون في جامعة كارنيجي ميلون (CMU) معيار VisualPuzzles، الذي يحتوي على 1168 لغزًا منطقيًا بصريًا مقتبسًا من امتحانات الخدمة المدنية وغيرها، بهدف فصل قدرات الاستدلال متعدد الوسائط عن الاعتماد على المعرفة بالمجال. وجد الاختبار أنه حتى النماذج الرائدة مثل o1 و Gemini 2.5 Pro، كان أداؤها في مهام الاستدلال المنطقي البحت هذه أقل بكثير من أداء البشر (أعلى نسبة صحة 57.5%، أقل من مستوى أدنى 5% من البشر). أظهرت الدراسة أن زيادة حجم النموذج أو تمكين وضع “التفكير” لا يؤدي دائمًا إلى تحسين قدرة الاستدلال البحت، وأن تقنيات تعزيز الاستدلال الحالية لها تأثيرات متفاوتة. يكشف هذا عن وجود فجوات كبيرة لا تزال قائمة في النماذج الكبيرة الحالية فيما يتعلق بالفهم المكاني والاستدلال المنطقي العميق. (المصدر: 全球顶尖AI来考公,不会推理全翻车,致命缺陷曝光,被倒数5%人类碾压)

InternVL3: استكشاف تقنيات التدريب والاختبار المتقدمة لنماذج الوسائط المتعددة مفتوحة المصدر: تقدم الورقة البحثية “InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models” نموذج InternVL3، الذي سجلت نسخته 78B درجة 72.2 في معيار MMMU، محققة رقمًا قياسيًا جديدًا لنماذج MLLM مفتوحة المصدر. تشمل التقنيات الرئيسية التدريب المسبق الأصلي متعدد الوسائط، وترميز الموضع البصري المتغير (V2PE) الذي يدعم السياق الطويل، وتقنيات ما بعد التدريب المتقدمة (SFT، MPO)، واستراتيجيات التوسع وقت الاختبار (لتعزيز الاستدلال الرياضي). تهدف الدراسة إلى استكشاف طرق فعالة لتعزيز أداء نماذج الوسائط المتعددة مفتوحة المصدر، وقد تم فتح بيانات التدريب وأوزان النموذج. (المصدر: Reddit r/deeplearning)

Geobench: معيار لتقييم قدرة النماذج الكبيرة على تحديد الموقع الجغرافي للصور: Geobench هو موقع ويب جديد لاختبارات القياس، مخصص لقياس قدرة نماذج اللغة الكبيرة (LLM) على استنتاج موقع التصوير بناءً على صور مثل Google Street View، على غرار لعب لعبة GeoGuessr. يقوم بتقييم دقة تخمينات النموذج، بما في ذلك صحة البلد/المنطقة، والمسافة من الموقع الفعلي (المتوسط والوسيط)، ومقاييس أخرى. تظهر النتائج الأولية أن سلسلة نماذج Gemini من جوجل تتفوق في هذه المهمة، ربما بفضل وصولها إلى بيانات Google Street View. (المصدر: Reddit r/LocalLLaMA)
مناقشة الممارسات القياسية لتقسيم مجموعات البيانات: ناقش مجتمع تعلم الآلة على Reddit كيفية التعامل مع مجموعات البيانات (مثل تقسيم train/val/test) في غياب تقسيم قياسي. تشمل الممارسات الشائعة إنشاء تقسيمات عشوائية (ولكن قد يؤثر ذلك على قابلية التكرار)، وحفظ ومشاركة الفهارس/الملفات المحددة، واستخدام التحقق المتقاطع k-fold. أكدت المناقشة أنه بالنسبة لمجموعات البيانات الصغيرة، فإن طريقة التقسيم لها تأثير كبير على تقييم الأداء وتصريحات الحالة الأحدث (SOTA)، ودعت إلى التوحيد القياسي أو مشاركة معلومات التقسيم على نطاق أوسع لتحسين قابلية تكرار البحث وقابليته للمقارنة. تشمل التحديات العملية الافتقار إلى منصة موحدة ومعايير خاصة بالمجال. (المصدر: Reddit r/MachineLearning、Reddit r/MachineLearning)
طلب اقتراحات لتضمين الجمل لتصنيف منشورات Stack Overflow: طلب مستخدم على Reddit اقتراحات حول استخدام تضمينات الجمل (مثل BERT، SBERT) لتصنيف منشورات Stack Overflow (التي تحتوي على عناوين وأوصاف وعلامات وإجابات) بطريقة غير خاضعة للإشراف. الهدف هو تحقيق تصنيف على مستوى الجملة، يتجاوز مجرد علامات تضمين الكلمات البسيطة (مثل “تثبيت الحزمة”)، واستكشاف تجميع أعمق للموضوعات أو أنواع الأسئلة. اقترحت التعليقات البدء باستخدام مكتبة Sentence Transformers، التي يمكنها إنشاء تضمين واحد لمقاطع النص، ثم تطبيق خوارزميات التجميع. (المصدر: Reddit r/MachineLearning)
نصائح حول مسار تعلم الذكاء الاصطناعي والخيارات المهنية: استشار طالب في المدرسة الثانوية على Reddit حول اختيار التخصص الجامعي لدخول مجال هندسة تعلم الآلة (UCSD CS مقابل Cal Poly SLO CS) وما إذا كان بحاجة إلى دراسات عليا. اقترحت التعليقات اختيار UCSD ذات القوة البحثية الأكبر، والنظر في الدراسات العليا، لأن هندسة ML تتطلب عادةً مؤهلات أعلى. في الوقت نفسه، أشار البعض إلى أن المهارات العملية مهمة بنفس القدر، وأن الرياضيات والإحصاء أساسيان أيضًا. في منشور آخر، سأل شخص عن كيفية الاستفادة من الذكاء الاصطناعي أو تطوير تخصص في الذكاء الاصطناعي، ذكرت التعليقات علوم الكمبيوتر (CS) التي تتطلب عادةً درجة الماجستير أو الدكتوراه، وكذلك الرياضيات/الإحصاء، حتى أن البعض اقترح تعلم مهارات عملية مثل السباكة وغيرها من المهن التجارية لتجنب مخاطر استبدال الذكاء الاصطناعي. (المصدر: Reddit r/MachineLearning、Reddit r/ArtificialInteligence)
💼 أعمال
استكشاف تسويق الذكاء الاصطناعي في المجال الطبي: صراع بين استراتيجيات الشركات الكبرى واحتياجات المستشفيات: مع بدء المستشفيات في تخصيص ميزانيات للنماذج الكبيرة (مثل شراء مستشفى الأجهزة الإقليمية في جيانغسو لمنصة تعتمد على DeepSeek بقيمة 4.5 مليون يوان)، يتسارع تسويق الذكاء الاصطناعي في المجال الطبي. وضعت شركات كبرى مثل Huawei و Alibaba و Baidu و Tencent خططًا، وعادة ما تقدم قوة الحوسبة والخدمات السحابية والنماذج الأساسية، وتتعاون مع شركات متخصصة في المجال الطبي. ومع ذلك، لا يزال نموذج العمل الأساسي غير واضح، وتركز الشركات الكبرى حاليًا بشكل أكبر على بيع الأجهزة والخدمات السحابية بدلاً من التعمق مباشرة في تطبيقات الذكاء الاصطناعي الطبية. من جانب المستشفيات، مثل مستشفى 3201 في هانتشونغ بشنشي، فإنها تجرب استخدام نماذج مفتوحة المصدر (مثل نسخة منخفضة المواصفات من DeepSeek) في ظل ميزانية محدودة، مما يظهر اهتمامًا بفعالية التكلفة. لا يزال الحصول على بيانات طبية عالية الجودة وتدريب نماذج متخصصة يمثل تحديًا رئيسيًا، ويتطلب التغلب على “الأعمال الشاقة” مثل توصيف البيانات. (المصدر: AI看病这件事,华为、百度、阿里谁先挣到钱?、科技大厂掀起医疗界的AI革命,谁更有胜算?)

موثوقية أدوات التوصية بالذكاء الاصطناعي مثل DeepSeek موضع تساؤل، وتحسين التسويق بالذكاء الاصطناعي يصبح ساحة معركة جديدة: يستخدم عدد متزايد من المستخدمين أدوات الذكاء الاصطناعي مثل DeepSeek للحصول على توصيات (مثل المطاعم والمنتجات)، وبدأ التجار أيضًا في استخدام “توصية DeepSeek” كعلامة تسويقية. ومع ذلك، تثير موثوقية هذه التوصيات مخاوف. فمن ناحية، قد ينتج الذكاء الاصطناعي “هلوسات”، فيختلق متاجر غير موجودة أو يوصي بمنتجات قديمة. ومن ناحية أخرى، قد تتأثر إجابات الذكاء الاصطناعي بالتأثيرات التجارية، مما يعرضها لخطر إدراج الإعلانات أو “تلوثها” باستراتيجيات SEO/GEO (تحسين محركات البحث التوليدية). يحاول التجار تحسين المحتوى والكلمات المفتاحية للتأثير على مجموعة بيانات الذكاء الاصطناعي ونتائج البحث، بهدف زيادة ظهور علاماتهم التجارية. هذا يضع موضوعية توصيات الذكاء الاصطناعي موضع تحدٍ، ويحتاج المستهلكون إلى الحذر من المعلومات المضللة المحتملة. (المصدر: 第一批用DeepSeek推荐的人,已上当)

Zhipu AI تحصل على استثمار إضافي بقيمة 200 مليون يوان من صندوق بكين الاستثماري لصناعة الذكاء الاصطناعي: بعد الإعلان عن فتح مصدر العديد من النماذج الجديدة وتأسيس صندوق للمصدر المفتوح بقيمة 300 مليون يوان، حصلت Zhipu AI (Z.ai) على استثمار إضافي بقيمة 200 مليون يوان من صندوق بكين الاستثماري لصناعة الذكاء الاصطناعي. كان الصندوق قد استثمر بالفعل في Zhipu العام الماضي. تهدف هذه الزيادة في رأس المال إلى دعم تطوير نماذج Zhipu مفتوحة المصدر وبناء النظام البيئي لمجتمع المصدر المفتوح، وتعكس أيضًا تصميم بكين على دفع تطوير صناعة الذكاء الاصطناعي وبناء “عاصمة المصدر المفتوح العالمية”. (المصدر: 智谱获2亿元新融资,连发3款开源模型,拿3亿元支持全球开源社区)
الرئيس التنفيذي لشركة إنتل بات غيلسنجر يدفع بالإصلاحات ويعين رئيسًا تنفيذيًا جديدًا للتكنولوجيا ورئيسًا للذكاء الاصطناعي: أجرى الرئيس التنفيذي الجديد بات غيلسنجر تعديلات على الهيكل التنظيمي لشركة إنتل، بهدف تبسيط مستويات الإدارة وتعزيز التوجه التكنولوجي. ستقدم أقسام الرقائق الرئيسية (مركز البيانات والذكاء الاصطناعي، رقائق الكمبيوتر الشخصي) تقاريرها مباشرة إلى الرئيس التنفيذي. تم تعيين رئيس رقائق الشبكات Sachin Katti رئيسًا تنفيذيًا جديدًا للتكنولوجيا (CTO) ورئيسًا للذكاء الاصطناعي، ليكون مسؤولاً عن قيادة استراتيجية الذكاء الاصطناعي وخارطة طريق المنتجات ومختبرات إنتل (Intel Labs)، لمواجهة تحديات إنفيديا في مجال الذكاء الاصطناعي. يُنظر إلى هذه الخطوة على أنها جزء من خطة غيلسنجر لإعادة إحياء إنتل، وتهدف إلى حل صعوبات التصنيع والمنتجات، وكسر الحواجز الداخلية، والتركيز على الهندسة والابتكار. (المصدر: 陈立武挥刀高层,英特尔重生计划曝光,技术团队直通华人CEO)

تقارير تفيد بأن Meta تسعى لتقاسم تكاليف تدريب Llama، مما يسلط الضوء على ضغوط استثمار الذكاء الاصطناعي: وفقًا للتقارير، تواصلت Meta مع شركات مثل مايكروسوفت وأمازون و Databricks ومؤسسات استثمارية، مقترحة تقاسم تكاليف تدريب نموذجها مفتوح المصدر Llama (“تحالف Llama”)، مقابل الحصول على بعض النفوذ في تطوير الميزات، لكن ردود الفعل الأولية كانت فاترة. قد تشمل الأسباب عدم رغبة الشركاء المحتملين في الاستثمار في نموذج مجاني، وعدم رغبة Meta في التنازل عن الكثير من السيطرة، ووجود استثمارات كبيرة بالفعل في الذكاء الاصطناعي لدى الشركاء المحتملين. تسلط هذه القضية الضوء على أنه حتى الشركات العملاقة مثل Meta تواجه ضغوطًا بسبب التكاليف المتزايدة لتطوير الذكاء الاصطناعي، خاصة في ظل النفقات الرأسمالية الضخمة (المتوقع أن تزيد سنويًا بنسبة 60% لتصل إلى 60-65 مليار دولار) وعدم وضوح مسار التسويق للنموذج مفتوح المصدر. (المصدر: Llama开源太贵了,Meta被曝向亚马逊、微软“化缘”)

الرئيس التنفيذي لشركة إنفيديا جنسن هوانغ يزور الصين، ربما لمناقشة التعاون مع DeepSeek وغيرهم لمواجهة القيود التجارية: زار الرئيس التنفيذي لشركة إنفيديا جنسن هوانغ الصين مؤخرًا، بدعوة من مجلس الصين لتعزيز التجارة الدولية، والتقى بعملاء من بينهم مؤسس DeepSeek ليانغ وين فنغ. تأتي هذه الزيارة في سياق معقد، يشمل تشديد القيود الحكومية الأمريكية على صادرات رقائق إنفيديا إلى الصين مثل H20، وصعود رقائق الذكاء الاصطناعي المحلية الصينية (مثل Huawei Ascend)، وتقليل تحسينات النماذج مثل DeepSeek للاعتماد المطلق على وحدات معالجة الرسومات المتطورة من إنفيديا. يعتقد المحللون أن هوانغ قد يهدف إلى مناقشة تصميم مشترك لرقائق الذكاء الاصطناعي مع الشركاء الصينيين (مثل DeepSeek) تتوافق مع قيود التصدير الأمريكية وتتجنب في الوقت نفسه الرسوم الجمركية المرتفعة على الواردات الصينية، وذلك من خلال التعاون العميق للحفاظ على حصة السوق والتأثير في الصناعة داخل الصين. (المصدر: 英伟达CEO黄仁勋突然访华,都不穿皮衣了,还见了梁文锋)

🌟 مجتمع
حمى توليد الدمى بالذكاء الاصطناعي تجتاح وسائل التواصل الاجتماعي، وتثير مخاوف بشأن حقوق النشر والأخلاقيات: انتشرت موجة استخدام أدوات الذكاء الاصطناعي مثل ChatGPT لتحويل الصور الشخصية إلى صور دمى (بأسلوب يشبه دمى باربي، مع صندوق تغليف وإكسسوارات شخصية) على منصات مثل LinkedIn و TikTok. يمكن للمستخدمين إنشاءها عن طريق تحميل الصور وتقديم وصف تفصيلي. على الرغم من كونها ممتعة، إلا أنها أثارت مخاوف بشأن حقوق النشر والأخلاقيات: قد يستخدم التوليد بالذكاء الاصطناعي عن غير قصد أنماطًا فنية أو عناصر علامات تجارية محمية بحقوق الطبع والنشر؛ وفي الوقت نفسه، فإن استهلاك الطاقة الكبير اللازم لتدريب وتشغيل نماذج الذكاء الاصطناعي هذه يثير القلق أيضًا. أشارت التعليقات إلى الحاجة إلى وضع حدود وقواعد واضحة عند استخدام الذكاء الاصطناعي. (المصدر: 芭比风AI玩偶席卷全网:ChatGPT几分钟打造你的时尚分身)

تكامل Tencent Yuanbao (مساعد غلاف الهدايا الحمراء سابقًا) العميق مع WeChat يثير الاهتمام: يمكن البحث عن “Yuanbao” داخل WeChat لاستدعاء وظائف الذكاء الاصطناعي مباشرة، وهو في الواقع نسخة مطورة من “مساعد غلاف الهدايا الحمراء Yuanbao” السابق. تظهر تجربة المستخدم أن قدراته قد تحسنت، مثل القدرة على توليد صور أكثر دقة بناءً على الطلبات، وتحسين التوافق الأصلي، والقدرة على توليد بطاقات إجابات. يناقش المقال إمكانية أن تكون خطوة Tencent الكبيرة في مجال الذكاء الاصطناعي ضمن سيناريو WeChat، خاصةً الاستفادة من المداخل الحالية مثل مساعد نقل الملفات، معتبرًا أن ميزة السيناريو هي مفتاح تطبيق الذكاء الاصطناعي لـ Tencent. يذكر أيضًا التحديث الأخير لحسابات WeChat الرسمية، الذي أضاف مدخل نشر من الهاتف المحمول، مما قد يشجع على إنشاء محتوى قصير، ولكنه قد يؤثر على بيئة المحتوى الطويل. (المصدر: 鹅厂的 AI 大招,真的落在微信上)

LMArena تطلق موقع اختبار تجريبي (Beta): أطلقت ساحة منافسة النماذج الكبيرة LMArena موقع اختبار تجريبي جديد (beta.lmarena.ai)، لاختبار نماذج كبيرة مختلفة، بما في ذلك النماذج التي لم يتم إصدارها بعد. يوفر هذا للمجتمع منصة جديدة مستقلة عن واجهة Hugging Face Gradio لتقييم ومقارنة أداء النماذج. (المصدر: karminski3)

الكشف عن مثيلات Ollama على الإنترنت العام يثير مخاوف أمنية: اكتشف مستخدم موقعًا باسم freeollama.com، ومن خلال البحث في فضاء الإنترنت، تم العثور على عدد كبير من الأجهزة التي تكشف منفذ Ollama (أداة لنشر النماذج الكبيرة محليًا، عادةً 11434) على عناوين IP عامة دون تعيين جدار حماية. يشكل هذا خطرًا أمنيًا خطيرًا، وقد يؤدي إلى وصول غير مصرح به وإساءة استخدام النماذج المنشورة محليًا. يتم تذكير المستخدمين بالانتباه إلى تكوين أمان الشبكة عند النشر، وتجنب كشف الخدمات للإنترنت العام دون حماية. (المصدر: karminski3)

استخدام ChatGPT للمساعدة النفسية يثير نقاشات وتحذيرات: شارك مستخدمو Reddit تجاربهم في استخدام ChatGPT للمساعدة في التعامل مع مشكلات مثل الاكتئاب والقلق، ووجدوا أن اقتراحاته قد تفتقر إلى الاتساق، وتبدو وكأنها تؤكد على وجهات نظر المستخدم الحالية بدلاً من تقديم إرشادات موثوقة. عندما تم دحضه بمنطقه الخاص في محادثات مختلفة، اعترف ChatGPT بالخطأ. حذر المستخدمون من أن الذكاء الاصطناعي قد يكون مجرد “متملق رقمي” ولا ينبغي استخدامه للمساعدة العلاجية النفسية الجادة. ناقش قسم التعليقات كيفية استخدام الذكاء الاصطناعي بشكل أكثر فعالية (مثل مطالبته بلعب دور نقدي، وتقديم وجهات نظر متعددة) وقيود الذكاء الاصطناعي في عدم قدرته على استبدال المهنيين البشريين في التدخل في الأزمات. (المصدر: Reddit r/ChatGPT)
قوانين التكنولوجيا الثلاثة لدوغلاس آدامز تثير الصدى: استشهد مستخدم بقوانين التكنولوجيا الثلاثة لكاتب الخيال العلمي دوغلاس آدامز، التي تصف بروح الدعابة ردود الفعل الشائعة للأشخاص من مختلف الفئات العمرية تجاه التكنولوجيا الجديدة: التكنولوجيا الموجودة عند الولادة تعتبر أمرًا طبيعيًا، والتكنولوجيا التي تظهر في سن الشباب تعتبر ثورية، والتكنولوجيا التي تظهر في سن الشيخوخة تعتبر بدعة. أثار هذا التعليق صدى في ظل التطور السريع للذكاء الاصطناعي، مشيرًا إلى أن مدى قبول الناس للتقنيات التخريبية مثل الذكاء الاصطناعي قد يكون مرتبطًا بالمرحلة العمرية التي يمرون بها. (المصدر: dotey)
تجربة المستخدم: ChatGPT يصبح “واقعيًا جدًا” أو “من الجيل Z”: عرض منشور على Reddit لقطة شاشة لمحادثة ChatGPT، وصف المستخدم أسلوب ردها بأنه “واقعي جدًا” أو يحتوي على عامية “الجيل Z” وميمات الإنترنت (مثل “Let me cook”). تباينت ردود الفعل في قسم التعليقات، حيث وجد البعض الأمر ممتعًا، بينما اعتبر البعض الآخر هذا الأسلوب “غير مريح” أو “سطحيًا”. يعكس هذا الاختلافات في تصور المستخدمين لشخصية الذكاء الاصطناعي وأسلوبه اللغوي، والمشكلات المحتملة في التجربة التي قد تنشأ عن تقليد النموذج لاتجاهات لغة الإنترنت. (المصدر: Reddit r/ChatGPT)

توليد الذكاء الاصطناعي للقطات سريعة للحياة المستقبلية يثير نقاشًا إبداعيًا: شارك مستخدم سلسلة من الصور بأسلوب “Snapchat للحياة المستقبلية” تم إنشاؤها باستخدام ChatGPT، تصور مشاهد مثل النوادل الروبوتية، والحيوانات الأليفة بالذكاء الاصطناعي، ووسائل النقل المستقبلية. أثارت هذه الصور الإبداعية نقاشًا في المجتمع حول قدرات توليد الصور بالذكاء الاصطناعي وتصورات الحياة المستقبلية، مع الإشادة بإبداعيتها وواقعيتها المتزايدة. (المصدر: Reddit r/ChatGPT)
مستخدم يشارك استخدام ChatGPT لتحويل الرسومات التخطيطية المرسومة باليد إلى صور واقعية: عرض فنان مستخدم عملية ونتائج استخدام ChatGPT لتحويل رسوماته التخطيطية السريالية المرسومة باليد إلى صور واقعية. أعرب المجتمع عن تقديره لذلك، معتبرين أنها طريقة تجريبية فنية مثيرة للاهتمام يمكن أن تساعد الفنانين على استكشاف الأفكار والأنماط المختلفة، بدلاً من مجرد السعي للحصول على صور “أفضل”. (المصدر: Reddit r/ChatGPT)
💡 أخرى
إعادة التفكير في بناء أنظمة الذكاء الاصطناعي: “الدرس المرير” وأولوية قوة الحوسبة: يستشهد المقال بنظرية “الدرس المرير” لريتشارد ساتون، مشيرًا إلى أنه في تطوير الذكاء الاصطناعي، فإن الأنظمة التي تعتمد على توسيع قدرة الحوسبة العامة (مدفوعة بقوة الحوسبة) ستتفوق في النهاية على الأنظمة التي تعتمد على تصميم بشري متقن لقواعد معقدة. من خلال مقارنة حالات الذكاء الاصطناعي لخدمة العملاء (نظام قائم على القواعد مقابل ذكاء اصطناعي بقدرة حوسبة محدودة مقابل ذكاء اصطناعي استكشافي بقدرة حوسبة كبيرة) ونجاح التعلم المعزز (RL) (مثل أبحاث OpenAI العميقة، Claude)، يؤكد على أنه يجب على الشركات الاستثمار في البنية التحتية للحوسبة بدلاً من الإفراط في تحسين الخوارزميات، ويجب أن يتحول دور المهندسين إلى “بناة مسارات” يبنون بيئات تعلم قابلة للتطوير. الفكرة الأساسية هي: بنية بسيطة + قوة حوسبة واسعة النطاق + تعلم استكشافي > تصميم معقد + قواعد ثابتة. (المصدر: 苦涩的启示:对AI系统构建方式的反思)
استكشاف الروابط بين مجال الذكاء الاصطناعي ومجتمعات العقلانية/الإيثار الفعال: لاحظ ممارس في مجال تعلم الآلة أنه يبدو أن هناك مجتمعين فرعيين في مجال أبحاث الذكاء الاصطناعي يتفاعلان بشكل قليل، أحدهما مرتبط ارتباطًا وثيقًا بمجتمعات العقلانية (Rationalism) والإيثار الفعال (Effective Altruism, EA)، وغالبًا ما ينشر أبحاثًا حول تنبؤات AGI ومشاكل التوافق، ويرتبط ارتباطًا وثيقًا ببعض الشركات الكبرى في منطقة الخليج. يشير المؤلف إلى أن هذا المجتمع يبدو أحيانًا أنه يعيد تعريف مفاهيم علم الإدراك (مثل الوعي السياقي) بشكل مستقل عن النظام الأكاديمي الحالي عند مناقشتها، على سبيل المثال، يركز تعريف Anthropic لـ “الوعي السياقي” على إدراك النموذج لعملية تطويره، بدلاً من التعريف التقليدي في علم الإدراك القائم على النماذج الحسية والبيئية. (المصدر: Reddit r/ArtificialInteligence)
مستخدم يكتشف أن روبوت دردشة بالذكاء الاصطناعي يستخدم اسمه المستعار على منصات أخرى بشكل غير متوقع: أثناء تجربة منصة روبوت دردشة جديدة بالذكاء الاصطناعي، لم يقدم مستخدم أي معلومات شخصية، لكن الروبوت ناداه بدقة باسمه المستعار الذي يستخدمه عادةً على منصات أخرى في الرسالة الثانية. أثار هذا مخاوف المستخدم بشأن خصوصية البيانات وتتبع المعلومات بين المنصات، معربًا عن أسفه لأنه ربما تم “تتبعه” أو “تنميطه”. (المصدر: Reddit r/ArtificialInteligence)
فكرة جديدة لتقييم نماذج الذكاء الاصطناعي: الحكم على الذكاء من خلال عرض شفهي مدته 3 دقائق: اقتراح طريقة جديدة لتقييم ذكاء الذكاء الاصطناعي: جعل نماذج الذكاء الاصطناعي الرائدة (مثل o3 مقابل Gemini 2.5 Pro) تقدم عرضًا شفهيًا مدته 3 دقائق حول موضوع معين (سياسي، اقتصادي، فلسفي، إلخ)، ويقوم الجمهور البشري بالحكم على مستوى ذكائها. يُعتقد أن هذه الطريقة أكثر بديهية من الاعتماد على اختبارات القياس المتخصصة، ويمكنها تقييم تنظيم النموذج وبلاغته وعاطفته وأدائه الفكري بشكل أفضل، خاصة في المهام التي تتطلب الإقناع. قد يصبح هذا الشكل من “مناظرات الذكاء الاصطناعي” أو “مسابقات الخطابة” بُعدًا جديدًا لتقييم قدرات النماذج التي تقترب من AGI. (المصدر: Reddit r/ArtificialInteligence)