كلمات مفتاحية:أوبن إي آي سورا, توليد الفيديو بالذكاء الاصطناعي, نموذج تيناي العودي الصغير, ألعاب الذكاء الاصطناعي, شرائح الذكاء الاصطناعي, إعادة إنتاج فيديو سورا 2, كفاءة استدلال تي آر إم, نمو سوق ألعاب الذكاء الاصطناعي, تعاون إي إم دي وأوبن إي آي في شرائح الذكاء الاصطناعي, النزاعات حول حقوق النشر للمحتوى بالذكاء الاصطناعي

🔥 تركيز

صعود وتحديات تطبيق OpenAI Sora App: حقق تطبيق OpenAI لتوليد الفيديو بالذكاء الاصطناعي Sora شهرة سريعة وتصدر App Store. أثارت قدرته المجانية وغير المحدودة على توليد الفيديو مخاوف واسعة النطاق بشأن تكاليف التشغيل، وانتهاك حقوق الطبع والنشر (خاصة استخدام الملكية الفكرية الحالية وصور المشاهير المتوفين)، وإساءة استخدام تقنية التزييف العميق. أقر Sam Altman بضرورة النظر في نموذج تحقيق الأرباح، ويخطط لتوفير تحكم أكثر دقة في حقوق الطبع والنشر. أثار تأثير التطبيق على منظومة إنشاء المحتوى والإدراك الواقعي نقاشًا حول ما إذا كانت مقاطع فيديو AI ستتجاوز مقاطع الفيديو “الحقيقية”. (المصدر: MIT Technology Review, rowancheung, fabianstelzer, nptacek, paul_cal, BlackHC)

صعود وتحديات تطبيق OpenAI Sora App

سامسونج تطلق Tiny Recursive Model (TRM) لتحدي كفاءة استدلال LLM: أطلقت سامسونج Tiny Recursive Model (TRM)، وهي شبكة عصبية صغيرة تضم 7 ملايين معلمة فقط، وقد أظهرت أداءً ممتازًا في اختبارات ARC-AGI المعيارية، متجاوزة حتى نماذج LLM الكبيرة مثل DeepSeek-R1 و Gemini 2.5 Pro. يعتمد TRM منهجية استدلال تكرارية، حيث يقوم بتحسين الإجابات من خلال عدة “تفكير” داخلي ونقد ذاتي. أثار هذا الاختراق نقاشًا حول “ما إذا كانت النماذج الصغيرة يمكن أن تكون أكثر ذكاءً”، وينبئ بأن الابتكار المعماري قد يكون أكثر أهمية من مجرد حجم النموذج في مهام الاستدلال، مما قد يقلل بشكل كبير من التكلفة الحسابية لاستدلال SOTA. (المصدر: HuggingFace Daily Papers, fchollet, cloneofsimo, ecsquendor, clefourrier, AymericRoucher, ClementDelangue, Dorialexander)

سامسونج تطلق Tiny Recursive Model (TRM) لتحدي كفاءة استدلال LLM

ياو شونيو من جامعة تسينغهوا ينتقل من Anthropic إلى Google DeepMind، واختلاف القيم هو السبب الرئيسي: أعلن ياو شونيو، الحائز على منحة دراسية خاصة من قسم الفيزياء بجامعة تسينغهوا، مغادرته Anthropic للانضمام إلى Google DeepMind كعالم أبحاث أول. أشار إلى أن 40% من أسباب مغادرته تعود إلى “اختلاف جوهري في القيم” مع Anthropic، معتبرًا أن الشركة غير ودودة تجاه الباحثين الصينيين والموظفين ذوي المواقف المحايدة. عمل ياو شونيو في Anthropic لمدة عام، وشارك في بناء نظرية التعلم المعزز وراء سلسلتي Claude 3.7 Sonnet و Claude 4، وذكر أن مجال AI يتطور بسرعة مذهلة، لكن حان الوقت للمضي قدمًا. (المصدر: ZhihuFrontier, 量子位)

ياو شونيو من جامعة تسينغهوا ينتقل من Anthropic إلى Google DeepMind، واختلاف القيم هو السبب الرئيسي

استحواذ Qualcomm على Arduino ينبئ باتجاه جديد للذكاء الاصطناعي المدمج: استحوذت Qualcomm على Arduino، وأطلقت أول لوحة تطوير مشتركة لها، UNO Q، المزودة بمعالج Qualcomm Dragonwing QRB2210، والذي يدمج حلول AI. يشير هذا إلى تطور Arduino من مجال المتحكمات الدقيقة التقليدية منخفضة الطاقة إلى الحوسبة الطرفية ذات الطاقة المتوسطة والقدرات المدمجة للذكاء الاصطناعي. قد يدفع هذا التحرك إلى تطبيق AI على نطاق واسع في إنترنت الأشياء والأجهزة المدمجة، ويوفر للمطورين قوة حوسبة AI أقوى، وينبئ بتغيير جديد في منظومة أجهزة AI المدمجة. (المصدر: karminski3)

استحواذ Qualcomm على Arduino ينبئ باتجاه جديد للذكاء الاصطناعي المدمج

Meta Superintelligence تطلق REFRAG: اختراق جديد في كفاءة RAG: نشرت Meta Superintelligence أول ورقة بحثية لها، REFRAG، مقترحةً طريقة جديدة لـ RAG (الجيل المعزز بالاسترجاع) تهدف إلى تحسين الكفاءة بشكل كبير. تقوم هذه الطريقة بتحويل معظم كتل المستندات المسترجعة إلى “تضمينات كتل” مدمجة وصديقة لـ LLM ليتم استهلاكها مباشرة بواسطة LLM، وتستخدم استراتيجية خفيفة الوزن لتوسيع جزء من تضمينات الكتل إلى رموز كاملة عند الطلب ضمن الميزانية. يقلل هذا بشكل كبير من تكاليف ذاكرة التخزين المؤقت KV والانتباه، ويسرع زمن الوصول لأول بايت والإنتاجية، مع الحفاظ على الدقة، مما يفتح مسارات جديدة لتطبيقات RAG في الوقت الفعلي. (المصدر: Reddit r/deeplearning, Reddit r/LocalLLaMA)

Meta Superintelligence تطلق REFRAG: اختراق جديد في كفاءة RAG

🎯 اتجاهات

xAI تكمل تمويلًا بقيمة 20 مليار دولار، و NVIDIA تستثمر 2 مليار دولار: أكملت شركة xAI التابعة لـ Elon Musk بنجاح تمويلًا بقيمة 20 مليار دولار، بما في ذلك استثمار مباشر بقيمة 2 مليار دولار من NVIDIA. سيتم استخدام هذه الأموال، من خلال كيان ذي غرض خاص (SPV)، لشراء وحدات GPU من NVIDIA لدعم بناء مركز بيانات Memphis Colossus 2. يتميز هيكل التمويل هذا بكونه فريدًا، ويهدف إلى توفير ضمانات الأجهزة لتوسع xAI على نطاق واسع في مجال حوسبة AI، مما يزيد من حدة المنافسة في سوق شرائح AI. (المصدر: scaling01)

xAI تكمل تمويلًا بقيمة 20 مليار دولار، و NVIDIA تستثمر 2 مليار دولار

صعود ألعاب AI في الأسواق الصينية والأمريكية: أصبحت ألعاب AI المزودة بروبوتات الدردشة والمساعدات الصوتية اتجاهًا جديدًا، خاصة في السوق الصينية حيث تشهد نموًا سريعًا، وقد توسعت إلى الأسواق الدولية مثل الولايات المتحدة. تهدف منتجات شركات مثل BubblePal و FoloToy إلى تقليل اعتماد الأطفال على الشاشات. ومع ذلك، أفاد الآباء أن وظائف AI تكون غير مستقرة أحيانًا، مع استجابات طويلة أو تأخر في التعرف على الصوت، مما يؤدي إلى تراجع اهتمام الأطفال. تعمل شركات أمريكية مثل Mattel أيضًا مع OpenAI لتطوير ألعاب AI. (المصدر: MIT Technology Review)

صعود ألعاب AI في الأسواق الصينية والأمريكية

مايكروسوفت تطلق إطار عمل Agent موحد مفتوح المصدر، يدمج AutoGen و Semantic Kernel: أطلقت مايكروسوفت Agent Framework، وهو SDK موحد مفتوح المصدر، يهدف إلى دمج AutoGen و Semantic Kernel، لبناء أنظمة AI متعددة الوكلاء على مستوى المؤسسات. يدعم هذا الإطار من Azure AI Foundry، ويبسط التنسيق وإمكانية المراقبة، ويتوافق مع مختلف واجهات API. يقدم معاينة خاصة لسير عمل الوكلاء المتعددين، وتتبعًا عبر الإطارات من OpenTelemetry، ووظائف وكيل الصوت في الوقت الفعلي من Voice Live API، بالإضافة إلى أدوات AI المسؤولة، بهدف تحسين أمان وكفاءة أنظمة الوكلاء. (المصدر: TheTuringPost)

مايكروسوفت تطلق إطار عمل Agent موحد مفتوح المصدر، يدمج AutoGen و Semantic Kernel

AI21 Labs تطلق Jamba 3B، وأداء النموذج الصغير يتفوق على المنافسين: أطلقت AI21 Labs نموذج Jamba 3B، وهو نموذج MoE يضم 3 مليارات معلمة فقط، ويتميز بأداء ممتاز من حيث الجودة والسرعة، خاصة في معالجة السياقات الطويلة. يحافظ هذا النموذج على سرعة توليد تبلغ حوالي 40 t/s على أجهزة Mac حتى مع سياق يتجاوز 32K، متفوقًا بكثير على Qwen 3 4B و Llama 3.2 3B. يتجاوز Jamba 3B في مؤشر الذكاء Gemma 3 4B و Phi-4 Mini، وتحافظ قدرته على الاستدلال على كمالها في سياق 256K، مما يدل على الإمكانات الهائلة للنماذج الصغيرة في AI الطرفي والنشر على الأجهزة. (المصدر: Reddit r/LocalLLaMA)

AI21 Labs تطلق Jamba 3B، وأداء النموذج الصغير يتفوق على المنافسين

نمو مجتمع HuggingFace السريع، مليون مستودع جديد في 90 يومًا: أضاف مجتمع HuggingFace مليون مستودع جديد من النماذج ومجموعات البيانات و Space repositories في آخر 90 يومًا، بينما استغرق الوصول إلى المليون الأول ست سنوات، مما يعني إنشاء مستودع جديد كل 8 ثوانٍ. يعزى هذا النمو إلى تقنية Xet التي تحقق نقل بيانات أكثر كفاءة، وإلى أن 40% من المستودعات الخاصة تشير إلى اتجاه الشركات الداخلية لاستخدام HuggingFace لمشاركة النماذج والبيانات. يهدف المجتمع إلى الوصول إلى 10 ملايين مستودع، مما ينبئ بتطور مزدهر لمنظومة AI مفتوحة المصدر. (المصدر: Teknium1, reach_vb)

نمو مجتمع HuggingFace السريع، مليون مستودع جديد في 90 يومًا

نموذج OpenAI GPT-5 يظهر قدرات رائدة في البحث العلمي: تجاوز نموذج OpenAI GPT-5 عتبة مهمة، حيث نجح العلماء في استخدامه لإجراء أبحاث أصلية في مجالات مثل الرياضيات والفيزياء وعلم الأحياء وعلوم الكمبيوتر. يشير هذا التقدم إلى أن GPT-5 لا يستطيع الإجابة على الأسئلة فحسب، بل يمكنه أيضًا توجيه وتنفيذ الاستكشافات العلمية المعقدة، مما يسرع بشكل كبير من عملية البحث العلمي. صرح بعض الباحثين أنه بعد إطلاق GPT-5 Thinking و GPT-5 Pro، لم يعد من المنطقي إجراء بحث علمي دون استشارتهما. (المصدر: tokenbender)

Ling-1T: إطلاق نموذج استدلال مفتوح المصدر بمليارات المعلمات: Ling-1T، النموذج الرائد لسلسلة Ling 2.0، يمتلك تريليون معلمة إجمالية، مع حوالي 50 مليار معلمة نشطة لكل token، وتم تدريبه على أكثر من 20 تريليون token كثيف الاستدلال. يحقق هذا النموذج استدلالًا قابلاً للتطوير من خلال منهج Evo-CoT و Linguistics-Unit RL، ويظهر توازنًا قويًا بين الكفاءة والدقة في مهام الاستدلال المعقدة. كما يتمتع بقدرات فهم بصري متقدمة وتوليد كود الواجهة الأمامية، ويمكنه استخدام الأدوات بنسبة نجاح تبلغ حوالي 70%، مما يمثل علامة فارقة جديدة في الذكاء مفتوح المصدر على مستوى التريليونات. (المصدر: scaling01, TheZachMueller)

Ling-1T: إطلاق نموذج استدلال مفتوح المصدر بمليارات المعلمات

Meta Ray-Ban Display تعيد تعريف التفاعل البشري الحاسوبي والتعلم: تدمج نظارات Meta Ray-Ban Display الذكية وظائف التعلم والترجمة في الارتداء اليومي، مما يوفر تجربة “ترجمة غير مرئية” و “تعلم بصري فوري”. تظهر ترجمات المحادثات مباشرة في العدسات، ويمكن للمستخدمين الحصول على معلومات ذات صلة بمجرد النظر إلى معلم أو عمل فني. بالإضافة إلى ذلك، يتيح Neural Band التحكم بالإيماءات، مما يسمح بالتشغيل دون الحاجة إلى هاتف. من المتوقع أن تعيد هذه التقنية تشكيل طريقة تفاعلنا وتعلمنا واتصالنا بالعالم، مما يمثل نقطة انطلاق جديدة للحوسبة المتمحورة حول الإنسان. (المصدر: Ronald_vanLoon)

🧰 أدوات

Synthesia تطلق Copilot، لتمكين تحرير الفيديو الاحترافي بالذكاء الاصطناعي: أطلقت Synthesia أداة Copilot، وهي محرر فيديو AI احترافي. تستطيع هذه الأداة كتابة النصوص بسرعة، وربط قواعد المعرفة، والتوصية بذكاء بالمواد المرئية، تمامًا مثل وجود زميل على دراية عميقة بالعمل ومنصة Synthesia. يهدف Copilot إلى تبسيط عملية إنتاج الفيديو، وخفض عتبة إنشاء الفيديو الاحترافي، وتوفير حلول فيديو AI فعالة وشخصية للشركات ومنشئي المحتوى. (المصدر: synthesiaIO, synthesiaIO)

GLIF Agent يستخدم Sora 2 لإعادة إنشاء وتخصيص مقاطع الفيديو الفيروسية: طورت GLIF وكيلًا (Agent) قادرًا على إعادة إنشاء أي فيديو فيروسي باستخدام نموذج Sora 2. يقوم هذا الوكيل أولاً بتحليل الفيديو الأصلي، ثم يولد كلمات مفتاحية مفصلة بناءً على نتائج التحليل، ويمكن للمستخدمين التعاون مع الوكيل لتخصيص الكلمات المفتاحية، وبالتالي إنشاء مقاطع فيديو مولدة بواسطة AI ذات طابع شخصي للغاية. من المتوقع أن توفر هذه التقنية قدرات قوية لإنتاج الفيديو وإعادة إنشائه في مجالات إنشاء المحتوى والتسويق. (المصدر: fabianstelzer)

Cloudflare AI Search تتعاون مع GroqInc لإطلاق قالب “الدردشة مع المستندات”: أطلقت Cloudflare AI Search (المعروفة سابقًا باسم AutoRAG) بالتعاون مع GroqInc، قالبًا جديدًا مفتوح المصدر لـ “الدردشة مع المستندات”. يجمع هذا القالب بين محرك استدلال Groq و AI Search، مما يتيح للمستخدمين إضافة وظائف AI حوارية إلى المستندات بسهولة أكبر، وتحقيق أسئلة وأجوبة وتفاعل في الوقت الفعلي مع محتوى المستندات. سيعزز هذا التكامل كفاءة استرجاع المستندات والحصول على المعلومات. (المصدر: JonathanRoss321)

HuggingFace تطلق ميزة تحرير GGUF داخل المتصفح: يدعم HuggingFace الآن تحرير بيانات تعريف نماذج GGUF مباشرة داخل المتصفح، دون الحاجة إلى تنزيل النموذج بالكامل. تحقق هذه الميزة من خلال تقنية Xet، وتدعم تحديثات الملفات الجزئية، مما يبسط بشكل كبير إدارة النماذج وعمليات التكرار، ويزيد من كفاءة عمل المطورين على منصة HuggingFace. (المصدر: reach_vb)

LangChain و LangGraph تطلقان الإصدار Alpha 1.0، وتطلبان ملاحظات المطورين: أطلقت LangChain و LangGraph الإصدار Alpha 1.0، مقدمةً واجهة برمجة تطبيقات Agent middleware جديدة، وكتل إخراج/محتوى قياسية، وتحديثات مهمة لواجهة برمجة التطبيقات. يدعو الفريق بنشاط المطورين لاختبار الإصدار الجديد وتقديم الملاحظات، لتحسين إطار عمل تطوير وكلاء AI الخاص بهم، ودفع بناء تطبيقات AI أقوى. (المصدر: LangChainAI)

NeuML تطلق سلسلة ColBERT Nano من النماذج المصغرة، بمعلمات أقل من مليون: أطلقت NeuML سلسلة نماذج ColBERT Nano، والتي يقل عدد معلماتها جميعًا عن مليون (250K، 450K، 950K). أظهرت هذه النماذج المصغرة أداءً مذهلاً في وضع “Late interaction”، مما يثبت أن حتى النماذج ذات النطاق الصغير جدًا يمكن أن تحقق نتائج جيدة في مهام محددة، مما يوفر حلولًا فعالة لنشر AI في البيئات محدودة الموارد. (المصدر: lateinteraction, lateinteraction)

NeuML تطلق سلسلة ColBERT Nano من النماذج المصغرة، بمعلمات أقل من مليون

مدير هندسة أول في جوجل يشارك “أنماط تصميم الوكلاء”: شارك مدير هندسة أول في جوجل مجانًا كتاب “أنماط تصميم الوكلاء”، مقدمًا أول مجموعة منهجية من مبادئ التصميم وأفضل الممارسات لمجال AI Agent الساخن. يهدف هذا المورد إلى مساعدة المطورين على فهم وبناء وكلاء AI بشكل أفضل، ويسد الفجوة في التوجيه المنهجي في هذا المجال، ومن المتوقع أن يصبح مرجعًا مهمًا لمطوري AI Agent. (المصدر: dotey)

مدير هندسة أول في جوجل يشارك "أنماط تصميم الوكلاء"

📚 تعلم

دراسة حول هلوسة LLM وآليات المحاذاة الآمنة: من الأصول الداخلية إلى استراتيجيات التخفيف: كشفت الأبحاث أن نماذج استدلال LLM قد تظهر ظاهرة “منحدر الرفض” قبل توليد المخرجات النهائية، أي انخفاض حاد في نية الرفض. من خلال إطار عمل DST، كشف الباحثون أن الهلوسة تصبح حتمية في “طبقة الالتزام” الخاصة بالنموذج، واقترحوا نموذج استدلال صغير HalluGuard، الذي يخفف الهلوسة في RAG من خلال دمج الإشارات السريرية وتحسين البيانات، مما يوفر تفسيرًا ميكانيكيًا واستراتيجيات عملية لمواءمة أمان LLM وتخفيف الهلوسة. (المصدر: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

ASPO يحسن التعلم المعزز لـ LLM، ويحل مشكلة عدم تطابق نسبة IS: ASPO (Asymmetric Importance Sampling Policy Optimization) هي طريقة جديدة لتدريب LLM بعد التدريب، تعالج الخلل الأساسي في عدم تطابق نسبة أخذ العينات المهمة (IS) لـ token الميزة الإيجابية في التعلم المعزز التقليدي. من خلال عكس نسبة IS لـ token الميزة الإيجابية وإدخال آلية قص مزدوجة ناعمة، يمكن لـ ASPO تحديث token منخفضة الاحتمالية بشكل أكثر استقرارًا، وتخفيف التقارب المبكر، وتحسين أداء اختبارات الترميز والاستدلال الرياضي بشكل كبير. (المصدر: HuggingFace Daily Papers)

Fathom-DeepResearch: نظام وكيل لاسترجاع المعلومات وتوليفها على المدى الطويل: Fathom-DeepResearch هو نظام وكيل يتكون من Fathom-Search-4B و Fathom-Synthesizer-4B، مصمم خصيصًا لمهام استرجاع المعلومات المعقدة والمفتوحة. يحقق Fathom-Search-4B البحث في الويب والاستعلام عن صفحات الويب في الوقت الفعلي من خلال مجموعات بيانات اللعب الذاتي متعددة الوكلاء والتعلم المعزز. بينما يقوم Fathom-Synthesizer-4B بتحويل نتائج البحث متعددة الجولات إلى تقارير منظمة. أظهر هذا النظام أداءً ممتازًا في العديد من الاختبارات المعيارية، وأظهر قدرة قوية على التعميم لمهام الاستدلال مثل HLE و AIME-25. (المصدر: HuggingFace Daily Papers)

AgentFlow: تحسين نظام الوكيل داخل التدفق لتحقيق تخطيط فعال واستخدام الأدوات: AgentFlow هو إطار عمل وكيل قابل للتدريب داخل التدفق، يقوم بتحسين مخططه مباشرة في دورة تفاعل متعددة الجولات من خلال تنسيق أربعة وحدات: المخطط، المنفذ، المدقق، والمولد. يستخدم Flow-based Group Refined Policy Optimization لحل مشكلة تخصيص الائتمان للمكافآت النادرة وطويلة الأجل. في عشرة اختبارات معيارية، تجاوز AgentFlow خطوط الأساس SOTA بنموذج أساسي بحجم 7B، مع تحسن كبير في متوسط الدقة في مهام البحث والوكيل والرياضيات والعلوم، وتجاوز حتى GPT-4o. (المصدر: HuggingFace Daily Papers)

دراسة منهجية لتأثير بيانات الكود على قدرة استدلال LLM: تستكشف الدراسة، من خلال إطار عمل منهجي وموجه بالبيانات، كيف تعزز بيانات الكود قدرة استدلال LLM. من خلال بناء مجموعات بيانات تعليمات متوازية لعشر لغات برمجة، وتطبيق اضطرابات هيكلية أو دلالية، وجد أن LLM أكثر حساسية للاضطرابات الهيكلية من الاضطرابات الدلالية، خاصة في مهام الرياضيات والكود. الكود الزائف والمخططات الانسيابية فعالة مثل الكود، ويؤثر أسلوب بناء الجملة أيضًا على المكاسب الخاصة بالمهام (Python مفيد للاستدلال باللغة الطبيعية، Java/Rust مفيد للرياضيات). (المصدر: HuggingFace Daily Papers)

DeepEvolve: وكيل اكتشاف الخوارزميات العلمية يدمج البحث العميق وتطور الخوارزميات: DeepEvolve هو وكيل يجمع بين البحث العميق وتطور الخوارزميات، يكتشف الخوارزميات العلمية في دورة تكرارية مدفوعة بالتغذية الراجعة من خلال استرجاع المعرفة الخارجية، وتحرير الكود عبر الملفات، وتصحيح الأخطاء في النظام. لا يقترح فقط فرضيات جديدة، بل يقوم أيضًا بالتحسين والتنفيذ والاختبار، متجنبًا التحسينات السطحية والتحسينات المفرطة غير الفعالة. في تسعة اختبارات معيارية عبر الكيمياء والرياضيات وعلم الأحياء والمواد وبراءات الاختراع، يحسن DeepEvolve باستمرار الخوارزميات الأولية، ويولد خوارزميات جديدة قابلة للتنفيذ ويحقق مكاسب مستمرة. (المصدر: HuggingFace Daily Papers)

خريطة طريق تعلم AI/ML والمفاهيم الأساسية: شارك المجتمع مسار تعلم شاملًا لـ AI والتعلم الآلي والتعلم العميق، يغطي جوانب متعددة من المفاهيم الأساسية إلى التقنيات المتقدمة (مثل Agentic AI، ومعلمات توليد LLM). تهدف هذه الموارد إلى توفير إرشادات تعليمية منظمة للمتخصصين الذين يرغبون في دخول أو تعميق معرفتهم في مجال AI/ML، ومساعدتهم على إتقان مهارات العملية الكاملة من تطوير النماذج إلى النشر والتشغيل والصيانة، وفهم كيف يدفع AI تحول الصناعة. (المصدر: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

خريطة طريق تعلم AI/ML والمفاهيم الأساسية

معايير AI وموارد التعلم: HLE، المؤتمرات، وإدارة تكلفة GPU: ناقش المجتمع العديد من موارد تعلم وممارسة AI. أصدرت CAIS معيار “Humanity’s Last Exam” المحدث ديناميكيًا، للتكيف مع تحسين أداء النموذج. وفي الوقت نفسه، تم توفير دليل حضور مؤتمرات التعلم الآلي واستراتيجيات تطوير LLM منخفضة التكلفة، بما في ذلك GPU المدفوعة حسب الطلب وتشغيل النماذج الصغيرة محليًا. بالإضافة إلى ذلك، وفر تنظيم GPU Mode Hackathon منصة للمطورين للتعلم والتبادل. (المصدر: clefourrier, Reddit r/MachineLearning, Reddit r/MachineLearning, Reddit r/MachineLearning, danielhanchen)

معايير AI وموارد التعلم: HLE، المؤتمرات، وإدارة تكلفة GPU

OneFlow: نموذج توليد مختلط ومتداخل الوسائط المتعددة المتزامن: OneFlow هو أول نموذج متعدد الوسائط غير ذاتي الانحدار، يدعم توليد الوسائط المختلطة بطول متغير ومتزامن. يجمع بين تدفق التحرير القابل للإدخال لـ token النص المنفصل ومطابقة التدفق لمساحة الصورة الكامنة. يحقق OneFlow توليفًا متزامنًا للنص والصورة من خلال أخذ العينات الهرمي، مع إعطاء الأولوية للمحتوى بدلاً من القواعد النحوية. أظهرت التجارب أن OneFlow يتفوق على خطوط الأساس ذاتية الانحدار في مهام التوليد والفهم، مع تقليل FLOPs التدريب بنسبة تصل إلى 50%، وفتح قدرات جديدة للتوليد المتزامن، والتحسين التكراري، والتوليد الطبيعي القائم على الاستدلال. (المصدر: HuggingFace Daily Papers)

Equilibrium Matching: إطار عمل نمذجة توليدية يعتمد على نماذج الطاقة الضمنية: Equilibrium Matching (EqM) هو إطار عمل جديد للنمذجة التوليدية، يتخلى عن الديناميكيات غير المتوازنة والمشروطة بالوقت لنماذج الانتشار والتدفق التقليدية، وبدلاً من ذلك يتعلم تدرجات التوازن لمشهد الطاقة الضمني. يستخدم EqM عملية أخذ عينات قائمة على التحسين، ومن خلال الانحدار التدرجي لأخذ العينات على المشهد المتعلم، حقق أداء SOTA لـ ImageNet 256×256 FID 1.90، ويتعامل بشكل طبيعي مع مهام مثل إزالة الضوضاء الجزئية، واكتشاف OOD، وتوليف الصور. (المصدر: HuggingFace Daily Papers)

💼 أعمال

OpenAI و AMD تبرمان اتفاقية شراكة في مجال الرقائق، لتحدي هيمنة NVIDIA: وقعت OpenAI و AMD اتفاقية شراكة في مجال الرقائق لمدة خمس سنوات بقيمة مليارات الدولارات، بهدف تحدي هيمنة NVIDIA في سوق رقائق AI. تأتي هذه الخطوة كجزء من استراتيجية OpenAI لتنويع موردي الرقائق، حيث سبق للشركة أن أبرمت شراكة مع NVIDIA. تسلط هذه الاتفاقية الضوء على الطلب الهائل في صناعة AI على أجهزة الحوسبة عالية الأداء، والسعي لتنويع سلسلة التوريد. (المصدر: MIT Technology Review)

تسريب قائمة كبار عملاء OpenAI، 30 شركة تستهلك تريليونات Tokens: انتشرت قائمة يُزعم أنها لكبار عملاء OpenAI عبر الإنترنت، وتظهر أن 30 شركة قد عالجت أكثر من تريليون Token عبر نماذجها. تكشف هذه القائمة (التي تشمل Duolingo، OpenRouter، Salesforce، Canva، Perplexity، وغيرها) عن التكوين السريع لاقتصاد استدلال AI، وتوضح أربعة أنواع رئيسية: بناة AI الأصليون، ومدمجو AI، ومقدمو بنية تحتية لـ AI، ومقدمو حلول AI العمودية. يُعتبر استهلاك Tokens معيارًا جديدًا لقياس القيمة الحقيقية لتطبيقات AI وتقدم الأعمال. (المصدر: Reddit r/ArtificialInteligence, 量子位)

تسريب قائمة كبار عملاء OpenAI، 30 شركة تستهلك تريليونات Tokens

سنغافورة تصبح ملاذًا آمنًا لحقوق الطبع والنشر لتطوير AI، وتجذب شركات AI العالمية: عدلت سنغافورة “قانون حقوق الطبع والنشر” الخاص بها، مقدمةً بند دفاع التحليل الحسابي، الذي ينص صراحة على أن تحليل البيانات الحسابية الذي يتم لتحسين أنظمة AI محمي من انتهاك حقوق الطبع والنشر، ويمنع حتى تغطية العقود. تهدف هذه الخطوة إلى جعل سنغافورة الوجهة الأكثر جاذبية عالميًا لتطوير نماذج AI، وجذب الاستثمار والابتكار، في تناقض صارخ مع النهج الحذر للمناطق الأخرى مثل أوروبا والولايات المتحدة تجاه حقوق الطبع والنشر لـ AI. على الرغم من أن نطاق الحماية يقتصر على سنغافورة، إلا أنه يوفر ضمانًا مهمًا لتطوير النماذج الأساسية. (المصدر: Reddit r/ArtificialInteligence)

🌟 مجتمع

صفقات تمويل صناعة AI ومخاوف الفقاعة: ظهرت تساؤلات على وسائل التواصل الاجتماعي حول صفقات تمويل صناعة AI، معتبرة أن العديد من الصفقات تبدو أشبه بمحاولات لرفع أسعار الأسهم بشكل مصطنع، بدلاً من أن تكون مبنية على قيمة حقيقية. أشارت بعض التعليقات إلى أن العديد من منتجات AI لم تشهد تطبيقات عملية فعلية في الأسواق المحلية أو الإقليمية، بل اشتكت الشركات من عدم فعالية منتجات AI. تُفسر هذه الظاهرة على أنها مضاربة في السوق وليست تكوينًا حقيقيًا لرأس المال وتأثيرات غير مباشرة. وفي الوقت نفسه، هناك نقاش حول تطبيق التوائم الرقمية لـ AI في مجال التسويق، حول ما إذا كان “ضجة أم مستقبل”. (المصدر: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

صفقات تمويل صناعة AI ومخاوف الفقاعة

الجدل حول رقابة محتوى ChatGPT وتجربة المستخدم: اشتكى مستخدمو ChatGPT من أن رقابة المحتوى على المنصة صارمة للغاية، حيث تم تصنيف حتى طلبات الوصفات البسيطة أو احتضان بين الشخصيات على أنها “محتوى ذو إيحاءات جنسية”، بينما لم تكن حساسة للمحتوى العنيف. يرى المستخدمون أن ChatGPT أصبح “عديم الفائدة” و “مفرط الحماية”، ويتساءلون عما إذا كانت OpenAI قد فقدت موظفيها المتميزين. وفي الوقت نفسه، أبلغ المستخدمون أيضًا عن مشكلات في تطبيق ChatGPT في عرض LaTeX. أدى ذلك إلى إلغاء بعض المستخدمين اشتراكاتهم، ودعوا OpenAI إلى التوقف عن خنق الإبداع. (المصدر: Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, jeremyphoward)

الجدل حول رقابة محتوى ChatGPT وتجربة المستخدم

رد فعل عنيف ضد محتوى AI ومخاوف المبدعين: مع تزايد انتشار المحتوى الذي يولده AI، ظهر شعور قوي مناهض لـ AI في المجتمع، خاصة في مجالات الفن والإبداع. أعرب مبدعون مشهورون مثل YouTuber MrBeast عن مخاوفهم من أن مقاطع فيديو AI قد تهدد سبل عيش مئات الآلاف من المبدعين. كما انتقد معجبو Taylor Swift مقاطع الفيديو الترويجية التي تم توليدها بواسطة AI بأنها “رخيصة وفظة”. يعكس هذا الرد العنيف قلق المبدعين من تأثير تقنية AI على الصناعات التقليدية، واهتمامهم بجودة المحتوى وأصالته. (المصدر: Reddit r/artificial, MIT Technology Review)

رد فعل عنيف ضد محتوى AI ومخاوف المبدعين

تحديات وآفاق تطبيق AI في مجال الألعاب: ناقش المجتمع خصائص تقنية AI القوية والمبتكرة والممتعة والديناميكية، لكنه تساءل لماذا لم تستخدم أي لعبة شعبية AI على نطاق واسع حتى الآن. يرى البعض أن AI يستخدم على نطاق واسع في التطوير، لكن تشغيل نماذج AI محليًا مكلف للغاية، ويميل مطورو الألعاب إلى التحكم في السرد. وهناك أيضًا رأي مفاده أن المطورين يركزون فقط على الألعاب الكبيرة التقليدية، ويتجاهلون الأفكار الجديدة. يعكس هذا التحديات التقنية والتكلفة والإبداعية التي تواجه تطبيق AI في مجال الألعاب. (المصدر: Reddit r/artificial)

Perplexity تبرز فائدة البحث بالذكاء الاصطناعي من خلال حالة استخدام كريستيانو رونالدو: استخدم نجم كرة القدم كريستيانو رونالدو أداة البحث بالذكاء الاصطناعي Perplexity أثناء إعداده لخطاب جائزة Prestige Globe Award. صرح بأن Perplexity ساعدته على فهم أهمية الجائزة والتغلب على التوتر. انتشر هذا الحدث على نطاق واسع من قبل Perplexity رسميًا ووسائل التواصل الاجتماعي، مما يسلط الضوء على القيمة العملية للبحث بالذكاء الاصطناعي في توفير معلومات سريعة ودقيقة، وإمكاناته الترويجية تحت تأثير المشاهير. (المصدر: AravSrinivas, AravSrinivas)

أبحاث جوجل في AI تفوز بجائزة نوبل وجدل ذو صلة: فازت جوجل بثلاث جوائز نوبل في غضون عامين، بما في ذلك Demis Hassabis (AlphaFold) و Geoff Hinton (AI). يُعتبر هذا الإنجاز تجسيدًا لاستثمار جوجل الطويل الأمد وطموحها في البحث. ومع ذلك، شكك Jürgen Schmidhuber في وجود مشكلة سرقة أدبية في جائزة نوبل في الفيزياء لعام 2024، معتبرًا أن نتائجها تتداخل بشكل كبير مع الأبحاث المبكرة ولم يتم الاستشهاد بها بشكل مناسب، مما أثار نقاشًا حول الأخلاقيات الأكاديمية والملكية في مجال AI. (المصدر: Yuchenj_UW, SchmidhuberAI, SchmidhuberAI)

أبحاث جوجل في AI تفوز بجائزة نوبل وجدل ذو صلة

النقاش الفلسفي حول متطلبات حوسبة AI ومسار تحقيق AGI/ASI: فيما يتعلق بالموارد الحسابية الهائلة المطلوبة لتوليد فيديو AI، يرى البعض أن هذا الاستثمار الحسابي الضخم القائم على الاحتياجات الحقيقية، يشير بدلاً من ذلك إلى أن الذكاء الاصطناعي العام (AGI) والذكاء الاصطناعي الفائق (ASI) لا يزالان مجرد خيال بعيد. يعكس هذا النقاش تفكير الصناعة حول مسار تطور AI، أي ما إذا كان نجاح AI الحالي في تطبيقات محددة سيشتت الموارد ويؤخر تحقيق أهداف أكبر. وفي الوقت نفسه، يؤكد Richard Sutton أن جوهر التعلم هو السلوك النشط للوكيل وليس التدريب السلبي. (المصدر: fabianstelzer, Plinz, dwarkesh_sp)

تأثير AI على سوق العمل: انخفاض أجر الساعة لمصنفي بيانات الدكتوراه: أشارت مناقشات وسائل التواصل الاجتماعي إلى أنه بسبب زيادة المعروض من مصنفي بيانات الدكتوراه، انخفض أجرهم بالساعة من 100 دولار/ساعة إلى 50 دولار/ساعة. في السابق، وظفت OpenAI حاملي الدكتوراه لتصنيف البيانات مقابل 100 دولار/ساعة. تعكس هذه الظاهرة تزايد المنافسة في سوق تصنيف بيانات AI، وتغير الطلب على مواهب تصنيف البيانات عالية الجودة. (المصدر: teortaxesTex)

أدوات مهندسي البرمجيات المدعومة بـ AI تحصل على تمويل وتأثيرها على المهنة: حصلت شركة Relace الناشئة، المتخصصة في توفير الأدوات لمهندسي البرمجيات المدعومين بـ AI، على تمويل بقيمة 23 مليون دولار في جولة التمويل A بقيادة Andreessen Horowitz. يشير هذا إلى أن سلسلة أدوات AI تتوسع نحو مجالات تطوير AI المستقلة الأعمق. وفي الوقت نفسه، ناقش المهندسون كيف تغير أدوات ترميز AI طريقة عملهم، معتبرين أنه على الرغم من إتقان استخدام أدوات AI، إلا أن الإبداع البشري وقدرات حل المشكلات لا تزال هي القيمة الأساسية. (المصدر: steph_palazzolo, kylebrussell)

أدوات مهندسي البرمجيات المدعومة بـ AI تحصل على تمويل وتأثيرها على المهنة

صعود وسقوط ظاهرة Vibe Coding الثقافية: ناقشت وسائل التواصل الاجتماعي صعود وسقوط مفهوم “Vibe Coding”. يرى البعض أن Vibe Coding هي طريقة للبرمجة في جو مريح، لكن هناك أيضًا من يرى أنها “ماتت”. تطرقت المناقشات ذات الصلة أيضًا إلى محتوى تم إنشاؤه بواسطة AI مثل “Bob Ross vibe coding”، مما يعكس استكشاف مجتمع المطورين وثقافتهم البرمجية وطرق البرمجة المدعومة بـ AI وتفكيرهم فيها. (المصدر: arohan, Ronald_vanLoon, nptacek)

💡 أخرى

الحكومة الأمريكية قد تلغي تمويلًا بمليارات الدولارات لمصانع احتجاز الكربون: قد تنهي وزارة الطاقة الأمريكية تمويلًا بمليارات الدولارات لمصنعين كبيرين لاحتجاز الكربون مباشرة من الهواء. كان من المقرر أن تحصل هذه المشاريع على أكثر من مليار دولار من المنح الحكومية، لكنها تواجه حاليًا حالة “إنهاء”. على الرغم من أن وزارة الطاقة صرحت بأنها لم تتخذ قرارًا نهائيًا بعد، وقد ألغت سابقًا أكثر من 200 مشروع لتوفير 7.5 مليار دولار، إلا أن هذا الغموض أثار مخاوف الصناعة بشأن تطور تكنولوجيا المناخ الأمريكية والقدرة التنافسية الدولية. (المصدر: MIT Technology Review)

الحكومة الأمريكية قد تلغي تمويلًا بمليارات الدولارات لمصانع احتجاز الكربون

تطورات جديدة في تكنولوجيا الروبوتات: من المعصم المرن إلى الخنافس البيونية والروبوتات البشرية: حقق مجال تكنولوجيا الروبوتات العديد من التطورات. حقق معصم الروبوت المتوازي الجديد حركات مرنة وشبيهة بالبشر في المساحات الضيقة، مما يعزز دقة التشغيل. وفي الوقت نفسه، يطور الباحثون خنافس روبوتية بيونية تحمل حقائب ظهر، تهدف إلى استخدامها في عمليات البحث والإنقاذ بعد الكوارث. بالإضافة إلى ذلك، أظهرت تقارير تفاعل الروبوتات البشرية مع الدراجات النارية، مما يعكس قدرة التكنولوجيا البيونية في محاكاة السلوك البشري. تدفع هذه التطورات مجتمعة حدود تكنولوجيا الروبوتات في التكيف مع البيئات المعقدة والتفاعل بين الإنسان والآلة. (المصدر: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

تطورات جديدة في تكنولوجيا الروبوتات: من المعصم المرن إلى الخنافس البيونية والروبوتات البشرية