كلمات مفتاحية:محول الانتشار الذري الكامل, نموذج مكافأة العملية الذاتي الإشراف, توليد الفيديو الذاتي الانحدار, الديناميكيات القائمة على الموضع, مؤتمر أكاديمي لمؤلفي الذكاء الاصطناعي, تقنية النسيان الاصطناعي, التقديم العصبي, التوليد ثلاثي الأبعاد, إطار ADiT, MetaStone-S1 SPRM, Lumos-1 MM-RoPE, محاكاة أقمشة Roblox AVBD, انتشار إدراك الأجزاء CoPart
🔥 مُلخص الأخبار
Meta/Cambridge/MIT يقدمون إطار عمل Transformer للانتشار الذري الكامل: قدم فريق بحثي مشترك من Meta FAIR وجامعة كامبريدج ومعهد ماساتشوستس للتكنولوجيا (MIT) نموذج ADiT، وهو Transformer للانتشار الذري الكامل، يكسر حاجز النمذجة بين الأنظمة الدورية وغير الدورية. من خلال ابتكارين رئيسيين، وهما التمثيل الكامن الموحد لجميع الذرات وانتشار Transformer الكامن، حقق ADiT إنجازًا في توليد الجزيئات والبلورات باستخدام نموذج واحد. تكمن الميزة الأساسية لـ ADiT في كسر حاجز النمذجة بين الأنظمة الدورية وغير الدورية، مما يسمح بتوليد الجزيئات والبلورات باستخدام نموذج واحد. تصميمه يكاد لا يُدخل أي انحياز استقرائي، مما يجعل كفاءة التدريب والاستدلال لكل من أجهزة التشفير التلقائي ونماذج الانتشار تتجاوز بكثير نماذج الانتشار المتغيرة التقليدية. في ظل نفس ظروف الأجهزة، يتم تقليل وقت توليد 10000 عينة من 2.5 ساعة إلى أقل من 20 دقيقة. (المصدر: HuggingFace Daily Papers)
التحجيم في وقت الاختبار باستخدام نموذج توليدي عاكس: يحقق MetaStone-S1 أداء OpenAI o3 من خلال نموذج مكافأة العملية ذاتية الإشراف (SPRM). ينجح SPRM في دمج نموذج السياسة ونموذج مكافأة العملية (PRM) في واجهة موحدة من خلال مشاركة شبكة رئيسية واستخدام رؤوس خاصة بالمهمة للتنبؤ بالرمز التالي وتسجيل العملية على التوالي، دون الحاجة إلى تعليقات توضيحية إضافية للعملية، مما يقلل من أكثر من 99٪ من معلمات PRM لتحقيق استدلال فعال. عند تزويده بـ SPRM، يكون MetaStone-S1 مناسبًا بشكل طبيعي للتحجيم في وقت الاختبار (TTS) ويوفر ثلاثة أوضاع عمل للاستدلال (منخفضة ومتوسطة وعالية)، بناءً على طول التفكير القابل للتحكم. (المصدر: HuggingFace Daily Papers)
Lumos-1: توليد فيديو ذاتي الانحدار قائم على منظور نموذج موحد: Lumos-1 هو مُولد فيديو ذاتي الانحدار يحتفظ بهندسة LLM مع الحد الأدنى من التعديلات المعمارية. لإدخال الارتباطات المكانية الزمانية في LLM، حددنا فعالية دمج 3D RoPE وشخصنا نطاق طيفها غير المتوازن. لذلك، نقترح MM-RoPE، وهو مخطط RoPE يحتفظ بـ RoPE النصي الأصلي مع توفير طيف شامل ومواقع ثلاثية الأبعاد متدرجة لنمذجة البيانات متعددة الوسائط المكانية الزمانية. علاوة على ذلك، يعتمد Lumos-1 إستراتيجية اعتماد الرموز التي تتبع الاتجاهية ثنائية الاتجاه داخل الإطار والسببية الزمنية بين الإطارات. بناءً على إستراتيجية الاعتماد هذه، حددنا مشكلة عدم توازن فقدان مستوى الإطار الناتجة عن التكرار المكاني للمعلومات وحللناها من خلال اقتراح فرض الانتشار المنفصل ذاتي الانحدار (AR-DF). (المصدر: HuggingFace Daily Papers)
Roblox تحل مشكلة فيزيائية أرقت الجميع!: قامت Roblox بحل مشكلة محاكاة القماش التي ابتليت بها محركات الفيزياء لسنوات من خلال الجمع بين Position Based Dynamics و Projective Dynamics. الطريقة الجديدة، التي تسمى “Average-Value Based Cloth Dynamics” (AVBD)، قادرة على تحقيق محاكاة قماش واقعية للغاية مع الحفاظ على الأداء في الوقت الفعلي، وقد تم تطبيقها بالفعل على منصة Roblox. (المصدر: )
🎯 اتجاهات
يجب أن يكون المؤلف الأول هو الذكاء الاصطناعي، أول مؤتمر أكاديمي لمؤلفي الذكاء الاصطناعي قادم: أطلقت جامعة ستانفورد أول مؤتمر أكاديمي لمؤلفي الذكاء الاصطناعي – المؤتمر المفتوح لوكلاء الذكاء الاصطناعي للعلوم (Agents4Science 2025)، والذي يشترط أن يكون المؤلف الأول للأوراق البحثية المقدمة هو نظام ذكاء اصطناعي، ويمكن للباحثين من البشر أن يكونوا مؤلفين مشاركين فقط. يهدف المؤتمر إلى استكشاف مستقبل الاكتشافات العلمية المدفوعة بالذكاء الاصطناعي، وإنشاء معايير وقواعد أخلاقية لمشاركة الذكاء الاصطناعي في البحث العلمي. ستكون جميع الأوراق البحثية المقدمة والمراجعات علنية، من أجل دراسة مزايا وقيود الذكاء الاصطناعي في البحث العلمي بشفافية. (المصدر: 36氪)
فقدان ذاكرة الذكاء الاصطناعي، 3 رؤوس انتباه فقط كافية لجعل النموذج الكبير ينسى أن “الكلاب تنبح”: اقترحت Meta بالاشتراك مع جامعة نيويورك طريقة للتلاعب برؤوس انتباه Transformer المتدرجة، والتي يمكنها تحديد وتحديد وحدات الإدراك الخاصة بالذكاء الاصطناعي بدقة، مما يسمح للنماذج الكبيرة “بنسيان” حقائق أو معرفة عامة معينة بشكل انتقائي. تعمل هذه الطريقة عن طريق تحويل المفاهيم إلى متجهات، وحساب التشابه مع رؤوس الانتباه، وبناء وحدات مفاهيم، وتضخيم أو محو تأثير المفاهيم من خلال عوامل التحجيم. يوفر هذا طريقة جديدة لضبط النماذج الكبيرة بشكل شخصي، وتحسين قدرات محددة، والتحكم في السلامة، وفهم كيفية تخزين النماذج للمعرفة. (المصدر: 36氪)
🧰 أدوات
CLiFT: رموز مجال ضوئي مضغوطة لعرض عصبي فعال من الناحية الحسابية وقابل للتكيف: تقدم هذه الورقة طريقة عرض عصبي تمثل المشهد كـ “رموز مجال ضوئي مضغوطة (CLiFT)”، مع الاحتفاظ بمعلومات غنية عن مظهر وهندسة المشهد. يُتيح CLiFT عرضًا فعالًا من الناحية الحسابية من خلال الرموز المضغوطة، مع إمكانية تغيير عدد الرموز لتمثيل المشهد أو عرض مناظر جديدة باستخدام شبكة مدربة واحدة. (المصدر: HuggingFace Daily Papers)
من واحد إلى أكثر: تمثيلات كامنة جزئية سياقية لتوليد ثلاثي الأبعاد: مستوحى من سير عمل التصميم ثلاثي الأبعاد البشري، نقترح CoPart – وهو إطار عمل انتشار مدرك للأجزاء يقوم بتحليل كائن ثلاثي الأبعاد إلى تمثيلات كامنة جزئية سياقية لتوليد متعدد الأجزاء متماسك. تتميز هذه النموذج بثلاث مزايا: i) تقليل تعقيد التشفير من خلال تحليل الأجزاء؛ ii) تمكين نمذجة علاقات الأجزاء الصريحة؛ iii) دعم التكييف على مستوى الجزء. (المصدر: HuggingFace Daily Papers)
🌟 مجتمع
jerryjliu0 يناقش استخراج النماذج وتطبيقات LLM: شارك jerryjliu0 مخططًا لاستخراج النماذج التكيفية باستخدام LlamaParse، والذي يحلل صفحات النماذج إلى أزواج مفتاح-قيمة معيارية ويخرجها كجداول ثنائية الأبعاد لسهولة المعالجة اللاحقة. كما أوصى بمقال Clelia Bertelli حول Pydantic، مشددًا على أهمية التحقق من الصحة وقابلية القراءة في سير عمل الوكيل، مشيرًا إلى أن Pydantic هو لبنة بناء فعالة للإخراج المنظم. بالإضافة إلى ذلك، أعاد تغريدات حول إعدادات الوكلاء المتعددين والبحث المتعمق، بالإضافة إلى تطبيقات LlamaIndex. (المصدر: jerryjliu0, jerryjliu0, jerryjliu0, jerryjliu0)
Alibaba_Qwen يذكر المطورين بإضافة رمز خاص عند استخدام Qwen3-embedding: لاحظ Alibaba_Qwen أن المطورين غالبًا ما ينسون إضافة الرمز الخاص <|endoftext|> في نهاية السياق عند استخدام نموذج GGUF لـ Qwen3-embedding، مما يؤثر بشكل كبير على دقة النموذج. يوصون باستخدام llama.cpp لإضافة هذا الرمز تلقائيًا ويخططون لإصدار حزمة نموذج GGUF محدثة لتبسيط العملية. (المصدر: Alibaba_Qwen)
Ronald_vanLoon يشارك أخبارًا وتقنيات متعلقة بالذكاء الاصطناعي: شارك Ronald_vanLoon العديد من الأخبار والتطورات التكنولوجية المتعلقة بالذكاء الاصطناعي، بما في ذلك تطبيقات الذكاء الاصطناعي في الرعاية الصحية، وشرائح اللحم النباتية المطبوعة ثلاثية الأبعاد، وإطار عمل لتقييم ملاءمة LLM، وميزة الصوت الأصلية في Gemini 2.5، والروبوتات والطائرات بدون طيار المستقلة التي تعمل معًا في الدوريات، والتعلم المعزز للتحكم، والهياكل الخارجية الآلية، واستقلالية وكلاء الذكاء الاصطناعي، وإطار عمل تصميم السحابة، والقفز الأمامي للروبوت، وطرق توصيل الأدوية في المستشفيات، وسيارات المستقبل، والابتكارات التكنولوجية الأخرى. (المصدر: منشورات متعددة من Ronald_vanLoon)
مناقشات المجتمع حول نماذج وأدوات الذكاء الاصطناعي: ناقش المجتمع العديد من نماذج وأدوات الذكاء الاصطناعي، بما في ذلك أداء Kimi K2 وسعره وتطبيقاته، وقابلية ضغط نموذج DeepSeek، وضبط مطالبات نظام نموذج Grok، ونتائج تقييم وتطبيقات نماذج أخرى. شملت المناقشات أيضًا استقلالية وكلاء الذكاء الاصطناعي، و RLHF، و RAG، وإعدادات الوكلاء المتعددين، وتطبيقات الذكاء الاصطناعي في مجالات مختلفة مثل البحث المتعمق والكتابة الإبداعية وتوليد التعليمات البرمجية واستخراج النماذج. (المصدر: منشورات متعددة من مستخدمين مختلفين)
مناقشات حول الذكاء الاصطناعي والقضايا الاجتماعية: ناقش المجتمع تأثير الذكاء الاصطناعي على المجتمع، بما في ذلك تأثيره على التوظيف وعدم المساواة الاقتصادية والصحة العقلية. شملت المناقشات أيضًا القضايا الأخلاقية المتعلقة بالذكاء الاصطناعي، وقضايا التنظيم، والاتجاه المستقبلي لتطوير الذكاء الاصطناعي. (المصدر: منشورات متعددة من مستخدمين مختلفين)
📚 تعلّم
كتاب RLHF يضيف اشتقاق خوارزمية تدرج السياسة: أضاف الفصل 11 (حول خوارزميات تدرج السياسة) من كتاب RLHF لـ Natolambert اشتقاقًا كاملاً لهدف تدرج السياسة. (المصدر: natolambert)
💼 أعمال
SpaceX تستثمر 2 مليار دولار في xAI: ستستثمر SpaceX ملياري دولار في xAI، كجزء من جولة تمويل أسهم بقيمة 5 مليارات دولار لـ xAI، وهي واحدة من أكبر استثمارات SpaceX على الإطلاق. سبق لـ SpaceX أن دعمت Tesla و The Boring Company. بعد هذا الاستثمار، قد يتم إرسال نموذج Grok إلى المريخ، وقد يكون هناك المزيد من التعاون التجاري بين SpaceX و xAI في المستقبل. (المصدر: 36氪)
Yarbo من Hanyang Technology تحصل على تمويل إضافي بمئات الملايين من اليوانات: أكملت Hanyang Technology، وهي شركة روبوتات تنظيف الفناء وإزالة الجليد Yarbo، جولة تمويل B+ بأكثر من 100 مليون يوان، بقيادة GuoKe Investment و CICC Capital و Joyoung Venture Capital. سيتم استخدام التمويل للبحث والتطوير التكنولوجي، وتكرار المنتج، وتحسين سلسلة التوريد، والإنتاج الضخم والتسليم. تعد Hanyang Technology حاليًا الشركة الوحيدة في العالم التي حققت تسليمًا تجاريًا واسع النطاق لروبوتات إزالة الجليد من مستوى المستهلك، وقد تغلب منتجها Yarbo S1 على الصعوبات التقنية الرئيسية مثل تكنولوجيا البطاريات في البيئات شديدة البرودة وخوارزميات الملاحة للتضاريس المعقدة. (المصدر: 36氪)
فريق من 12 شخصًا يصنع رفيقًا بالذكاء الاصطناعي، ويحصل على 30 مليون دولار من الاستثمار في غضون نصف عام: أكملت Portola، الشركة التي تقف وراء تطبيق الرفيق بالذكاء الاصطناعي Tolan، جولة تمويل من السلسلة A بقيمة 20 مليون دولار، بالإضافة إلى جولة التمويل الأولية البالغة 10 ملايين دولار، حصل Tolan على 30 مليون دولار من الاستثمار في غضون نصف عام. يوفر Tolan شخصيات فضائية بالذكاء الاصطناعي لمرافقة المستخدمين ويحقق الدخل من خلال نموذج الاشتراك. (المصدر: 36氪)
💡 آخر
زوكربيرج يستعد لمفاجأة ماسك، المواهب التقنية الصينية الأمريكية هي مفتاح الفوز بالذكاء الاصطناعي: تستثمر Meta بكثافة في مجال الذكاء الاصطناعي وتوظف مواهب الذكاء الاصطناعي الصينية الأمريكية من شركات مثل OpenAI و Google و Apple بمرتبات عالية، بهدف تعزيز قدرتها التنافسية في مجال الذكاء الاصطناعي. (المصدر: 36氪)
هل انتهى DeepSeek؟ تم تحديده على أنه يدرس الصحافة: دحض المقال شائعات زوال DeepSeek، مشيرًا إلى أن انخفاض استخدام DeepSeek ليس بسبب ضعف المنتج، ولكن بسبب إستراتيجيته مفتوحة المصدر وتجربته المتعمدة في تقليل تجربة واجهة برمجة التطبيقات الرسمية، لتشجيع المستخدمين على استخدام نماذج DeepSeek التي يستضيفها طرف ثالث. الهدف الأساسي لـ DeepSeek هو تحقيق الذكاء الاصطناعي العام (AGI)، وليس كسب المال من خلال بيع خدمات النماذج الكبيرة. (المصدر: 36氪)
“عائدات سنوية قدرها 10 ملايين دولار أمريكي”، هي أكبر كذبة في مسار تطبيقات الذكاء الاصطناعي هذا: كشف المقال عن ظاهرة الإيرادات المبالغ فيها في مسار تطبيقات الرفيق العاطفي بالذكاء الاصطناعي، مشيرًا إلى أن العديد من الشركات تعتمد على الاستثمار المرتفع للحفاظ على النمو، لكن معدل دفع المستخدمين ومعدل الاحتفاظ منخفضين، والإيرادات الفعلية أقل بكثير من البيانات المعلن عنها. في الوقت نفسه، تشكل مشكلات التنظيم أيضًا تحديًا كبيرًا لتطوير هذا المسار. (المصدر: 36氪)