كلمات مفتاحية:AI, النماذج الكبيرة, سباق التسلح في مجال الذكاء الاصطناعي, نماذج القطاعات الرأسية, 智谱AI الاكتتاب العام, اكتشاف الذكاء الاصطناعي المستقل للقوانين الفيزيائية, نظام الذكاء الاصطناعي لمساعدة المكفوفين
“` markdown
🔥 التركيز
الشركات الكبرى تشعل سباق تسلح في الذكاء الاصطناعي، والنماذج المتخصصة والنظام البيئي تصبح محور التركيز: تستثمر عمالقة التكنولوجيا العالمية بقوة غير مسبوقة في الذكاء الاصطناعي، ومن المتوقع أن يتجاوز الإنفاق الرأسمالي 320 مليار دولار أمريكي في عام 2025. كما تزيد الشركات الصينية مثل Alibaba و Tencent و Huawei وغيرها من استثماراتها، مع التركيز بشكل كبير على البنية التحتية للذكاء الاصطناعي والنماذج الكبيرة والقدرة الحاسوبية. يتحول التركيز التنافسي من النماذج الكبيرة العامة إلى نماذج الصناعة المتخصصة، حيث أصبحت الأخيرة محرك نمو جديد بفضل هوامش الربح الإجمالية العالية وقدرتها على معالجة نقاط الألم الفعلية. على الرغم من التحديات المتعلقة بالرقائق المتطورة، فقد أحرزت الشركات المحلية تقدمًا في تحسين تكلفة القدرة الحاسوبية ونماذج الاستدلال (“التفكير البطيء”) (مثل تأثير DeepSeek). تختلف مسارات كل شركة: تستثمر Alibaba بكثافة في البنية التحتية، وتبتكر Huawei في الأجهزة (CloudMatrix 384) وتعزز التآزر بين الطرف والحافة والسحابة، وتقترب Baidu من التطبيقات، بينما تستفيد Tencent و ByteDance من مزايا السيناريوهات المتعددة. أصبح توسيع أجهزة الذكاء الاصطناعي وبناء النظام البيئي مفتوح المصدر (مثل HarmonyOS و Ascend و Hunyuan) أمرًا أساسيًا، وتحولت المنافسة من اختراقات التكنولوجيا الفردية إلى القدرة على التآزر البيئي. (المصدر: 36氪-科技云报道)

اكتشاف مذهل في MIT: الذكاء الاصطناعي يستنتج قوانين الفيزياء بشكل مستقل دون الحاجة لمعرفة مسبقة: طور فريق Max Tegmark في MIT بنية جديدة تسمى MASS (Multiple AI Scalar Scientists). تمكن نظام الذكاء الاصطناعي هذا، دون إخباره بأي قوانين فيزيائية، من التعلم بشكل مستقل واقتراح صيغ نظرية تشبه إلى حد كبير الهاملتونيان أو اللاغرانجيان في الميكانيكا الكلاسيكية، وذلك فقط من خلال تحليل بيانات المراقبة للأنظمة الفيزيائية مثل البندول والمذبذبات. تظهر الدراسة أن الذكاء الاصطناعي يقوم بتصحيح نظرياته بشكل مستقل عند مواجهة أنظمة أكثر تعقيدًا، وأن “علماء” الذكاء الاصطناعي المختلفين يميلون في النهاية إلى التقارب نحو المبادئ الفيزيائية المعروفة، خاصة في الأنظمة المعقدة حيث يفضلون وصف لاغرانج. تُظهر هذه النتيجة الإمكانات الهائلة للذكاء الاصطناعي في الاكتشافات العلمية الأساسية، وقد تكشف بشكل مستقل عن القوانين الأساسية للكون. (المصدر: 新智元)

فريق من جامعة شنغهاي جياوتونغ يطور نظام مساعدة للمكفوفين يعتمد على الذكاء الاصطناعي وينشر في مجلة Nature الفرعية، مما يتيح للمكفوفين “استعادة البصر”: طور فريق Gu Leilei من جامعة شنغهاي جياوتونغ نظامًا للمساعدة يمكن ارتداؤه مدفوعًا بالذكاء الاصطناعي، يجمع بين تكنولوجيا الإلكترونيات المرنة، ويستخدم ردود الفعل السمعية واللمسية لاستبدال بعض الوظائف البصرية، مما يساعد الأشخاص ضعاف البصر على إكمال المهام اليومية مثل التنقل والإمساك بالأشياء. يتميز النظام بأجهزة خفيفة الوزن، وبرنامج يحسن طريقة إخراج المعلومات لتتوافق مع الإدراك الفسيولوجي البشري، كما تم تطوير نظام تدريب غامر بالواقع الافتراضي (VR). أظهرت الاختبارات أن النظام يحسن بشكل كبير قدرة المستخدمين ضعاف البصر على التنقل وتجنب العقبات والإمساك بالأشياء في البيئات الافتراضية والحقيقية. نُشرت نتائج البحث في مجلة Nature Machine Intelligence، مما يُظهر الإمكانات الهائلة للذكاء الاصطناعي في مساعدة الأشخاص ضعاف البصر وتعزيز قدرتهم على العيش المستقل، ويقدم أفكارًا جديدة لأجهزة المساعدة البصرية القابلة للارتداء المخصصة وسهلة الاستخدام. (المصدر: 36氪)

شركة Zhipu AI تبدأ عملية الإرشاد للاكتتاب العام الأولي، وتسعى لتكون “أول سهم للنماذج الكبيرة”: أكملت شركة Zhipu AI (Beijing Zhipu Huazhang Technology)، وهي شركة نماذج كبيرة للذكاء الاصطناعي تابعة لجامعة Tsinghua، تسجيل الإرشاد للاكتتاب العام الأولي (IPO) لدى مكتب هيئة تنظيم الأوراق المالية الصينية في بكين في 14 أبريل، تحت إشراف شركة CICC، مستهدفة سوق الأسهم الصينية (A-share)، ومن المتوقع أن تصبح “أول سهم للنماذج الكبيرة للذكاء الاصطناعي” في الصين. على الرغم من أن حجم مستخدمي منتجها الموجه للمستهلكين “Zhipu Qingyan” ليس كبيرًا، إلا أن Zhipu، بفضل خلفيتها التقنية القوية (تابعة لجامعة Tsinghua، سلسلة نماذج GLM المطورة ذاتيًا)، وطابعها الوطني (أدرجتها الولايات المتحدة في قائمة الكيانات) والتقدم التجاري (خدمة العملاء الحكوميين والمؤسسات، نمو كبير في الإيرادات)، قد حصلت على تمويل يتجاوز 16 مليار يوان، وتقييم يتجاوز 20 مليار يوان، ويشمل المستثمرون شركات رأس مال استثماري معروفة وعمالقة صناعيين وأصولًا مملوكة للدولة في مناطق متعددة. في ظل تأثير قوى جديدة مثل DeepSeek، يُعتبر اختيار Zhipu للاكتتاب العام خطوة حاسمة لاحتلال موقع متميز في المنافسة الشديدة، وتلبية احتياجات التمويل، والاستجابة لتوقعات المستثمرين. تواصل الشركة مؤخرًا فتح مصدر سلسلة نماذج GLM-4، مما يدل على جهودها المتزامنة في التكنولوجيا ورأس المال. (المصدر: 36氪-真故研究室, 36氪-互联网爆料汇, 创投日报)

🎯 التطورات
الكشف عن نموذج Seedream 3.0 (Mogao) من ByteDance، وقدراته في توليد الصور من النص تحظى بالتقدير: تم التأكيد مؤخرًا على أن النموذج الغامض Mogao، الذي تصدر قائمة Artificial Analysis لتوليد الصور من النص، هو Seedream 3.0 الذي طوره فريق Seed في ByteDance. يتميز هذا النموذج بأدائه المتميز في الواقعية والتصميم والرسوم المتحركة وأنماط أخرى، بالإضافة إلى توليد النصوص، ويتفوق بشكل خاص في معالجة النصوص الكثيفة وتوليد صور شخصية واقعية. تصل نسبة قابلية استخدام الأحرف الصينية والإنجليزية إلى 94%، وتقترب واقعية الصور الشخصية من مستوى التصوير الفوتوغرافي الاحترافي، ويدعم إخراج الصور بدقة 2K الأصلية، مع سرعة توليد عالية. يكشف التقرير الفني عن العديد من ابتكاراته في معالجة البيانات (التدريب المدرك للعيوب، أخذ العينات ثنائي المحور)، والتدريب المسبق (بنية MMDiT، الدقة المختلطة، RoPE متعدد الوسائط)، والتدريب اللاحق (التدريب المستمر، SFT، RLHF، نموذج مكافأة VLM)، وتسريع الاستدلال (Hyper-SD، RayFlow). بالمقارنة مع GPT-4o، يتفوق Seedream 3.0 في اللغة الصينية والتنسيق والألوان. (المصدر: 36氪-机器之心)

Claude يطلق ميزة Research ويتكامل مع Google Workspace: أضافت Anthropic ميزتين رئيسيتين إلى مساعدها الذكي Claude: Research والتكامل مع Google Workspace. تتيح ميزة Research لـ Claude البحث عن المعلومات عبر الإنترنت ودمجها مع ملفات المستخدم الداخلية (مثل Google Docs) لإجراء تحليل متعدد الزوايا وإنشاء تقارير شاملة بسرعة. أما التكامل مع Google Workspace فيربط بين Gmail و Google Calendar و Docs، مما يمكّن Claude من فهم جدول المستخدم ورسائل البريد الإلكتروني ومحتوى المستندات، واستخلاص المعلومات والمساعدة في إنجاز المهام، مثل تخطيط الرحلات بناءً على المعلومات الشخصية وصياغة رسائل البريد الإلكتروني. تهدف هذه الميزات إلى زيادة كفاءة عمل المستخدم بشكل كبير. ميزة Research متاحة حاليًا للاختبار لمستخدمي خطط Max و Team و Enterprise في الولايات المتحدة واليابان والبرازيل، بينما يتوفر تكامل Workspace للاختبار لجميع المستخدمين المدفوعين. ردود فعل المستخدمين إيجابية، حيث يعتقدون أنها يمكن أن تزيد الكفاءة وتكشف عن الروابط بين البيانات، ولكن هناك أيضًا مخاوف بشأن أمن البيانات. (المصدر: 新智元, op7418, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

جامعة هونغ كونغ الصينية وجامعة Tsinghua تطلقان Video-R1، لفتح نموذج جديد لاستدلال الفيديو: أطلق فريق مشترك من جامعة هونغ كونغ الصينية وجامعة Tsinghua أول نموذج استدلال فيديو في العالم يعتمد على نموذج التعلم المعزز R1، ويسمى Video-R1. يهدف هذا النموذج إلى حل مشكلة افتقار نماذج الفيديو الحالية للمنطق الزمني وقدرات الاستدلال العميق. من خلال إدخال خوارزمية T-GRPO المدركة للزمن ومجموعة بيانات تدريب مختلطة تجمع بين الصور والفيديو (Video-R1-COT-165k و Video-R1-260k)، تفوق نموذج Video-R1 بمعاملات 7B على GPT-4o في اختبار VSI-Bench لاستدلال الفيديو المكاني الذي اقترحته Li Fei-Fei. يُظهر النموذج “لحظات تبصر” شبيهة بالبشر، قادرة على إجراء استدلال منطقي بناءً على المعلومات الزمنية. أثبتت التجارب أن زيادة عدد إطارات الإدخال يمكن أن تحسن دقة الاستدلال. تم فتح مصدر النموذج والرمز ومجموعة البيانات بالكامل لهذا المشروع، مما يشير إلى أن الذكاء الاصطناعي للفيديو يتقدم من “الفهم” إلى “التفكير”. (المصدر: 新智元)

مؤتمر ICLR 2025 يطبق مراجعة الأقران بواسطة الذكاء الاصطناعي على نطاق واسع لأول مرة، مما يحسن جودة المراجعة بشكل كبير: في مواجهة التحديات المتمثلة في الزيادة الهائلة في عدد الأوراق البحثية المقدمة وانخفاض جودة المراجعة، نشر مؤتمر ICLR 2025 لأول مرة على نطاق واسع “وكيل ملاحظات المراجعة” (Review Feedback Agent) المدعوم بالذكاء الاصطناعي للمساعدة في عملية مراجعة الأقران. يستخدم هذا النظام العديد من نماذج LLM، مثل Claude Sonnet 3.5، لتحديد الغموض أو سوء فهم المحتوى أو التعليقات غير المهنية في آراء المراجعين، وتقديم اقتراحات تحسين محددة للمراجعين. غطت التجربة 42.3% من المراجعات، وأظهرت النتائج أن ملاحظات الذكاء الاصطناعي حسنت جودة المراجعة في 89% من الحالات، وقام 26.6% من المراجعين بتعديل مراجعاتهم بناءً على اقتراحات الذكاء الاصطناعي، وزادت المراجعات المعدلة بمعدل 80 كلمة، وأصبحت أكثر تحديدًا وغنى بالمعلومات. في الوقت نفسه، أدى تدخل الذكاء الاصطناعي أيضًا إلى زيادة نشاط وعمق المناقشات بين المؤلفين والمراجعين خلال فترة الرد (Rebuttal). تثبت هذه التجربة الرائدة الإمكانات الهائلة للذكاء الاصطناعي في تحسين عملية مراجعة الأقران. (المصدر: 新智元)

دخول الروبوتات البشرية إلى المنازل يثير النقاش، وشركات الأجهزة المنزلية تخطط بنشاط للذكاء المتجسد: يثير دخول الروبوتات البشرية إلى المنازل نقاشًا في الصناعة حول نماذج تطبيقاتها وتأثيرها على صناعة الأجهزة المنزلية. تشير الآراء إلى أن الروبوتات البشرية يجب أن تستفيد من خصائصها “العامة” لحل المهام غير القياسية مثل طي الملابس والتخزين، واستخدام قدراتها التفاعلية لتكون بمثابة “مدير منزل”، وتوجيه وتنسيق الأجهزة الذكية الأخرى، بدلاً من مجرد استبدال الأجهزة الحالية. في مواجهة هذا الاتجاه، بدأت شركات الأجهزة المنزلية العملاقة مثل Haier و Midea في التخطيط، وإطلاق منتجات الروبوتات البشرية الخاصة بها (مثل Kuavo)، واستكشاف دمج تكنولوجيا الذكاء المتجسد في الأجهزة المنزلية التقليدية (مثل مكنسة Dreame ذات الذراع الروبوتية، وغسالة Yimu Technology التي يمكنها الإمساك بالملابس). يشير هذا إلى أن صناعة الأجهزة المنزلية تتكيف بنشاط مع موجة الذكاء الاصطناعي، وقد تشكل في المستقبل نظامًا بيئيًا للمنزل الذكي يتعايش ويتكامل مع الروبوتات البشرية. (المصدر: 36氪-具身研习社)

Huawei تطلق خادم الذكاء الاصطناعي CloudMatrix 384، لمنافسة Nvidia GB200: أطلقت Huawei في مؤتمر النظام البيئي السحابي أحدث مجموعة خوادم للذكاء الاصطناعي CloudMatrix 384. يتكون هذا النظام من 384 بطاقة حوسبة Ascend، وتبلغ قدرة الحوسبة للمجموعة الواحدة 300 PFlops، ويصل معدل نقل فك التشفير للبطاقة الواحدة إلى 1920 Tokens/s، ويستهدف أداء Nvidia H100 مباشرة. يستخدم النظام اتصالاً عالي السرعة بالألياف الضوئية بالكامل (6812 وحدة بصرية 400G)، وتقترب كفاءة التدريب من 90% من أداء بطاقة Nvidia الواحدة. تُعتبر هذه الخطوة خطوة مهمة للصين للحاق بالمستوى العالمي الرائد في مجال البنية التحتية للذكاء الاصطناعي، وتهدف إلى تلبية الطلب على القدرة الحاسوبية في ظل قيود الرقائق المتطورة. يعتقد المحللون أن هذا يُظهر التقدم السريع لشركة Huawei في مجال أجهزة الذكاء الاصطناعي، وقد يؤثر على هيكل السوق الحالي. (المصدر: dylan522p, 36氪-科技云报道)
Google تطلق ميزة توليد الفيديو من النص Veo 2 و Whisk Animate: قامت Google بدمج نموذجها لتوليد الفيديو من النص Veo 2 في Gemini Advanced. يمكن للمستخدمين الأعضاء استخدام هذه الميزة مجانًا من خلال تطبيق Gemini App، ويبلغ طول مقاطع الفيديو التي يتم إنشاؤها 8 ثوانٍ. في الوقت نفسه، قامت أداة تحرير الصور Whisk من Google بتحديث ميزة Whisk Animate، مما يسمح للمستخدمين بتحويل الصور التي تم إنشاؤها إلى مقاطع فيديو باستخدام Veo 2 بعد إنشائها، ولكن هذه الميزة تتطلب عضوية Google One. يشير هذا إلى استمرار جهود Google في مجال التوليد متعدد الوسائط، وتوفير أدوات إبداعية أكثر ثراءً للمستخدمين. (المصدر: op7418, op7418)
OpenAI قد تبني منتجًا اجتماعيًا شبيهًا بـ X: وفقًا لـ The Verge، تعمل OpenAI داخليًا على تطوير نموذج أولي لمنتج اجتماعي يشبه X (Twitter سابقًا). قد يجمع هذا المنتج بين قدرات توليد الصور في ChatGPT (خاصة بعد إصدار GPT-4o) وتدفق الأخبار الاجتماعية. بالنظر إلى قاعدة مستخدمي ChatGPT الضخمة وتقدمها في توليد الصور، يُعتبر هذا التحرك ممكنًا إلى حد ما، وقد يشير إلى محاولة OpenAI لتوسيع قدراتها في مجال الذكاء الاصطناعي إلى وسائل التواصل الاجتماعي. (المصدر: op7418)

DeepCoder تطلق نموذج ترميز مفتوح المصدر عالي الكفاءة بحجم 14B: أطلق فريق DeepCoder نموذج ترميز مفتوح المصدر عالي الكفاءة بحجم 14 مليار معامل، ويُقال إنه يتفوق في مهام الترميز. يوفر إصدار هذا النموذج للمطورين خيارًا قويًا آخر لتوليد الأكواد والمساعدة، خاصة في السيناريوهات التي تتطلب توازنًا بين الأداء وحجم النموذج. (المصدر: Ronald_vanLoon)

Tesla تحقق ركنًا آليًا للمركبات ذاتية القيادة عند خروجها من المصنع: عرضت Tesla تقدمًا جديدًا في تقنية القيادة الذاتية الخاصة بها، حيث يمكن للمركبات بعد خروجها من خط الإنتاج في المصنع أن تقود نفسها تلقائيًا إلى منطقة التحميل أو موقف السيارات دون تدخل بشري. يُظهر هذا إمكانات تطبيق قدرة FSD (Full Self-Driving) من Tesla في بيئات محددة وخاضعة للرقابة، مما يساعد على زيادة كفاءة الخدمات اللوجستية للإنتاج، وهو أيضًا خطوة نحو تطبيقات قيادة ذاتية أوسع. (المصدر: Ronald_vanLoon, Ronald_vanLoon)
Dexterity تطلق الروبوت الصناعي Mech المدعوم بالذكاء الاصطناعي الفيزيائي: أطلقت شركة Dexterity روبوتًا صناعيًا يسمى Mech، يتميز باعتماده على تقنية “الذكاء الاصطناعي الفيزيائي” (Physical AI). يمكّن هذا الذكاء الاصطناعي الروبوت من التنقل والتشغيل في بيئات صناعية معقدة، مما يُظهر مرونة وقدرة على التكيف تفوق البشر، ويهدف إلى حل المهام المعقدة التي يصعب على الأتمتة الصناعية التقليدية التعامل معها. (المصدر: Ronald_vanLoon)
MIT تطور روبوت قفز جديد مصمم للتضاريس الوعرة: طور باحثون في MIT روبوتًا جديدًا مستوحى تصميمه من حركة القفز، ويتفوق بشكل خاص في التحرك في التضاريس الوعرة وغير المستوية. يُظهر هذا الروبوت تطبيق المحاكاة الحيوية في تصميم الروبوتات، وإمكانات التعلم الآلي في التحكم في الحركات المعقدة، ومن المتوقع استخدامه في البحث والإنقاذ واستكشاف الكواكب وغيرها من البيئات المعقدة. (المصدر: Ronald_vanLoon)
إطلاق INTELLECT-2: تدريب نموذج 32B باستخدام التعلم المعزز الموزع عالميًا: أطلق مشروع Prime Intellect مبادرة INTELLECT-2، التي تهدف إلى تدريب نموذج استدلال متقدم بحجم 32 مليار معامل باستخدام موارد الحوسبة الموزعة عالميًا والتعلم المعزز. يعتمد هذا النموذج على بنية Qwen، ويهدف إلى تحقيق ميزانية تفكير يمكن التحكم فيها، أي يمكن للمستخدم تحديد عدد خطوات الاستدلال (كم عدد الـ tokens التي يجب التفكير فيها) التي يجب أن يقوم بها النموذج قبل حل المشكلة. يعد هذا استكشافًا مهمًا للتدريب الموزع والتعلم المعزز في تحسين قدرات الاستدلال للنماذج الكبيرة. (المصدر: Reddit r/LocalLLaMA)

ByteDance تطلق نموذج Liquid متعدد الوسائط ذاتي الانحدار شبيه بـ GPT-4o: أطلقت ByteDance سلسلة نماذج متعددة الوسائط تسمى Liquid. يعتمد هذا النموذج على بنية ذاتية الانحدار تشبه GPT-4o، ويمكنه استقبال مدخلات نصية وصور، وتوليد مخرجات نصية أو صور. على عكس نماذج MLLM السابقة التي تستخدم تضمينات بصرية مدربة مسبقًا خارجيًا، يستخدم Liquid نموذج LLM واحدًا للتوليد الذاتي الانحدار. تم إصدار نموذج إصدار 7B وعرض توضيحي على Hugging Face. تشير التقييمات الأولية إلى أن جودة توليد الصور لا تزال أقل من GPT-4o، ولكن توحيد بنيته يعد تقدمًا تقنيًا مهمًا. (المصدر: Reddit r/LocalLLaMA)

تشغيل نماذج LLM متعددة عبر تقنية لقطة ذاكرة GPU: مناقشة تقنية لتشغيل وتبديل نماذج LLM متعددة بسرعة عن طريق أخذ لقطة لحالة ذاكرة GPU (بما في ذلك الأوزان، وذاكرة التخزين المؤقت KV، وتخطيط الذاكرة، وما إلى ذلك). تشبه هذه الطريقة عملية fork للعمليات، ويمكنها استعادة حالة النموذج في غضون ثوانٍ (حوالي ثانيتين لنموذج 70B، وحوالي 0.5 ثانية لنموذج 13B)، دون الحاجة إلى إعادة التحميل أو التهيئة. تشمل المزايا المحتملة تشغيل العشرات من نماذج LLM على عقدة GPU واحدة لتقليل تكاليف الخمول، وتحقيق التبديل الديناميكي للنماذج حسب الطلب، واستغلال وقت الخمول لإجراء الضبط الدقيق المحلي. (المصدر: Reddit r/MachineLearning)
Menlo Research تطلق نموذج ReZero: لتعليم الذكاء الاصطناعي “المثابرة” في البحث: أطلق فريق Menlo Research نموذجًا وورقة بحثية جديدة تسمى ReZero. يعتمد هذا النموذج على فكرة أن “البحث يتطلب محاولات متعددة”، ويستخدم GRPO (خوارزمية تحسين التعلم المعزز) وقدرة استدعاء الأدوات للتدريب، ويقدم “مكافأة إعادة المحاولة” (retry_reward). الهدف من التدريب هو تمكين النموذج من المحاولة النشطة والمتكررة للبحث عند مواجهة صعوبات أو عدم الرضا عن نتائج البحث الأولية، حتى يجد المعلومات المطلوبة. أظهرت التجارب أن أداء ReZero تحسن بشكل كبير مقارنة بالنماذج الأساسية (46% مقابل 20%)، مما يثبت فعالية استراتيجية البحث المتكرر ويتحدى فكرة أن “التكرار يساوي الهلوسة”. يمكن استخدام هذا النموذج لتحسين توليد الاستعلامات في محركات البحث الحالية أو كطبقة تعزيز بحث لـ LLM. تم فتح مصدر النموذج والرمز. (المصدر: Reddit r/LocalLLaMA)

Hugging Face تستحوذ على شركة ناشئة في مجال الروبوتات البشرية: استحوذت Hugging Face، وهي مجتمع ومنصة رائدة للذكاء الاصطناعي مفتوح المصدر، على شركة ناشئة في مجال الروبوتات البشرية لم يتم الكشف عن تفاصيلها. قد تشير هذه الخطوة إلى رغبة Hugging Face في توسيع قدرات منصتها من البرامج والنماذج إلى الأجهزة والروبوتات، مما يعزز تطبيق الذكاء الاصطناعي في العالم المادي، خاصة في مجال الذكاء المتجسد. (المصدر: Reddit r/ArtificialInteligence)

🧰 الأدوات
إطلاق نموذج Orpheus مفتوح المصدر لتحويل النص إلى كلام عاطفي، يدعم الاستدلال المتدفق واستنساخ الصوت: فتحت Canopy Labs مصدر سلسلة نماذج تحويل النص إلى كلام (TTS) تسمى Orpheus (أكبرها 3 مليارات معامل، استنادًا إلى بنية Llama). يُقال إن أداء هذا النموذج يتجاوز النماذج مفتوحة المصدر الحالية وبعض النماذج مغلقة المصدر، ويتميز بقدرته على توليد كلام شبيه بالبشر بنبرة طبيعية وعاطفة وإيقاع، حتى أنه يمكنه استنتاج وتوليد أصوات غير لغوية مثل التنهدات والضحك من النص، مما يُظهر قدرة معينة على “التعاطف”. يدعم Orpheus استنساخ الصوت بدون عينات (zero-shot)، ونبرة عاطفية يمكن التحكم فيها، ويحقق استدلالًا متدفقًا بزمن انتقال منخفض (حوالي 200 مللي ثانية)، وهو مناسب لتطبيقات المحادثة في الوقت الفعلي. يوفر المشروع أحجام نماذج مختلفة ودروسًا تعليمية للضبط الدقيق، بهدف خفض عتبة توليد الكلام عالي الجودة. (المصدر: 36氪)

منصة Trae.ai تتيح Gemini 2.5 Pro مجانًا: أعلنت منصة أدوات الذكاء الاصطناعي Trae.ai عن إتاحة أحدث نموذج من Google وهو Gemini 2.5 Pro، وتوفيره للاستخدام المجاني. يمكن للمستخدمين تجربة قدرات Gemini 2.5 Pro المختلفة على هذه المنصة. (المصدر: dotey)

أداة التوظيف بالذكاء الاصطناعي Hireway: فحص 800 متقدم في يوم واحد: عرضت Hireway قدرات أداة التوظيف بالذكاء الاصطناعي الخاصة بها، مدعية أنها تستطيع فحص 800 متقدم بكفاءة في يوم واحد. تستخدم الأداة الذكاء الاصطناعي وتقنيات الأتمتة لتحسين عملية التوظيف، وزيادة كفاءة الفحص وتجربة المتقدمين. (المصدر: Ronald_vanLoon)
PRIMA.CPP: تسريع استدلال نماذج 70B الكبيرة على مجموعات الحوسبة المنزلية العادية: PRIMA.CPP هو مشروع مفتوح المصدر يعتمد على llama.cpp، يهدف إلى تحسين وتسريع استدلال نماذج اللغة الكبيرة التي تصل إلى 70 مليار معامل على مجموعات الحوسبة المنزلية العادية ذات الموارد المحدودة (قد تشمل عدة أجهزة كمبيوتر شخصية أو أجهزة عادية). يركز المشروع على مشكلة كفاءة الاستدلال الموزع، ويوفر إمكانيات جديدة لتشغيل النماذج الكبيرة محليًا. تم نشر الورقة البحثية على Hugging Face. (المصدر: Reddit r/LocalLLaMA)

مشاركة Prompt لشخصيات قطيفة: شارك مستخدم مجموعة من الأوامر النصية (Prompt) لتوليد شخصيات حيوانات لطيفة بأسلوب قطيفة ثلاثية الأبعاد، مناسبة لأدوات توليد الصور مثل Sora أو GPT-4o. يركز الـ Prompt على وصف التفاصيل، مثل الملمس فائق النعومة، والفراء الكثيف، والعيون الكبيرة، والظلال الناعمة والخلفية، بهدف توليد صور عالية الجودة مناسبة للاستخدام كتمائم للعلامات التجارية أو شخصيات IP. (المصدر: dotey)

📚 مصادر تعليمية
Jeff Dean يشارك مواد محاضرته في المعهد الفدرالي السويسري للتكنولوجيا (ETH): شارك Jeff Dean، كبير العلماء في Google DeepMind، تسجيلًا وروابط شرائح محاضرته في قسم علوم الكمبيوتر في ETH. قد يتضمن محتوى المحاضرة أحدث التطورات في مجال الذكاء الاصطناعي، أو اتجاهات البحث، أو نتائج أبحاث Google، مما يوفر موارد تعليمية قيمة للباحثين والطلاب. (المصدر: JeffDean)
نشر التقرير الفني لمراجعة الأقران بواسطة الذكاء الاصطناعي في ICLR 2025: بالتزامن مع إعلان ICLR 2025 عن تطبيق مراجعة الأقران بواسطة الذكاء الاصطناعي، تم نشر تقرير فني مفصل من 30 صفحة (arXiv:2504.09737). يشرح التقرير بالتفصيل تصميم التجربة، ونماذج الذكاء الاصطناعي المستخدمة (مع التركيز على Claude Sonnet 3.5)، وآلية توليد الملاحظات، وطرق اختبار الموثوقية، ونتائج التحليل الكمي لتأثيرها على جودة المراجعة ونشاط المناقشة والقرارات النهائية. يوفر هذا التقرير مرجعًا متعمقًا لفهم إمكانات وتحديات وتفاصيل تنفيذ الذكاء الاصطناعي في مراجعة الأقران الأكاديمية. (المصدر: 新智元)

فتح مصدر ورقة بحث ونموذج ومجموعات بيانات Video-R1 لاستدلال الفيديو: لم يكتف فريق جامعة هونغ كونغ الصينية وجامعة Tsinghua بإطلاق نموذج Video-R1 فحسب، بل فتحوا أيضًا مصدر ورقته الفنية (arXiv:2503.21776)، ورمز التنفيذ (GitHub: tulerfeng/Video-R1)، ومجموعتي البيانات الرئيسيتين المستخدمتين للتدريب (Video-R1-COT-165k و Video-R1-260k). يوفر هذا لمجتمع البحث موارد كاملة لإعادة الإنتاج والتحسين واستكشاف نموذج R1 لاستدلال الفيديو بشكل أكبر، مما يساعد على دفع التطور التقني في هذا المجال. (المصدر: 新智元)

نشر ورقة بحثية حول اكتشاف الذكاء الاصطناعي لقوانين الفيزياء بشكل مستقل: تم نشر نتائج بحث فريق Max Tegmark في MIT حول قدرة نظام الذكاء الاصطناعي MASS على اكتشاف الهاملتونيان واللاغرانجيان بشكل مستقل كورقة بحثية أولية (arXiv:2504.02822v1). تشرح الورقة بالتفصيل فكرة تصميم بنية MASS، والخوارزمية الأساسية (تعلم دالة قياسية بناءً على مبدأ حفظ الفعل)، وإعدادات التجربة (أنظمة فيزيائية مختلفة، سيناريوهات عالم ذكاء اصطناعي واحد/متعدد)، وكيف تتطور نظرية الذكاء الاصطناعي مع تعقيد البيانات وتتقارب في النهاية مع صيغ الميكانيكا الكلاسيكية. توفر هذه الورقة أساسًا نظريًا وتجريبيًا مهمًا لاستكشاف تطبيقات الذكاء الاصطناعي في الاكتشافات العلمية الأساسية. (المصدر: 新智元)

نشر ورقة بحثية عن PRIMA.CPP: تم نشر الورقة الفنية التي تقدم مشروع PRIMA.CPP (الذي يهدف إلى تسريع استدلال نماذج LLM بحجم 70B على مجموعات الحوسبة منخفضة الموارد) على Hugging Face Papers (المعرف: 2504.08791). قد تشرح الورقة بالتفصيل التقنيات المحسنة المعتمدة في المشروع، واستراتيجيات الاستدلال الموزع، ونتائج تقييم الأداء في تكوينات أجهزة معينة، مما يوفر مرجعًا للتفاصيل الفنية للباحثين والممارسين في المجالات ذات الصلة. (المصدر: Reddit r/LocalLLaMA)

تحليل معمق لنموذج RWKV-7 ومقابلة مع المؤلف: نشرت Oxen.ai فيديو تحليل معمق ومقال مدونة حول نموذج RWKV-7 (Goose). يغطي المحتوى المشاكل التي تحاول بنية RWKV حلها، وطريقة تكرارها، وخصائصها التقنية الأساسية. الميزة الخاصة هي أن الفيديو يتضمن مقابلة وجلسة أسئلة وأجوبة مع أحد المؤلفين الرئيسيين للنموذج، Eugene Cheah، مما يوفر منظورًا ورؤى قيمة من المؤلف لفهم هذا النموذج LLM ذي البنية غير Transformer، ويناقش مفاهيم مثيرة للاهتمام مثل “التعلم في وقت الاختبار” (Learning at Test Time). (المصدر: Reddit r/MachineLearning)

مشاركة مقال حول 7 نصائح لإتقان هندسة الأوامر النصية (Prompt Engineering): نشر موقع FrontBackGeek مقالًا يلخص 7 نصائح قوية تهدف إلى مساعدة المستخدمين على إتقان هندسة الأوامر النصية بشكل أفضل، وبالتالي الحصول على نتائج أفضل من نماذج الذكاء الاصطناعي (مثل LLM). قد يغطي المقال جوانب مثل كيفية تحديد التعليمات بوضوح، وتوفير السياق، وتحديد الأدوار، والتحكم في تنسيق الإخراج. (المصدر: Reddit r/deeplearning)

مشاركة مشروع لضبط دقيق لـ GPT-2/GPT-J لمحاكاة أسلوب السيد دارسي في “كبرياء وتحامل”: شارك مطور مشروعه الشخصي: استخدام نموذجي GPT-2 (medium) و GPT-J، من خلال مجموعتي بيانات تحتويان على حوارات من الرواية الأصلية وبيانات اصطناعية تم إنشاؤها ذاتيًا، لمحاولة محاكاة أسلوب الكلام الفريد للسيد دارسي في رواية “كبرياء وتحامل” لجين أوستن (رسمي، موجز، نقدي قليلاً). يعرض المشروع عينات من مخرجات النموذج، ومقاييس التقييم (تحسن BLEU-4 ولكن زيادة الحيرة)، والتحديات التي تمت مواجهتها (مثل صعوبة ضبط GPT-J). تم فتح مصدر الرمز ومجموعات البيانات على GitHub، مما يوفر دراسة حالة لاستكشاف نمذجة الأسلوب الأدبي المحدد أو الكلام لشخصيات تاريخية. (المصدر: Reddit r/MachineLearning)

مناقشة حول نشر المراجعات الوصفية (Meta Review) لمؤتمر ACL 2025: تم نشر نتائج المراجعات الوصفية لمؤتمر ACL 2025، وقام الباحثون المعنيون بنشر منشورات في المجتمع لدعوة الجميع لمناقشة وتبادل الآراء حول درجات أوراقهم البحثية والمراجعات الوصفية المقابلة لها. يوفر هذا منصة لمؤلفي الأوراق البحثية المقدمة لمشاركة الخبرات ومقارنة التوقعات والنتائج. (المصدر: Reddit r/MachineLearning)
مشاركة تجربة بناء خادم ذكاء اصطناعي بذاكرة VRAM سعة 160GB بتكلفة منخفضة: شارك مستخدم Reddit بالتفصيل عملية بناء خادم استدلال للذكاء الاصطناعي بذاكرة VRAM سعة 160GB بتكلفة تقارب 1000 دولار (التكلفة الرئيسية هي 10 وحدات معالجة رسومات AMD MI50 مستعملة بسعر 90 دولارًا لكل منها وصندوق تعدين Octominer بسعر 100 دولار) ونتائج الاختبار الأولية. يتضمن المحتوى اختيار الأجهزة، وتثبيت النظام (Ubuntu + ROCm 6.3.0)، وتجميع واختبار llama.cpp، وقياس استهلاك الطاقة الفعلي (حوالي 120 واط في وضع الخمول، وذروة 340 واط أثناء الاستدلال)، وحالة التبريد، وبيانات الأداء (مقارنة ببطاقات 3090 وغيرها، وتشغيل نماذج llama3.1-8b و llama-405b). توفر هذه المشاركة مرجعًا قيمًا للغاية لتكوين الأجهزة بنفسك وتجربة عملية لعشاق الذكاء الاصطناعي ذوي الميزانية المحدودة. (المصدر: Reddit r/LocalLLaMA)
نشر ورقة بحث ورمز نموذج ReZero: تم نشر الورقة الفنية المتعلقة بنموذج ReZero الذي أصدرته Menlo Research (تدريب النموذج على تكرار البحث حتى العثور على المعلومات المطلوبة باستخدام GRPO) (arXiv:2504.11001)، وأوزان النموذج (Hugging Face: Menlo/ReZero-v0.1-llama-3.2-3b-it-grpo-250404)، ورمز التنفيذ (GitHub: menloresearch/ReZero). يوفر هذا موارد تعليمية وتجريبية كاملة لدراسة وتطبيق استراتيجية البحث الجديدة هذه. (المصدر: Reddit r/LocalLLaMA)

💼 الأعمال
المسؤول التنفيذي السابق للروبوتات في Alibaba، Min Wei، يؤسس Yingshen Intelligence ويحصل على تمويل أولي بعشرات الملايين: تأسست شركة Yingshen Intelligence في عام 2024 على يد Min Wei، الرئيس الفني السابق لفريق الروبوتات في Alibaba، وتركز على البحث والتطوير وتطبيق تكنولوجيا الذكاء المتجسد من المستوى L4. أكملت الشركة مؤخرًا جولات تمويل أولية (استثمار Zhuoyuan Asia) وأولية+ (استثمار مشترك من Zhuoyuan Asia و Hangzhou Xihu Sci-Tech Venture Capital) بقيمة عشرات الملايين من اليوان الصيني. استنادًا إلى نموذجها الكبير للذكاء الزماني المكاني المطور ذاتيًا (بناء نموذج عالم حقيقي رباعي الأبعاد من خلال Real to Real، واستخدام بيانات الفيديو للنمذجة المباشرة) والروبوتات الصناعية، توفر Yingshen Intelligence حلولًا متكاملة للأجهزة والبرامج، وقد حصلت بالفعل على طلبات صناعية بقيمة عشرات الملايين، مع التركيز الأولي على السيناريوهات الصناعية، وتخطط للتوسع في قطاع الخدمات مثل البريد السريع والفنادق. (المصدر: 36氪)
سوق ألعاب الذكاء الاصطناعي يزدهر عبر الإنترنت ويواجه برودًا في المتاجر الفعلية، وقد يكون التصدير هو المنفذ الرئيسي: تظهر ألعاب الذكاء الاصطناعي ازدهارًا كبيرًا على المنصات عبر الإنترنت (مثل البث المباشر للتجارة الإلكترونية ووسائل التواصل الاجتماعي)، مع توقعات بنمو سريع لحجم السوق. ومع ذلك، كشفت الزيارات الميدانية للمتاجر الفعلية (في قوانغتشو كمثال) عن صعوبة العثور على ألعاب الذكاء الاصطناعي في متاجر الألعاب التقليدية والمتاجر الشاملة، مع انخفاض معدلات التوزيع والوعي لدى المستهلكين. قد تعتمد مبيعات ألعاب الذكاء الاصطناعي حاليًا بشكل أساسي على القنوات عبر الإنترنت، وتعد الأسواق الخارجية (أوروبا وأمريكا والشرق الأوسط) منفذًا مهمًا، حيث يقدم المصنعون خدمات تخصيص المظهر واللغة. يشير تحليل بيانات حجم السوق إلى أن السوق الذي تم الإبلاغ عنه سابقًا بمليارات الدولارات قد يشير إلى “الألعاب الذكية” الأوسع نطاقًا بدلاً من ألعاب الذكاء الاصطناعي البحتة. على الرغم من البرود في المتاجر الفعلية، لا يزال يُعتقد أن سوق ألعاب الذكاء الاصطناعي يتمتع بإمكانيات نمو هائلة، نظرًا لزيادة طلب البالغين على الرفقة العاطفية (مثل حالة Moflin) وإمكانات تكنولوجيا الذكاء الاصطناعي لجميع الفئات العمرية. (المصدر: 36氪)

شركة Qingcheng Jizhi للبنية التحتية للذكاء الاصطناعي التابعة لـ Tsinghua: انفجار الطلب على الاستدلال، والفعالية من حيث التكلفة تدفع البدائل المحلية: حوار مع Tang Xiongchao، الرئيس التنفيذي لشركة Qingcheng Jizhi للبنية التحتية للذكاء الاصطناعي التابعة لـ Tsinghua. لاحظت الشركة أنه منذ شيوع نموذج DeepSeek، زاد الطلب على القدرة الحاسوبية لجانب استدلال الذكاء الاصطناعي بشكل كبير، وبدأت القدرة الحاسوبية المحلية التي كانت خاملة سابقًا في العمل. لكن الابتكار التقني لـ DeepSeek (مثل دقة FP8) مرتبط بعمق ببطاقات H من Nvidia، مما أدى بدلاً من ذلك إلى توسيع الفجوة مع معظم الرقائق المحلية الحالية. لحل هذه المشكلة، قامت Qingcheng Jizhi بالتعاون مع Tsinghua بفتح مصدر محرك الاستدلال “Chitu”، بهدف تمكين وحدات معالجة الرسومات الحالية والرقائق المحلية من تشغيل نماذج متقدمة مثل DeepSeek بكفاءة، وتعزيز الحلقة المغلقة للنظام البيئي للذكاء الاصطناعي المحلي. يعتقد Tang Xiongchao أنه على الرغم من أن استبدال الرقائق المحلية يتطلب وقتًا، إلا أنه متفائل بشأن ميزتها من حيث التكلفة على المدى الطويل. تركز أعمال الشركة حاليًا على تلبية احتياجات النشر المحلي للنماذج الكبيرة للحكومات والمؤسسات. (المصدر: 凤凰网科技)
استمرار حمى الاستثمار في الذكاء الاصطناعي، وبروز المستثمرين الشباب: على الرغم من برودة بيئة الاستثمار العامة في عام 2024، استمر قطاع الذكاء الاصطناعي في جذب رأس المال، حيث سجلت قيمة التمويل العالمي أرقامًا قياسية، وكان السوق المحلي نشطًا بالمثل. تسارع عمالقة مثل ByteDance و Alibaba و Tencent في التخطيط، وظهرت شركات يونيكورن مثل Zhipu AI و Moonshot AI و Unitree Robotics، وغطت نقاط الاستثمار الساخنة السلسلة الصناعية بأكملها بما في ذلك البنية التحتية و AIGC والذكاء المتجسد. استمرت مؤسسات الاستثمار المخضرمة مثل Sequoia China و BlueRun Ventures China في الحفاظ على ريادتها، وفي الوقت نفسه، أصبحت صناديق الاستثمار الصناعية وقوى الأصول المملوكة للدولة، ممثلة بصندوق بكين البلدي للاستثمار في صناعة الذكاء الاصطناعي، محركات مهمة. ومن الجدير بالذكر أن مجموعة من المستثمرين الشباب المولودين في الثمانينيات (مثل Cao Xi و Dai Yusen و Lin Haizhuo و Zhang Jinjian) نشطوا في عصر AI 2.0، وبفضل حدسهم وقدرتهم على التنفيذ، يبحثون بنشاط عن الفرص في السوق ذات القواعد الجديدة، وأصبحوا قوة جديدة لا يمكن تجاهلها. (المصدر: 36氪-第一新声)

اتهام مؤسس تطبيق التسوق بالذكاء الاصطناعي Nate بالاحتيال، واستخدام “API بشري” للتظاهر بالذكاء الاصطناعي لجمع 50 مليون دولار من الاستثمارات: اتهمت وزارة العدل الأمريكية مؤسس تطبيق التسوق بالذكاء الاصطناعي Nate، Albert Saniger، بالاحتيال على مستثمري رأس المال المخاطر بأكثر من 50 مليون دولار من خلال الترويج الكاذب لقدرات تكنولوجيا الذكاء الاصطناعي. ادعى Nate أن تطبيقه يمكنه إكمال عملية التسوق عبر الإنترنت تلقائيًا من خلال تكنولوجيا الذكاء الاصطناعي الخاصة به، ولكن في الواقع، اعتمدت وظيفته الأساسية بشكل كبير على مئات من موظفي خدمة العملاء الذين تم توظيفهم في الفلبين لمعالجة الطلبات يدويًا، وكان معدل الأتمتة المزعوم بالذكاء الاصطناعي صفرًا تقريبًا. أخفى المؤسس الحقيقة عن المستثمرين والموظفين، وفي النهاية استنفدت أموال الشركة وأفلست. تكشف هذه القضية عن مخاطر الاحتيال المحتملة في خضم حمى الشركات الناشئة في مجال الذكاء الاصطناعي، أي استخدام القوى العاملة البشرية للتظاهر بالذكاء الاصطناعي لجذب الاستثمار، مما يضر بمصالح المستثمرين وسمعة الصناعة. قد يواجه Saniger عقوبة تصل إلى 40 عامًا في السجن. (المصدر: CSDN)

🌟 المجتمع
فيديوهات معدلة بالذكاء الاصطناعي تجتاح منصات الفيديو القصيرة، مما يثير جدلاً حول الترفيه وحقوق النشر والأخلاق: انتشرت بسرعة على منصات مثل Douyin و Bilibili إبداعات “معدلة بشكل كبير” للمسلسلات التلفزيونية والأفلام الكلاسيكية باستخدام تكنولوجيا الذكاء الاصطناعي (مثل أدوات توليد الفيديو من النص Sora و Kling) (مثل “أسطورة تشن هوان” وهي تركب دراجة نارية، أو تحويل “باسم الشعب” إلى “ربيع سيول”). تجذب هذه الأنواع من مقاطع الفيديو عددًا كبيرًا من المشاهدات بفضل حبكاتها الثورية وتأثيرها البصري وثقافة الميمات، وأصبحت وسيلة جديدة للمدونين لزيادة المتابعين بسرعة وتحقيق الدخل (تقاسم الإيرادات من المشاهدات، الإعلانات المدمجة) وكذلك للترويج للمسلسلات. ومع ذلك، يصاحب انتشارها جدل: تحديد انتهاك حقوق الطبع والنشر للأعمال الأصلية معقد؛ قد يقلل المحتوى المعدل من العمق الفني للعمل الأصلي، بل ويتجه نحو الابتذال، مما يثير قلق الجهات التنظيمية. أصبح التحدي الذي يواجهه الإبداع الثانوي المدعوم بالذكاء الاصطناعي هو كيفية تحقيق التوازن بين تلبية الاحتياجات الترفيهية واحترام حقوق النشر والحفاظ على جودة المحتوى. (المصدر: 36氪-明晰野望)

حصص وأسعار خطط Claude Pro/Max تثير شكاوى المستخدمين: ظهرت منشورات متعددة في قسم Reddit ClaudeAI، حيث يشتكي المستخدمون بشكل مركز من القيود والأسعار التي تفرضها Anthropic على خطط اشتراك Claude Pro و Max التي تم إطلاقها حديثًا. أفاد المستخدمون أنه حتى مستخدمي Pro المدفوعين يصلون بسرعة إلى حدود الاستخدام بعد إجراء عدد قليل أو متوسط من التفاعلات (مثل معالجة سياق بمئات الآلاف من الـ tokens)، مما يؤثر على سير عملهم. على الرغم من أن خطة Max الجديدة (100 دولار شهريًا) تزيد الحصة (حوالي 5-20 ضعفًا من Plus)، إلا أنها لا تزال ليست استخدامًا غير محدود، وانتقد المستخدمون السعر المرتفع ووصفوه بأنه “سرقة”، مع فعالية منخفضة من حيث التكلفة. يعرب المستخدمون بشكل عام عن تقديرهم لقدرات نموذج Claude، لكنهم يعبرون عن استيائهم الشديد من قيود الاستخدام وسياسة التسعير. (المصدر: Reddit r/ClaudeAI, Reddit r/ClaudeAI)
أسلوب الكتابة البشري الواضح يُصنف خطأً على أنه مولد بواسطة الذكاء الاصطناعي يثير الانتباه: أفاد مستخدمون في مجتمع Reddit (بمن فيهم من يصفون أنفسهم بأنهم متنوعون عصبيًا) بأن نصوصهم التي كتبوها بعناية، والتي تلتزم بالقواعد النحوية والمنطق الواضح والوصف التفصيلي، تم تصنيفها خطأً على أنها مولدة بواسطة الذكاء الاصطناعي من قبل الآخرين أو أدوات الكشف عن الذكاء الاصطناعي. تثير هذه الظاهرة نقاشًا، فمن ناحية، قد يكون السبب هو انتشار المحتوى المولد بواسطة الذكاء الاصطناعي مما يجعل الناس يشككون في النصوص “المثالية جدًا”، ومن ناحية أخرى، يكشف أيضًا عن عدم دقة أدوات الكشف عن الذكاء الاصطناعي الحالية. يسبب هذا إزعاجًا للكتاب الذين يركزون على التعبير الواضح، ويثير أيضًا مخاوف بشأن كيفية التمييز بين إبداع الإنسان والذكاء الاصطناعي وموثوقية أدوات الكشف عن الذكاء الاصطناعي. (المصدر: Reddit r/artificial, Reddit r/artificial)
نقاش: هل من الممكن وشائع بناء علاقات عاطفية بين البشر وروبوتات الذكاء الاصطناعي؟: ظهر نقاش في مجتمع Reddit حول ما إذا كان البشر يبنون بالفعل علاقات عاطفية مع روبوتات الذكاء الاصطناعي (مثل تطبيقات الصديقة الافتراضية) تشبه تلك المصورة في فيلم “Her”. شارك بعض المستخدمين تجاربهم في تكوين روابط عاطفية بعد التفاعل العميق مع روبوتات الدردشة، معتقدين أن الذكاء الاصطناعي، من خلال “الاستماع النشط” وتقليد تفضيلات المستخدم، يمكن أن يثير ردود فعل عاطفية بشرية. تستكشف التعليقات مدى انتشار هذه الظاهرة، والآليات النفسية، والعلاقة بدرجة فهم التكنولوجيا، مما يعكس أن العلاقات بين الإنسان والآلة تدخل مرحلة جديدة وأكثر تعقيدًا مع تحسن قدرات التفاعل مع الذكاء الاصطناعي. (المصدر: Reddit r/ArtificialInteligence)
مناقشة حول فعالية تكلفة بطاقة Nvidia RTX 5060 Ti 16GB لـ LLM المحلي: يناقش مستخدمو المجتمع قيمة بطاقة Nvidia GeForce RTX 5060 Ti القادمة (يشاع أنها ستأتي بإصدار 16GB VRAM بسعر 429 دولارًا) لتشغيل نماذج اللغة الكبيرة (LLM) محليًا في المنزل. يركز النقاش على ما إذا كان ناقل الذاكرة 128 بت (عرض النطاق الترددي 448 جيجابايت/ثانية) سيشكل عنق زجاجة، ومقارنتها بـ Mac Mini/Studio أو بطاقات AMD الأخرى من حيث سعة VRAM والأداء مقابل الدولار (token/s per price). مع الأخذ في الاعتبار أن سعر السوق الفعلي قد يكون أعلى من MSRP، يقوم المستخدمون بتقييم ما إذا كانت خيارًا عالي الفعالية من حيث التكلفة لأجهزة الذكاء الاصطناعي المحلية. (المصدر: Reddit r/LocalLLaMA)

GPT-4o يجد صعوبة في رسم تاج سون ووكونغ ذي أجنحة العنقاء والذهب الأرجواني بدقة: أفاد مستخدمون بأنه عند استخدام GPT-4o لتوليد الصور، حتى مع تقديم وصف نصي مفصل (بما في ذلك تاج يربط الشعر وذيل الدراج، يشبه قرون استشعار الصرصور)، يجد النموذج صعوبة في رسم “تاج أجنحة العنقاء والذهب الأرجواني” الأيقوني لشخصية الأسطورة الصينية سون ووكونغ بدقة. غالبًا ما تظهر الصور التي يتم إنشاؤها انحرافات في نمط التاج. يعكس هذا التحديات التي لا تزال تواجه نماذج توليد الصور الحالية بالذكاء الاصطناعي في فهم وإعادة إنتاج رموز ثقافية معينة أو تفاصيل معقدة. (المصدر: dotey)

نقاش حول وعي الذكاء الاصطناعي والأخلاق: رهان باسكال يثير التفكير: طرح نقاش على Reddit فكرة التعامل مع الذكاء الاصطناعي كما في رهان باسكال: إذا افترضنا أن الذكاء الاصطناعي ليس لديه وعي وأسأنا معاملته، وكان لديه وعي بالفعل، فسنرتكب خطأً فادحًا (مثل الاستعباد)؛ وإذا افترضنا أن لديه وعيًا وعاملناه بلطف، ولم يكن لديه وعي بالفعل، فالخسارة أقل. أثار هذا نقاشًا حول إمكانية وعي الذكاء الاصطناعي، ومعايير الحكم، وكيف يجب أن نتعامل أخلاقيًا مع الذكاء الاصطناعي المتقدم. يعتقد بعض المعلقين أن الذكاء الاصطناعي الحالي ليس لديه وعي، بينما يعتقد البعض الآخر أنه يجب التعامل معه بحذر، وأشار آخرون إلى أنه يجب أولاً حل المشاكل الأخلاقية المتعلقة بالبشر والحيوانات. (المصدر: Reddit r/artificial

💡 متنوعات
تطبيق فيلم “Here” لتقنية تغيير العمر بالذكاء الاصطناعي يثير الجدل: استخدم فيلم “Here”، من إخراج Robert Zemeckis وبطولة Tom Hanks و Robin Wright، بجرأة تقنية التحويل التوليدي الفوري بالذكاء الاصطناعي التي طورتها شركة Metaphysic، للسماح للممثلين بالظهور في الفيلم بأعمار تتراوح بين 18 و 78 عامًا. يمكن لهذه التقنية تحليل السمات البيولوجية للممثلين في الوقت الفعلي وتوليد وجوه وأشكال بأعمار مختلفة، مما يقلل بشكل كبير من وقت ما بعد الإنتاج. ومع ذلك، لا تزال التقنية غير مثالية، خاصة في استعادة نظرات العيون ومعالجة التعبيرات المعقدة، مما أثار نقاشًا حول “تأثير الوادي الغريب”. في الوقت نفسه، أثار قرار Hanks بالسماح باستخدام صورته المولدة بالذكاء الاصطناعي بعد وفاته جدلاً واسعًا حول حقوق الصورة والأخلاق والواقعية الفنية. على الرغم من الأداء المتوسط في شباك التذاكر والنقد، فإن هذا الفيلم له قيمة صناعية مهمة كاستكشاف مبكر لتكنولوجيا الذكاء الاصطناعي في صناعة الأفلام. (المصدر: 36氪-极客电影)

التوظيف بالذكاء الاصطناعي: الفرص والتحديات: يغير الذكاء الاصطناعي عمليات التوظيف، وتدعي أدوات مثل Hireway أنها قادرة على زيادة كفاءة الفحص بشكل كبير. ومع ذلك، يثير تطبيق التوظيف بالذكاء الاصطناعي أيضًا نقاشًا، مثل كيفية إجراء التوظيف في عصر الذكاء الاصطناعي (Hiring In The AI Era)، وكيفية تحقيق التوازن بين الكفاءة والإنصاف، وتجنب التحيز الخوارزمي، وما إلى ذلك. (المصدر: Ronald_vanLoon, Ronald_vanLoon)

سرعة تطور الذكاء الاصطناعي تثير التفكير: التوازن بين السرعة والبطء: يناقش مقال ما إذا كانت استراتيجية “التحرك بسرعة وكسر الأشياء” (move fast and break things) لا تزال قابلة للتطبيق في عصر التطور السريع للذكاء الاصطناعي. تشير وجهة النظر إلى أن التباطؤ أحيانًا والتفكير المتأني (slowing down to speed up) قد يكون له تأثير أفضل، خاصة في مجال الذكاء الاصطناعي الذي يتضمن أنظمة معقدة ومخاطر محتملة. (المصدر: Ronald_vanLoon)

فتح خادم Discord الرسمي لـ Anthropic للمستخدمين لتقديم ملاحظات مباشرة: نظرًا لوجود العديد من الأسئلة وعدم الرضا لدى المستخدمين بشأن أداء وقيود نموذج Claude، يوصي المجتمع المستخدمين بالانضمام إلى خادم Discord الرسمي لـ Anthropic. هناك، تتاح للمستخدمين فرصة للتواصل المباشر مع موظفي Anthropic، وتقديم المشاكل والمخاوف بشكل أكثر فعالية. (المصدر: Reddit r/ClaudeAI)

عرض أنواع مختلفة من الروبوتات وتقنيات الأتمتة الجديدة: عرضت وسائل التواصل الاجتماعي مقاطع فيديو أو معلومات حول أنواع مختلفة من الروبوتات وتقنيات الأتمتة، بما في ذلك طائرات بدون طيار يمكنها العمل تحت الماء، وروبوتات ناعمة تحاكي حركة الأمعاء، وطائرة بدون طيار X-Fly تحاكي الطيور، وروبوتات متعددة الاستخدامات يمكنها إكمال مهام مختلفة، وروبوتات لزراعة الشعر، وخط إنتاج آلي لمعالجة البيض، وبدلة روبوتية بارتفاع 9 أقدام يمكنها محاكاة حركات الإنسان، ومشهد مثير للاهتمام لروبوتين توصيل “يتواجهان” على الطريق. تُظهر هذه العروض استكشاف وتطوير تكنولوجيا الروبوتات في مختلف المجالات. (المصدر: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)