Mots-clés:DeepSeek UE8M0 FP8, Puce IA domestique, Grok 2.5 open source, Modèle d’Anderson, IA d’aide à la programmation, Robot miniature, IA générative, Optimisation FP8 adaptée à l’Ascend de Huawei, Moteur d’inférence SGLang de Grok 2.5, Preuve de localisation électronique de Yao Hongze et Yin Jun, Test de code par l’agent IA Cursor, Génération de monde synthétique NVIDIA Cosmos
🔥 Focus
Optimisation DeepSeek UE8M0 FP8 : Un tournant stratégique pour la synergie entre l’IA nationale et les semi-conducteurs : DeepSeek a introduit l’optimisation du format UE8M0 FP8 dans son modèle V3.1, visant à collaborer avec les puces AI nationales pour réduire l’occupation mémoire et les coûts de calcul, tout en améliorant le débit et l’efficacité énergétique. Cette stratégie de “modèle pionnier stimulant la synergie matérielle” accélère la construction d’un écosystème logiciel et matériel national autonome. Des fabricants de puces nationales comme Huawei Ascend et Cambricon s’adaptent activement, marquant une étape clé pour l’autonomie de l’IA chinoise. (Source : dotey, 36氪)

Le système d’inférence d’OpenAI atteint le niveau médaille d’or au concours IOI : Le système d’inférence d’OpenAI a obtenu le niveau médaille d’or lors de la compétition en ligne des Olympiades Internationales d’Informatique (IOI) 2025, se classant premier parmi les participants AI et sixième au classement général humain. Il avait déjà obtenu d’excellents résultats à l’IMO (preuve mathématique) et à AtCoder Heuristics (programmation compétitive), démontrant ses capacités exceptionnelles dans les tâches de raisonnement créatif, flou et précis. (Source : openai)

Elon Musk open-source Grok 2.5, visant les entreprises chinoises d’IA : Elon Musk a officiellement open-sourcé le modèle Grok 2.5. Le fichier pèse environ 500 Go et nécessite 8 GPU de 40 Go de VRAM pour fonctionner, avec une recommandation d’utiliser le moteur d’inférence SGLang. Grok 2.5 a montré d’excellentes performances sur les benchmarks académiques, surpassant Claude et GPT-4. Musk a déclaré que xAI dépasserait Google, mais que les entreprises chinoises étaient son plus grand rival. Il a également révélé que l’application Grok avait été mise à jour avec une fonction de génération de vidéo AI. (Source : 量子位, reach_vb)

Preuve mathématique d’un résultat du prix Nobel de physique 48 ans plus tard : Percée du modèle d’Anderson : Deux chercheurs chinois, Yao Hongze et Yin Jun (anciens élèves de l’USTC), ont, après 16 ans, fourni la première preuve mathématique du modèle d’Anderson en physique de la matière condensée. Ce modèle explique le phénomène de localisation des électrons dans les matériaux semi-conducteurs. En ajustant la matrice de bande et en simplifiant des équations complexes, ils ont prouvé que dans une matrice de bande unidimensionnelle, lorsque la largeur de bande est légèrement supérieure au seuil, les fonctions propres doivent être très petites et les électrons sont dans un état délocalisé, fournissant une base mathématique rigoureuse pour un résultat du prix Nobel de physique. (Source : 量子位)

Le MIT utilise l’IA pour aider les chimistes à développer des plastiques plus résistants : Des chercheurs du Massachusetts Institute of Technology et de l’Université Duke ont utilisé l’apprentissage automatique pour identifier des molécules de réticulation capables d’améliorer la ténacité des matériaux polymères, ouvrant la voie au développement de plastiques plus durables et à la réduction des déchets plastiques. Le modèle AI, en prédisant la force requise pour activer la force mécanique, a accéléré le criblage de nouvelles molécules mécano-réactives (comme le ferrocène), découvrant que la présence de groupes macromoléculaires peut améliorer considérablement la résistance à la déchirure. (Source : aihub.org)

🎯 Tendances
Progrès des nouveaux modèles et architectures d’IA : Motif 2.6B a été entraîné sur la plateforme AMD, utilisant une attention différentielle et une normalisation polynomiale ; Sakana AI a lancé le framework M2N2 pour l’évolution spontanée des modèles AI ; le paradigme AgentFly permet une adaptation continue à faible coût des agents LLM ; la série InternVL3.5 a été publiée et réduit l’écart avec les modèles commerciaux ; Intel a publié un modèle de quantification INT4 agressif pour DeepSeek-V3.1, ainsi que des recherches révolutionnaires comme EgoTwin, Sketch3DVE, ODYSSEY, VLA IVA dans les modèles de génération, de robotique et de vision-langage-action. (Source : jeremyphoward, hardmaru, HuggingFace Daily Papers, Reddit r/LocalLLaMA, QuixiAI, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

Des chercheurs de Beihang développent un microrobot ultra-rapide de 2 cm : Des chercheurs de l’Université Beihang ont développé un microrobot de 2 centimètres doté d’une vitesse sans fil ultra-rapide, démontrant les dernières avancées en matière de miniaturisation et de contrôle de mouvement des robots. Il pourrait être appliqué à l’avenir dans les domaines des opérations de précision et de la médecine. (Source : Ronald_vanLoon)
Kling AI 2.1 lance la fonction « images de début et de fin » : Kling AI 2.1 a lancé la fonction « images de début et de fin », disponible sur la plateforme Higgsfield, permettant aux utilisateurs de contrôler précisément les angles de caméra pour des transitions cinématographiques et une cohérence des personnages. Cette mise à jour améliore considérablement l’efficacité de la génération vidéo et la liberté créative, rendant la production d’effets visuels complexes plus pratique. (Source : Kling_ai, Kling_ai)
GPT-5 démontre des capacités stratégiques exceptionnelles dans Pokémon Cristal : Le GPT-5 d’OpenAI a montré des progrès étonnants en jouant à Pokémon Cristal, battant le Boss final RED en 9 517 pas, bien mieux que les 27 040 pas du modèle o3. Même avec un désavantage de niveau, la puissante stratégie de GPT-5 lui a permis de gagner facilement, soulignant une amélioration significative de ses capacités de raisonnement et de prise de décision. (Source : Teknium1, scaling01)

NVIDIA Cosmos combine l’IA générative pour créer des mondes synthétiques réalistes à grande échelle : NVIDIA Cosmos, combinant l’IA générative, est capable de créer des mondes synthétiques réalistes à grande échelle. Cette technologie est d’une importance capitale pour l’entraînement des modèles AI, la simulation d’environnements complexes et la génération de contenu de haute qualité dans des espaces virtuels tels que le métavers. (Source : Ronald_vanLoon)
Le NPU Qualcomm prend entièrement en charge le modèle Qwen3-4B-2507 : NEXA AI a annoncé que le NPU Qualcomm prend désormais entièrement en charge la série de modèles Qwen3-4B-2507, y compris les versions Instruct et Thinking, ainsi que Jan-v1-4B. Cela indique que les modèles Qwen accélèrent leur déploiement sur les appareils périphériques tels que les PC, les appareils mobiles et les automobiles, favorisant ainsi la démocratisation de l’IA. (Source : Alibaba_Qwen)
Le modèle d’édition d’images Qwen reste en tête des tendances sur Hugging Face : Le modèle d’édition d’images Qwen d’Alibaba continue de dominer le classement des tendances sur Hugging Face, démontrant son fort attrait et la reconnaissance des utilisateurs dans le domaine de la génération et de l’édition d’images par IA. (Source : Alibaba_Qwen)

Aperçu des dynamiques d’application de l’IA : Finance, médias, logistique et santé : La Malaisie a lancé Ryt Bank, la première banque AI au monde ; YouTube est accusé d’utiliser secrètement l’IA pour éditer les vidéos des utilisateurs, suscitant la controverse ; des chiens robots pilotés par l’IA ont commencé des essais de livraison de repas à Zurich ; une étude montre que les médecins pourraient rapidement devenir dépendants de l’IA, soulevant des préoccupations quant à son impact sur la pratique médicale. Ces événements décrivent collectivement l’influence croissante de l’IA dans les domaines de la finance, des médias, de la logistique et de la santé. (Source : Reddit r/artificial)

🧰 Outils
Chaîne d’outils et pratiques de programmation assistée par l’IA : Andrej Karpathy partage sa chaîne d’outils de programmation assistée par l’IA à quatre niveaux, avec Cursor comme outil principal et GPT-5 Pro en dernier recours, soulignant que les outils AI ont des avantages et des inconvénients et doivent être combinés ; Claude Code a aidé des développeurs seniors à réaliser des projets MVP en un week-end, démontrant son efficacité ; l’agent AI de Cursor peut écrire des tests temporaires pour améliorer la qualité du code ; les utilisateurs discutent des options de mise à niveau pour des outils comme Copilot, Cursor, Gemini Advanced. (Source : [npew](https://x.com/npew