Quotidien IA – 2025-05-01(Soir)
Correction du comportement de flatterie excessive de GPT-4oDeepSeek-Prover-V2GPT-4o mise à jour de retour arrièreModèle de raisonnement Phi-4Modèle Phi-4-reasoning-plus de MicrosoftModélisation de texte long avec DiffTransformerOptimisation du raisonnement MoEPerformances de preuve de théorème de DeepSeek-Prover-V2Prise en charge multilingue de Qwen3-235BProtocole d'agent IAQwen3 de Tongyi QianwenTechnologie de post-formation LLM
Quotidien IA – 2025-05-01(Soir)
Analyse des risques de la chaîne d'approvisionnement en IAApprentissage par renforcementChaîne d'approvisionnement en IADeepSeek-Prover-V2DeepSeek-Prover-V2-671BÉquité du classement LMArenaMéthode de raisonnement mathématique RLVRMéthodes d'évaluation de l'IAModèle de raisonnement mathématique à grande échelleModèle multimodalModèles open source à grande échelleQwen2.5-Omni-3BQwen3