Diario de IADiario de IA – 2025-08-04(Edición matutina)Agente de IAAprendizaje por refuerzo inverso (IRL)Demostración matemática con IAGemini 2.5 ProKimi K2Medalla de oro en la Olimpiada Internacional de Matemáticas (IMO)Modelo de razonamiento jerárquicoOptimizador MuonClipProceso de verificación de autoiteraciónSeedProverSíntesis de datos agentesVerificación formal