AI日报AI日报 – 2025-08-04(早)Agentic数据合成AI AgentAI数学证明Gemini 2.5 ProIMO金牌Kimi K2MuonClip优化器SeedProver分层推理模型形式化验证自我迭代验证流程逆强化学习IRL