AI日报AI日报 – 2025-08-03(早)AGENTSAFEAI2-THOR平台AI安全评测Gemini 2.5 Deep ThinkGPT-4oMCTD方法RobotaxiVideo Thinking Test基准具身智能体并行思维技术文远知行Q2财报蒙特卡洛树扩散视频大模型