AI日报AI日报 – 2025-05-01(下)AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3AI日报AI日报 – 2025-05-01(上)AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报AI日报 – 2025-05-01(上)AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型