Diario de IA – 2025-05-01(Tarde)
Actualización y reversión de GPT-4oCorrección de comportamiento adulador excesivo en GPT-4oDeepSeek-Prover-V2Modelado de texto largo con DiffTransformerModelo de inferencia Phi-4Modelo Phi-4-reasoning-plus de MicrosoftOptimización de inferencia MoEProtocolo de agentes de IARendimiento en demostración de teoremas de DeepSeek-Prover-V2Soporte multilingüe de Qwen3-235BTécnicas de post-entrenamiento para LLMTongyi Qianwen Qwen3
Diario de IA – 2025-05-01(Tarde)
Análisis de riesgos en la cadena de suministro de IAAprendizaje por refuerzoCadena de suministro de IADeepSeek-Prover-V2DeepSeek-Prover-V2-671BEquidad en el ranking LMArenaMétodo RLVR para razonamiento matemáticoMétodos de evaluación de IAModelo de razonamiento matemático a gran escalaModelo multimodalModelos de gran escala de código abiertoQwen2.5-Omni-3BQwen3