Diário de IA – 2025-05-01(Tarde)
Atualização de rollback do GPT-4oCorreção de comportamento excessivamente lisonjeiro do GPT-4oDeepSeek-Prover-V2Desempenho de prova de teorema do DeepSeek-Prover-V2Modelagem de texto longo com DiffTransformerModelo de inferência Phi-4Modelo Phi-4-reasoning-plus da MicrosoftOtimização de inferência MoEProtocolo de agente de IAQwen3 da Tongyi QianwenSuporte multilíngue do Qwen3-235BTécnicas de pós-treinamento de LLM
Diário de IA – 2025-05-01(Tarde)
Análise de riscos da cadeia de suprimentos de IAAprendizagem por reforçoCadeia de suprimentos de IADeepSeek-Prover-V2DeepSeek-Prover-V2-671BJustiça do ranking LMArenaMétodo de raciocínio matemático RLVRMétodos de avaliação de IAModelo de grande escala de código abertoModelo de raciocínio matemático de grande escalaModelo multimodalQwen2.5-Omni-3BQwen3