Diário de IA – 2025-05-03(Tarde)
Anthropic Claude busca global na webAplicação de IA em suporte à saúde mentalConteúdo gerado por IACriatividade assistida por IADesvio de roteamento do modelo Qwen3 MoEEmpreendedorismo em IAÉtica em IAFunção Runway Gen-4 ReferencesGemini 2.5 ProGemini 2.5 Pro completando Pokémon: BlueModelo de IARobô humanoide
Diário de IA – 2025-05-03(Tarde)
Claude Web SearchCohere Command ADeepSeek-R1-Distill-Qwen-1.5BGPT-4oLançamento global do Claude Web SearchLoRIPlataforma de Cientistas de IAPlataforma FutureHouse de Cientistas de IAProblema de adulação excessiva do GPT-4oQwen3Tecnologia LoRI reduz redundância de parâmetros LoRAVersões quantizadas Qwen3 AWQ e GGUFVHELM
Diário de IA – 2025-05-02(Tarde)
Arquitetura alternativa TransformerArquitetura Liquid Foundation ModelsDebate AGIElementos centrais do Agentic RAGEngenharia reversa de prompts do sistema NotebookLMEstratégia do aplicativo GeminiÉtica de companheiros de IAInterface de interação LLMInterface de interação visual KarpathyLançamento de modelos de IAMétodo de treinamento Phi-4-ReasoningModelo Qwen3Tecnologia RAG
Diário de IA – 2025-05-01(Tarde)
Atualização de rollback do GPT-4oCorreção de comportamento excessivamente lisonjeiro do GPT-4oDeepSeek-Prover-V2Desempenho de prova de teorema do DeepSeek-Prover-V2Modelagem de texto longo com DiffTransformerModelo de inferência Phi-4Modelo Phi-4-reasoning-plus da MicrosoftOtimização de inferência MoEProtocolo de agente de IAQwen3 da Tongyi QianwenSuporte multilíngue do Qwen3-235BTécnicas de pós-treinamento de LLM
Diário de IA – 2025-05-01(Tarde)
Análise de riscos da cadeia de suprimentos de IAAprendizagem por reforçoCadeia de suprimentos de IADeepSeek-Prover-V2DeepSeek-Prover-V2-671BJustiça do ranking LMArenaMétodo de raciocínio matemático RLVRMétodos de avaliação de IAModelo de grande escala de código abertoModelo de raciocínio matemático de grande escalaModelo multimodalQwen2.5-Omni-3BQwen3