Diario de IA – 2025-05-03(Tarde)
Claude Web SearchCohere Command ADeepSeek-R1-Distill-Qwen-1.5BGPT-4oLanzamiento global de Claude Web SearchLoRIPlataforma de científicos de IAPlataforma de científicos de IA FutureHouseProblema de adulación excesiva en GPT-4oQwen3Tecnología LoRI para reducir la redundancia de parámetros LoRAVersiones cuantificadas Qwen3 AWQ y GGUFVHELM
Diario de IA – 2025-05-02(Tarde)
Arquitectura alternativa a TransformerArquitectura de Liquid Foundation ModelsDebate AGIElementos clave de Agentic RAGEstrategia de la aplicación GeminiÉtica de los compañeros de IAIngeniería inversa de palabras clave del sistema NotebookLMInterfaz de interacción LLMInterfaz de interacción visual KarpathyLanzamiento de modelos de IAMétodo de entrenamiento Phi-4-ReasoningModelo Qwen3Tecnología RAG
Diario de IA – 2025-05-01(Tarde)
Actualización y reversión de GPT-4oCorrección de comportamiento adulador excesivo en GPT-4oDeepSeek-Prover-V2Modelado de texto largo con DiffTransformerModelo de inferencia Phi-4Modelo Phi-4-reasoning-plus de MicrosoftOptimización de inferencia MoEProtocolo de agentes de IARendimiento en demostración de teoremas de DeepSeek-Prover-V2Soporte multilingüe de Qwen3-235BTécnicas de post-entrenamiento para LLMTongyi Qianwen Qwen3
Diario de IA – 2025-05-01(Tarde)
Análisis de riesgos en la cadena de suministro de IAAprendizaje por refuerzoCadena de suministro de IADeepSeek-Prover-V2DeepSeek-Prover-V2-671BEquidad en el ranking LMArenaMétodo RLVR para razonamiento matemáticoMétodos de evaluación de IAModelo de razonamiento matemático a gran escalaModelo multimodalModelos de gran escala de código abiertoQwen2.5-Omni-3BQwen3