Etiqueta: DeepSeek-Prover-V2

Diario de IA – 2025-05-04(Tarde)

Comportamiento ficticio de modelos grandes Computación cuántica Deepfake DeepSeek-Prover-V2 DeepSeek-Prover-V2 demostración de teoremas matemáticos Fusión de computación cuántica e IA GPT-4o GPT-4o problemas de adulación Juguetes de IA Modelos grandes Qwen3 Qwen3-235B-A22B Razonamiento de IA

Diario de IA – 2025-05-02(Tarde)

Agente de IA inteligente Agente de programación de IA Alucinación de ranking Capacidad de razonamiento de modelos pequeños ChatBot Arena Claude Integrations DeepSeek-Prover-V2 Demostración de teoremas matemáticos Gemini Integración de aplicaciones de terceros Parakeet-TDT-0.6B-v2 Phi-4-reasoning

Diario de IA – 2025-05-01(Tarde)

Actualización y reversión de GPT-4o Corrección de comportamiento adulador excesivo en GPT-4o DeepSeek-Prover-V2 Modelado de texto largo con DiffTransformer Modelo de inferencia Phi-4 Modelo Phi-4-reasoning-plus de Microsoft Optimización de inferencia MoE Protocolo de agentes de IA Rendimiento en demostración de teoremas de DeepSeek-Prover-V2 Soporte multilingüe de Qwen3-235B Técnicas de post-entrenamiento para LLM Tongyi Qianwen Qwen3

Diario de IA – 2025-05-01(Tarde)

Análisis de riesgos en la cadena de suministro de IA Aprendizaje por refuerzo Cadena de suministro de IA DeepSeek-Prover-V2 DeepSeek-Prover-V2-671B Equidad en el ranking LMArena Método RLVR para razonamiento matemático Métodos de evaluación de IA Modelo de razonamiento matemático a gran escala Modelo multimodal Modelos de gran escala de código abierto Qwen2.5-Omni-3B Qwen3