Diario de IADiario de IA – 2025-05-25(Edición matutina)Agente de IAalgoritmo GRPOAprendizaje por refuerzobenchmark de codificación Claude Opus 4Capacidad de codificacióncapacidad de razonamientoClaude 4marco Pixel ReasonerModelo de IAMultimodalidadoptimización TensorRT-LLMVCBench de razonamiento visual matemáticoDiario de IADiario de IA – 2025-05-24(Edición matutina)Agente inteligenteCapacidad de codificaciónChatTS (Modelo multimodal de series temporales)Claude 4 OpusEvaluación de seguridadInforme de evaluación de comportamiento y seguridad de Claude 4Modelo de IAMultimodalidadNivel de seguridad ASL-3Pruebas de referencia AGENTIFPuntuación SWE-bench VerifiedSonnet 4
Diario de IADiario de IA – 2025-05-24(Edición matutina)Agente inteligenteCapacidad de codificaciónChatTS (Modelo multimodal de series temporales)Claude 4 OpusEvaluación de seguridadInforme de evaluación de comportamiento y seguridad de Claude 4Modelo de IAMultimodalidadNivel de seguridad ASL-3Pruebas de referencia AGENTIFPuntuación SWE-bench VerifiedSonnet 4