AI 일보AI 일보 – 2025-05-24(조간)AGENTIF 벤치마크 테스트AI 모델ASL-3 안전 등급SWE-bench 검증 점수멀티모달멀티모달 시계열 대형 모델 ChatTS소넷 4안전 평가에이전트코드 능력클로드 4 오푸스클로드 4 행동 및 안전 평가 보고서