AI日报 – 2025-09-01(晚)
560B参数MoE模型AI在生物技术应用AI模型Capacidad de razonamiento socialCapacité de raisonnement socialGPT-5GUI基础Agent UItronLLM自我识别能力研究Nemotron-CC-v2数据集Prueba de referencia del juego de lobossocial reasoning abilityTest de référence Loup-garouTeste de referência WerewolfСпособность к социальному выводуТест на мафию (Werewolf Benchmark)اختبار معيار لعبة الذئبقدرات الاستدلال الاجتماعي多智能体系统开源预训练数据狼人杀基准测试社交推理能力细胞重编程美团LongCat-Flash늑대인간 벤치마크 테스트소셜 추론 능력