AI日报AI日报 – 2025-06-25(早)AI基准测试AI安全性FaithfulSAE特征提取Gemini Robotics On-DeviceLiveCodeBenchLiveCodeBench Pro编程测试SlimMoE模型压缩框架Xbench动态AI基准Xbench多模态模型强化学习深度学习模型评估稀疏自编码器