AI日报AI日报 – 2025-06-02(早)AI生成CUDA内核FLUX.1 Kontext图像生成Mamba作者Tri Dao提出GTA和GLA注意力机制MaskSearch预训练框架Pangu Ultra MoE模型RISEBench评测基准SearchAgent-X框架TON选择性推理框架上海AI实验室RISEBench多模态评测华为Pangu Ultra MoE模型高效训练系统南开大学UIUC优化AI搜索智能体效率斯坦福大学AI生成CUDA内核性能超越人类注意力机制GTA和GLA