Diário de IA – 2025-06-02(Edição da manhã)
Autor do Mamba, Tri Dao, propõe mecanismos de atenção GTA e GLAAvaliação multimodal RISEBench do Laboratório de IA de XangaiBenchmark de avaliação RISEBenchDesempenho de geração de kernel CUDA por IA da Universidade de Stanford supera humanosEstrutura de inferência seletiva TONEstrutura de pré-treinamento MaskSearchEstrutura SearchAgent-XGeração de imagens FLUX.1 KontextGeração de kernel CUDA por IAMecanismo de atenção GTA e GLAModelo Pangu Ultra MoEOtimização da eficiência do agente de busca de IA pela Universidade de Nankai e UIUCSistema de treinamento eficiente do modelo Pangu Ultra MoE da Huawei