AI Ежедневник — 2025-06-02(Утренний выпуск)
Автор Mamba Tri Dao предлагает механизмы внимания GTA и GLAГенерация изображений FLUX.1 KontextГенерация ядер CUDA от Stanford University превосходит человеческую производительностьГенерация ядер CUDA с помощью ИИМеханизмы внимания GTA и GLAМодель Pangu Ultra MoEМультимодальное тестирование RISEBench от Shanghai AI LabПовышение эффективности поисковых агентов ИИ от Nankai University и UIUCПредобученный фреймворк MaskSearchТестовый эталон RISEBenchФреймворк SearchAgent-XФреймворк избирательного вывода TONЭффективная система обучения модели Pangu Ultra MoE от Huawei
AI Ежедневник — 2025-05-31(Утренний выпуск)
Ascend от HuaweiDeepSeek-R1-0528Машина Гёделя ДарвинаМеханизм RLVR модели QwenМеханизм саморазвития DGMМультимодальное тестированиеОбучение с подкреплением с ложными наградамиОптимизация обучения Pangu Ultra MoEПовышение производительности DeepSeek R1-0528Потребление энергии ИИРейтинг SuperCLUEЯдерные решения для центров обработки данных ИИ
AI Ежедневник — 2025-05-30(Вечерний выпуск)
DeepSeek-R1-0528DeepSeek-R1-0528-Qwen3-8BFLUX.1 KontextАгентский поиск информацииБольшая языковая модельИнструмент Circuit TracerИскусственный интеллект агентМашина Дарвина-ГёделяМультимодальная модельОбучение с подкреплениемОткрытый исходный код ИИРедактирование изображенийТестирование производительности ИИ
AI Ежедневник — 2025-05-29(Утренний выпуск)
LLM (Большие языковые модели)Авторские права на контент, созданный ИИАтомная энергия для дата-центров ИИБезопасность ИИвлияние ИИ на занятостьМодель для длинных текстов QwenLong-L1Мультимодальные моделиОбучение LLM с ложными вознаграждениямиОбучение с подкреплениемОткрытые моделиУтечка данных в Claude 4Энергопотребление ИИЭтика ИИ
AI Ежедневник — 2025-05-28(Вечерний выпуск)
MATH-500Qwen2.5-Math-7BRLAIFRLHFБудущее RLHF/RLAIFОбучение Qwen2.5-Math-7B с ошибочным вознаграждениемОбучение с подкреплениемОбучение сигналам подкрепленияОшибочное вознаграждениеПроизводительность моделиСлучайное вознаграждениеСлучайное вознаграждение улучшает производительность моделиТестовый набор MATH-500