AI Ежедневник — 2025-06-04(Вечерний выпуск)
DeepSeek-R1-0528GPT-модель с памятью 3.6 битMetaAgentXOpenAI CodexВизуальная языковая модель действийДиффузионная модельЛимит памяти языковой моделиМузыкальное творчество Suno AIРоботизированная модель SmolVLAУлучшение персонализированного взаимодействия ChatGPTФункция доступа в интернет CodexФункция памяти ChatGPTЯзыковая модель с памятью
AI Ежедневник — 2025-06-03(Утренний выпуск)
DeepMind AlphaEvolveDeepSeek R1NVIDIA CosmosSakana AI DGMМасштабируемость усиленного обучения ProRLМатематический рекорд AlphaEvolveМедицинская оценка MedHELMМультимодальные большие моделиОптимизация логического вывода LLMСамоулучшающаяся машина Дарвина-ГёделяУсиленное обучение ProRLФизическое моделирование Cosmos TransferФреймворк для ИИ-агентов
AI Ежедневник — 2025-06-02(Утренний выпуск)
Автор Mamba Tri Dao предлагает механизмы внимания GTA и GLAГенерация изображений FLUX.1 KontextГенерация ядер CUDA от Stanford University превосходит человеческую производительностьГенерация ядер CUDA с помощью ИИМеханизмы внимания GTA и GLAМодель Pangu Ultra MoEМультимодальное тестирование RISEBench от Shanghai AI LabПовышение эффективности поисковых агентов ИИ от Nankai University и UIUCПредобученный фреймворк MaskSearchТестовый эталон RISEBenchФреймворк SearchAgent-XФреймворк избирательного вывода TONЭффективная система обучения модели Pangu Ultra MoE от Huawei
AI Ежедневник — 2025-05-31(Утренний выпуск)
Ascend от HuaweiDeepSeek-R1-0528Машина Гёделя ДарвинаМеханизм RLVR модели QwenМеханизм саморазвития DGMМультимодальное тестированиеОбучение с подкреплением с ложными наградамиОптимизация обучения Pangu Ultra MoEПовышение производительности DeepSeek R1-0528Потребление энергии ИИРейтинг SuperCLUEЯдерные решения для центров обработки данных ИИ