Ключевые слова:OpenAI DevDay 2025, Платформа приложений ChatGPT, AgentKit, Разработка ИИ-агентов, GPT-5 Pro, Sora 2, CodeMender, Машина непрерывного мышления, ChatGPT Apps SDK, Визуальный конструктор Agent Builder, Голосовая модель GPT-Realtime-Mini, Технология Gemini Deep Think, Нейродинамика CTM

🔥 В центре внимания

Крупные анонсы OpenAI DevDay 2025: ChatGPT становится платформой для приложений, AgentKit расширяет возможности разработки агентов ИИ : OpenAI на ежегодной конференции разработчиков 2025 года представила ряд значительных достижений, объявив, что ChatGPT имеет 800 миллионов еженедельных активных пользователей, а API обрабатывает более 6 миллиардов Token в минуту. Ключевые анонсы включают Apps SDK, который позволяет разработчикам создавать и запускать полнофункциональные приложения внутри ChatGPT, превращая ChatGPT в новую операционную систему. Одновременно был представлен AgentKit, включающий Agent Builder (визуальный конструктор), ChatKit (настраиваемый пользовательский интерфейс чата), Guardrails (модуль безопасности) и Evals (инструмент оценки), что значительно упрощает разработку агентов ИИ. Кроме того, были запущены GPT-5 Pro, API для генерации видео Sora 2/2 Pro и голосовая модель GPT-Realtime-Mini, инструмент программирования Codex стал общедоступным, а также были добавлены новые SDK и корпоративные функции. Эти обновления предвещают глубокую интеграцию и быстрое расширение экосистемы приложений ИИ, что окажет значительное влияние на экосистему разработчиков и пользовательский опыт.
(Источник: dotey, jerryjliu0, gdb, Yuchenj_UW, swyx, kevinweil, scaling01, scaling01, gdb, scaling01, scaling01, swyx, scaling01, gdb, gdb, op7418, TheRundownAI, OpenAIDevs, nickaturley, reach_vb, snsf, dotey, edwin)

OpenAI DevDay 2025 重磅发布:ChatGPT成为应用平台,AgentKit赋能智能体开发

Google DeepMind представила CodeMender, ИИ автоматически исправляет уязвимости в программном обеспечении : Google DeepMind выпустила CodeMender, это агент ИИ, который использует технологию Gemini Deep Think для автоматического исправления критических уязвимостей в программном обеспечении. Агент успешно отправил 72 высококачественных исправления в популярные кодовые базы, которые были приняты и одобрены сопровождающими. Запуск CodeMender знаменует собой важный прорыв ИИ в области безопасности программного обеспечения, который, как ожидается, значительно сократит время, необходимое разработчикам для поиска и исправления уязвимостей, а также повысит безопасность цепочки поставок программного обеспечения.
(Источник: Google, GoogleDeepMind)

Google DeepMind推出CodeMender,AI自动修复软件漏洞

«Continuous Thought Machines» от Sakana AI приняты в качестве основной статьи на NeurIPS 2025 : Sakana AI объявила, что ее «Continuous Thought Machines» (CTM) были приняты в качестве основной статьи на NeurIPS 2025. CTM — это ИИ, имитирующий биологический мозг, который использует нейродинамику и механизмы синхронизации для мышления во времени, способный решать сложные лабиринты путем построения внутренних карт, классифицировать изображения путем их изучения и изучать алгоритмы. Этот прорывной дизайн демонстрирует потенциал ИИ в имитации биологического интеллекта и решении сложных проблем, предвещая, что будущие системы ИИ могут обладать более сильными эмерджентными способностями.
(Источник: hardmaru, hardmaru)

Sakana AI的“连续思维机器”被NeurIPS 2025接收为焦点论文

ARCS V3 достигает прорыва в абстрактном мышлении с минимальным количеством параметров : ARCS V3 достигла точности 90-98% в бенчмарке ARC-AGI-2, имея всего 19.9M параметров, что в 88 442 раза меньше, чем у GPT-4, и без использования архитектуры Transformer. Этот результат ставит под сомнение зависимость отрасли от крупномасштабных моделей, демонстрируя, что в задачах абстрактного мышления выдающаяся производительность может быть достигнута с очень низким количеством параметров благодаря инновационному архитектурному дизайну и методам. Исследовательская группа подчеркивает, что этот прорыв представляет собой истинную способность к рассуждению, а не к запоминанию, и предоставляет полные журналы проверки и демонстрационные видео.
(Источник: weights_biases)

ARCS V3以极小参数量实现抽象推理突破

Equilibrium Matching (EqM) упрощает и превосходит Flow Matching, улучшая производительность генерации : Илунь Ду и его коллеги поделились исследованием Equilibrium Matching (EqM), методом, который упрощает и превосходит Flow Matching, достигая оценки FID 1.96 на ImageNet 256×256 и демонстрируя мощную производительность генерации. EqM достигает простого процесса генерации на основе градиента, обучаясь генерировать из одного статического ландшафта EBM (модели на основе энергии). Этот прогресс предлагает более эффективную и высокопроизводительную альтернативу для генеративных моделей.
(Источник: VictorKaiWang1)

🎯 Тенденции

OpenAI сотрудничает с AMD для развертывания MI450 GPU, ускоряя создание инфраструктуры ИИ : OpenAI объявила о многомиллиардном партнерстве с AMD, в рамках которого со следующего года будут развернуты GPU AMD Instinct MI450 мощностью 6 гигаватт для удовлетворения растущего спроса на вычисления ИИ. Это сотрудничество значительно ускорит создание глобальной инфраструктуры ИИ, предоставит пользователям OpenAI больше вычислительных ресурсов, а также принесет значительный доход AMD, обеспечивая взаимовыгодное положение для обеих сторон.
(Источник: dejavucoder, jachiam0)

Google AI Pro предлагает бесплатное обновление для студентов университетов : Google объявила, что студенты университетов могут бесплатно обновиться до плана Google AI Pro на один год. План включает Gemini, NotebookLM и 2 ТБ хранилища, предназначенные для помощи студентам в выполнении домашних заданий, понимании сложных концепций, создании учебных пособий и улучшении письма. Этот шаг, как ожидается, будет способствовать популяризации инструментов ИИ в образовании, расширяя возможности студентов в обучении и исследованиях.
(Источник: Google)

Microsoft Copilot обновляет функцию памяти, поддерживая команды «забыть» и «запомнить» : Microsoft Copilot обновил свою функцию памяти, теперь он может «запоминать» или «забывать» определенную информацию по команде пользователя. Пользователи могут управлять памятью Copilot в настройках, чтобы ИИ мог более точно реагировать на индивидуальные потребности при оказании помощи, избегая при этом ненужного сохранения информации. Это обновление повышает гибкость помощника ИИ в области защиты конфиденциальности и пользовательского опыта.
(Источник: mustafasuleyman)

LlamaParse теперь поддерживает Anthropic Claude Sonnet 4.5, улучшая возможности обработки документов : LlamaParse объявил об интеграции модели Anthropic Claude Sonnet 4.5, предоставляя пользователям более мощные возможности понимания и анализа документов. Это обновление повысит точность и эффективность LlamaParse при обработке сложных документов, а также анонсирует публикацию подробных результатов бенчмарков Sonnet 4.5 по сравнению с существующими опциями парсинга, чтобы продемонстрировать его преимущества в производительности.
(Источник: jerryjliu0)

HuggingFace Inference Endpoints теперь поддерживает Nvidia B200 GPU : HuggingFace объявила, что ее Inference Endpoints теперь поддерживают Nvidia B200 GPU. Это обновление предоставляет разработчикам более мощные вычислительные возможности для запуска и развертывания крупномасштабных моделей ИИ, удовлетворяя растущие вычислительные потребности. Этот шаг будет способствовать дальнейшему развитию приложений и инноваций в области моделей ИИ, снижая стоимость высокопроизводительного ИИ
(Источник: jerryjliu0)