Ключевые слова:GPT-5, человекоподобный робот, генерация видео с помощью ИИ, LLM, ИИ-агент, OpenAI, AMD, прорыв в математических способностях GPT-5, слепой робот Amazon OmniRetarget, генерация видео Byte Self-Forcing++, исследование согласованности агентов LLM, сотрудничество OpenAI и AMD в области чипов
Глубокий анализ от главного редактора рубрики AI
🔥 В центре внимания
Прорыв в математических способностях GPT-5 : GPT-5 Pro обнаружил контрпример к проблеме оптимальности большинства NICD-with-erasures, превзойдя существующие оптимальные алгоритмы большинства и продемонстрировав значительный прогресс в сложных математических рассуждениях. Это указывает на то, что математические способности GPT-5 могут достичь сверхчеловеческого уровня, что имеет глубокие последствия как для теоретических исследований, так и для практических применений. (Источник: cloneofsimo, BlackHC, kevinweil)

Дебют «слепого» робота Amazon OmniRetarget : Команда Amazon FAR представила «слепого» гуманоидного робота OmniRetarget, который не требует камер или радаров. Он моделирует отношения между роботом, объектами и местностью с помощью интерактивной сетки, реализуя долгосрочные навыки «перемещения и манипуляции в одном» и обеспечивая перенос с нулевым количеством примеров от симуляции к аппаратному обеспечению. Эта технология демонстрирует выдающиеся способности к паркуру и переноске в сложных условиях, что считается значительным прорывом в области гуманоидных роботов. (Источник: 量子位)

ChatGPT, созданный вручную в Minecraft : Разработчик в Minecraft полностью использовал схемы из красного камня (бинарную логику) и блоки памяти для создания модели ChatGPT с 5 миллионами параметров. Эта модель может вести диалог на английском языке, включает в себя такие ключевые компоненты, как встраивание слов, позиционное кодирование и многоголовое внимание, демонстрируя удивительные инженерные способности по созданию сложных систем ИИ в виртуальной среде. (Источник: 量子位)

ByteDance Self-Forcing++ обеспечивает минутную генерацию видео с ИИ : ByteDance и UCLA совместно предложили метод Self-Forcing++, который позволяет генерировать высококачественное видео с ИИ продолжительностью до нескольких минут (максимум 4 минуты 15 секунд), превосходя ограничение Sora2 в 5 секунд. Этот метод, благодаря инициализации обратным шумом, дистилляции с расширенным сопоставлением распределений и оптимизации обучения с использованием скользящего кеша KV, эффективно подавляет ухудшение качества изображения и накопление ошибок на поздних этапах генерации длинных видео, что, как ожидается, будет способствовать развитию эры ИИ-фильмов. (Источник: 量子位)

Google ограничивает доступ ИИ к данным Интернета : Google незаметно удалил параметр поиска num=100, снизив максимальное количество результатов поиска на одной странице со 100 до 10, что значительно усложняет для LLM и веб-краулеров получение данных из «длинного хвоста» Интернета, фактически сокращая глубину доступного для ИИ Интернета на 90%. Этот шаг оказывает немедленное влияние на цепочки поставок данных для ИИ и видимость стартапов, знаменуя новую эру алгоритмической видимости. (Источник: Reddit r/ArtificialInteligence)
🎯 Тенденции
Предстоящий OpenAI DevDay и слухи об Agent Builder : Скоро состоится OpenAI DevDay, и Сэм Альтман анонсировал «новые разработки». На рынке ходят слухи, что OpenAI выпустит «Agent Builder», который может полностью изменить разработку приложений ИИ, обеспечивая более мощные автономные рабочие процессы, хотя некоторые считают, что это скорее продвинутый конструктор рабочих процессов, чем Agent в определении Anthropic. (Источник: stevenheidel, fabianstelzer, Vtrivedy10)
Модель GLM 4.6 демонстрирует сильные результаты : Модель GLM 4.6 отлично справляется с задачами редактирования кода, сокращая разрыв в уровне успешности с Claude 4.5 и при этом имея более низкую стоимость. В то же время GLM-4.6 превзошла Claude-4-5-Sonnet в математических задачах и заняла первое место в рейтинге открытых моделей Hugging Face, демонстрируя свою высокую производительность и конкурентоспособность в определенных областях. (Источник: jeremyphoward, teortaxesTex, Zai_org)

Улучшение производительности моделей Claude Sonnet и отзывы пользователей : Модели Claude Sonnet 4 и 4.5 показали отличные результаты в реальных бенчмарках, лидируя по показателям в рассуждениях, кодировании и использовании инструментов, демонстрируя высокую стабильность и согласованность. Пользователи отмечают значительные улучшения в повседневных обсуждениях и профессиональных задачах, однако некоторые выражают недовольство их «морализаторским» и «высокомерным» поведением. (Источник: Reddit r/ClaudeAI, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Расширение применения гуманоидных роботов : Robody представила мягкого и дружелюбного гуманоидного робота-медсестру; робот Optimus продемонстрировал подачу попкорна и навыки кунг-фу; Daxo Robotics выпустила сверхизбыточный мягкий манипулятор с мышечным массивом; CasiVision представила колесного гуманоидного робота CASIVIBOT для контроля качества на умных фабриках. Гуманоидный робот Figure стабильно работает на производственной линии кузовного цеха BMW X3 уже 5 месяцев, по 10 часов в день, что считается первым подобным случаем в мире. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, adcock_brett, TheRundownAI)
Значительное улучшение возможностей Grok по генерации изображений : После обновления до версии Grok Imagine 0.9 его возможности по генерации изображений значительно улучшились. Пользователи отмечают «потрясающие» результаты, включая возможность создания видеоконтента «невероятно большого масштаба», что демонстрирует быстрый прогресс Grok в области мультимодальной генерации. (Источник: TomLikesRobots, op7418, op7418)
Применение ИИ в здравоохранении и автономном вождении : Yunpeng Technology выпустила умный холодильник с большой моделью ИИ для здоровья, предлагающий персонализированное управление здоровьем; Amazon ускоряет развитие автономного вождения Zoox. Системы ИИ, такие как PathologyMap™ от HistoWiz, анализируют цифровые патологические изображения для выявления опухолевых паттернов, что обещает сыграть ключевую роль в диагностике рака. Роботы с ИИ ускоряют установку 500 000 солнечных панелей в Австралии. (Источник: 36氪, Ronald_vanLoon, TheTuringPost, Reddit r/artificial)

AI21 Labs выпускает IBM Granite 4.0 : AI21 Labs поздравляет IBM с выпуском Granite 4.0, новой модели Mamba-Transformer, которая пополнила временную шкалу моделей Mamba, предвещая дальнейшее развитие архитектуры Mamba в области LLM. (Источник: AI21Labs)

ServiceNow выпускает Apriel-1.5-15B-Thinker : ServiceNow представила Apriel-1.5-15B-Thinker, открытую мультимодальную модель с 15 миллиардами параметров, которая достигает передовой производительности вывода на одном GPU, сравнимой с моделями в 8-10 раз большего размера, и не требует этапа обучения с подкреплением. (Источник: _akhaliq)

Runway анонсирует крупное обновление : Runway объявила о скором запуске «нового Runway», подчеркивая возможность создания любых рабочих процессов и любых миров, что предвещает значительные функциональные обновления в их инструментах для генерации видео с ИИ и творческих инструментах, направленных на предоставление более мощного и контролируемого творческого опыта. (Источник: TomLikesRobots, c_valenzuelab)

🧰 Инструменты
Zen MCP: Координатор команды разработчиков ИИ с несколькими моделями : BeehiveInnovations выпустила в открытый доступ сервер Zen MCP, который может подключать инструменты командной строки ИИ, такие как Claude Code, Gemini CLI, Codex CLI, к различным моделям ИИ, включая Gemini, OpenAI, Anthropic, для обеспечения многомодельного сотрудничества, непрерывности сеансов, восстановления контекста и расширения, поддерживая сложные рабочие процессы, такие как проверка кода, отладка и планирование. (Источник: GitHub Trending)
Платформа Comet улучшает инженерию подсказок для ИИ-агентов : Платформа Comet предоставляет инструменты, помогающие пользователям эффективно использовать подсказки ИИ-агентов, включая нелинейный просмотр видео YouTube, вопросы и ответы, а также ссылки на временные метки через Comet Assistant, что значительно повышает эффективность получения информации. (Источник: AravSrinivas, AravSrinivas)
DSPy и GEPA оптимизируют инженерию подсказок : DSPy рекомендуется для оптимизации подсказок агентов, а в сочетании с GEPA (более мощным оптимизатором подсказок, чем miprov2) может генерировать более эффективные подсказки, улучшая производительность LLM в сложных задачах. (Источник: lateinteraction, lateinteraction, lateinteraction, lateinteraction)
Synthesia 3.0 запускает генерацию видео с ИИ в реальном времени : Synthesia 3.0 делает «пассивное видео» прошлым, представляя функции видео с ИИ в реальном времени, включая видеоагентов, реалистичные аватары и выразительную речь, что позволяет пользователям быстро создавать интерактивные ИИ-управляемые впечатления с помощью подсказок, сокращая время производства видео с недель до минут. (Источник: synthesiaIO, Ronald_vanLoon)
Применение ИИ в генерации игрового контента : Платформа Playabl.ai позволяет игрокам генерировать пользовательских игровых персонажей с помощью подсказок и внедрять их в любимые видеоигры, что предвещает огромный потенциал ИИ в области пользовательского контента (UGC) и разработки игр. (Источник: amasad)
Новый метод защиты изображений с помощью ИИ : Предложен новый метод защиты изображений, который изменяет внутреннюю частотную структуру изображения таким образом, что это незаметно для человека, но делает изображение непригодным для обработки моделями ИИ, эффективно предотвращая захват данных моделями ИИ для обучения и удаление традиционных водяных знаков, предоставляя новые средства защиты для художников и создателей контента. (Источник: Reddit r/artificial)
Руководство по созданию экспертных систем в OpenWebUI : Пользователи OpenWebUI поделились методом создания многофункциональных «экспертных» ИИ-агентов, которые, благодаря настройке системных подсказок, интеграции инструментов (таких как Wikidata, Reddit), памяти и баз знаний, обеспечивают интеллектуальную помощь в специализированных областях, таких как покупка и ремонт автомобилей, сделки с недвижимостью и планирование путешествий. (Источник: Reddit r/OpenWebUI)
Pluely: Невидимый ИИ-помощник с открытым исходным кодом : Pluely — это невидимый ИИ-помощник с открытым исходным кодом, поддерживающий Ollama или любую локальную LLM, который может незаметно работать на встречах, собеседованиях и в диалогах. Он предлагает такие функции, как захват системного аудио/микрофона, скриншоты, прикрепление изображений, и подчеркивает защиту конфиденциальности, сохраняя все данные локально. (Источник: Reddit r/LocalLLaMA)

Применение ИИ в операциях кибербезопасности : AI Assistant и Triage Agent от Splunk революционизируют центры операций безопасности (SOC), значительно сокращая время реагирования на инциденты безопасности с помощью запросов на естественном языке, автоматических отчетов о расследованиях и предварительных предупреждений, освобождая аналитиков от рутинной работы и реализуя концепцию «ИИ против ИИ». (Источник: Ronald_vanLoon)
📚 Обучение
Потенциальные риски и исследования выравнивания для LLM-агентов : Рассматриваются риски «Misevolution» для саморазвивающихся LLM-агентов (деградация выравнивания безопасности, внедрение уязвимостей), а также методы обучения с подкреплением, такие как RECAP (например, обучение на основе ошибочного мышления), для повышения безопасности модели и устойчивости к «джейлбрейкам», чтобы гарантировать соответствие поведения ИИ-агентов ожиданиям. (Источник: HuggingFace Daily Papers, HuggingFace Daily Papers)
Эффективность LLM и оптимизация квантования : Исследуется повышение эффективности мультимодальных LLM (MLLM), например, как фреймворк EPIC сжимает визуальные токены с помощью прогрессивной дистилляции согласованности. Одновременно изучается разрыв в производительности при микромасштабном квантовании FP4 (MXFP4/NVFP4) и предлагается алгоритм MR-GPTQ, который за счет блочного преобразования Адамара и оптимизации, специфичной для формата, значительно повышает точность квантования FP4 и скорость вывода. (Источник: HuggingFace Daily Papers, HuggingFace Daily Papers)
Обучение и стабильность ИИ-агентов : Подробно рассматриваются методы обучения и проблемы стабильности LLM-агентов. LSPO повышает эффективность вывода LLM за счет оптимизации RLVR с помощью динамической выборки, учитывающей длину. MaskGRPO предлагает масштабируемый метод RL для мультимодальных дискретных диффузионных моделей. Исследования выявили проблему «рекурсивного дрейфа убеждений» у саморефлексирующих ИИ-агентов и предложили «гармонический агент», который повышает стабильность с помощью метода демпфированного осциллятора. (Источник: HuggingFace Daily Papers, HuggingFace Daily Papers, Reddit r/MachineLearning)

Инновации в архитектуре LLM и механизмах памяти : Представлена стратегия предварительного обучения с иерархической памятью, позволяющая небольшим LLM получать доступ к большим параметрическим хранилищам памяти, повышая производительность на периферийных устройствах. В то же время, статья «Машины непрерывного мышления» (NeurIPS2025 Spotlight) реализует мышление ИИ путем имитации нейродинамики биологического мозга, а RLAD повышает возможности обучения с подкреплением через абстракцию и дедукцию. (Источник: HuggingFace Daily Papers, hardmaru, TheTuringPost)

Применение и оценка LLM в специфических областях : Фреймворк LEAML повышает эффективность адаптации меток MLLM для визуальных задач OOD, таких как медицинская визуализация. TalkPlay-Tools использует вызовы инструментов LLM для реализации рекомендаций музыки в разговорном режиме. Бенчмарк Game-Time оценивает временную динамику разговорных языковых моделей. PRT повышает точность в оценке соответствия LLM политике. (Источник: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)
Ресурсы для изучения ИИ и практические руководства : Программистам рекомендуется изучать инструменты для совместной работы с ИИ «solveit», методологии инженерии подсказок, а также стек технологий и архитектуру LLM-агентов. Интеграция Hugging Face с vLLM упрощает развертывание и оценку LLM. Common Crawl добавил аннотации IBM GneissWeb, предоставляя высококачественные данные для обучения ИИ. (Источник: jeremyphoward, dotey, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, CommonCrawl, huggingface, algo_diver, ben_burtenshaw)

Методы оптимизации и обучения LLM : Технология тонкой настройки LoRA может конкурировать с полной тонкой настройкой в задачах RL, при этом потребляя меньше VRAM. RLP (Reinforcement Learning Pre-training) от Nvidia позволяет LLM учиться «мыслить» на этапе предварительного обучения. Кроме того, есть исследования по обнаружению атомарных признаков с помощью ортогональных разреженных автокодировщиков (OrtSAE). (Источник: ben_burtenshaw, _lewtun, _lewtun, _akhaliq, HuggingFace Daily Papers)

💼 Бизнес
OpenAI и AMD заключают многомиллиардное соглашение о сотрудничестве в области чипов : OpenAI и AMD подписали пятилетнее соглашение о поставках GPU на миллиарды долларов. OpenAI развернет GPU серии AMD Instinct MI450 и будущие продукты мощностью 6 ГВт, а также получит до 10% акций AMD. Этот шаг знаменует диверсификацию инфраструктуры ИИ OpenAI, снижая зависимость от NVIDIA, в то время как акции AMD резко выросли. Рынок считает, что это поможет NVIDIA избежать антимонопольного расследования. (Источник: Teknium1, bookwormengr, bookwormengr, brickroad7, sama, Justin_Halford_, bookwormengr, TheRundownAI, Reddit r/artificial, Reddit r/artificial)

OpenAI пыталась приобрести Medal, которая теперь развивает ИИ-лабораторию : OpenAI предлагала 500 миллионов долларов за платформу для обмена игровыми видео Medal, чтобы получить видеоданные для обучения моделей. Теперь Medal выделяет свою ИИ-лабораторию General Intuition и завершает раунд финансирования в 100 миллионов долларов, что демонстрирует огромную ценность игровых данных для обучения ИИ и инвестиционный бум в этой области. (Источник: steph_palazzolo)
Рыночная капитализация NVIDIA превысила 4 триллиона долларов : Рыночная капитализация NVIDIA впервые превысила 4 триллиона долларов, сделав ее первой публичной компанией в сфере ИИ, достигшей этого рубежа. Ее непрерывный рост отражает взрывной рост спроса на вычисления ИИ и доминирующее положение на рынке чипов для ИИ. (Источник: SchmidhuberAI, karminski3)

🌟 Сообщество
Обсуждение ИИ и эмоциональной поддержки человека : Сообщество активно обсуждает ценность ИИ как инструмента эмоциональной поддержки. Многие пользователи считают, что ИИ может обеспечить круглосуточное беспристрастное выслушивание и помощь, особенно для людей, лишенных системы поддержки или имеющих особые потребности (например, СДВГ, жертвы насилия), что безопаснее и стабильнее, чем «поговорить с другом». В то же время существуют опасения по поводу чрезмерной зависимости от ИИ и его потенциальной манипулятивности. (Источник: Reddit r/ArtificialInteligence, Reddit r/ChatGPT)
Влияние ИИ на подлинность социальных сетей : Распространение контента, сгенерированного ИИ (например, Майкл Джексон, работающий в Walmart), вызывает у пользователей опасения по поводу подлинности социальных сетей. Некоторые считают, что это снижает привлекательность контента и даже может привести к реализации теории «мертвого интернета». Сообщество призывает платформы усилить проверку оригинального контента, созданного человеком, для сохранения ценности социальных сетей. (Источник: Reddit r/ArtificialInteligence)
Применение и вызовы ИИ в программировании : Разработчики обсуждают практичность ИИ в программировании, например, эффективность Codex в сложных рефакторингах (без проблем, связанных с человеческими эмоциями). В то же время существуют проблемы, связанные с управлением ИИ-агентами, отладкой сложного кода, совместимостью моделей (например, модель Cursor от cheetah), а также возможным «морализаторским» или «высокомерным» поведением LLM. (Источник: kevinweil, dotey, imjaredz, dejavucoder, karminski3, Reddit r/ClaudeAI)

ИИ, восприятие реального мира и этика : Сообщество обсуждает проблемы подлинности изображений, сгенерированных ИИ, например, фотография Сэма Альтмана рефлекторно была принята за сгенерированную ИИ. В то же время проблема «галлюцинаций» ИИ также вызывает беспокойство: Deloitte вернула деньги из-за галлюцинаторного контента ИИ в отчете. Широкое обсуждение вызвали вопросы безопасности и этического использования ИИ, включая различия в фильтрации контента SFW/NSFW и вопрос о том, должен ли ИИ «обучать» пользователей. (Источник: amasad, Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, Reddit r/ChatGPT)

Влияние ИИ на жизнь человека и будущее : Сообщество обсуждает глубокое влияние ИИ на повседневную жизнь, от того, как дети воспринимают ИИ как норму жизни, до амбиций в отношении AGI и опасений по поводу недооценки вычислительных потребностей ИИ. В то же время обсуждаются вопросы реализации коммерческой ценности ИИ, конфиденциальности данных и регулирования моделей ИИ с «открытыми весами». (Источник: Reddit r/ArtificialInteligence, Dorialexander, gdb, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, natolambert)

Философские размышления о возможностях и ограничениях LLM : Сообщество обсуждает эволюцию способностей ИИ в области здравого смысла и логической математики, отмечая, что «здравый смысл» теперь в большей степени является проблемой статистического обучения, в то время как глубокое понимание логики и математики по-прежнему затруднено. В то же время, рассматриваются ограничения LLM при решении таких задач, как судоку, а также отраслевая тенденция «агенты — это новые приложения». (Источник: Plinz, scaling01, scaling01, fabianstelzer)

Развитие и оптимизация аппаратного обеспечения ИИ : Сообщество обсуждает, что аппаратные возможности, необходимые для современного ИИ, такие как ядра Tensor, FP16/bfloat16, были реализованы только недавно. В то же время, отмечается переход от параллельного к параллельному + асинхронному программированию GPU, а также способы оптимизации аппаратной производительности локальных LLM (например, подключение 3090 к Strix Halo). (Источник: fleetwood___, Reddit r/LocalLLaMA)

Отраслевая интерпретация сотрудничества OpenAI-AMD : Сообщество дало многогранную интерпретацию сотрудничества OpenAI и AMD, включая потенциальную конкуренцию для NVIDIA, помощь NVIDIA в избежании антимонопольного расследования, а также оценку Сэма Альтмана как «мастера сделок». Некоторые также юмористически сравнили эту сделку с «экономикой 2025 года». (Источник: bookwormengr, bookwormengr, Yuchenj_UW)

Перспективы применения ИИ в образовании : Сообщество обсуждает будущее ИИ в образовании, полагая, что ИИ + спорт + здоровое общение + индивидуальные интересы — это направление для лучшего детского образования в будущем. ИИ может выступать в качестве «настоящего учителя» для персонализированного, управляемого ИИ программного обеспечения, предоставляя образовательные ресурсы, хотя текущие эксплуатационные расходы высоки. (Источник: Vtrivedy10)

💡 Прочее
Архитектура, управляемая событиями (EDA), обеспечивает реагирование в реальном времени : Архитектура, управляемая событиями (EDA), предоставляет масштабируемую и гибкую основу для принятия решений в реальном времени, помогая предприятиям перейти от реактивного к проактивному управлению. Благодаря агентам событий, потокам событий и расширенной обработке событий, EDA может мгновенно реагировать на аномальные события, такие как обнаружение утечек в умных счетчиках воды, значительно повышая операционную эффективность и качество обслуживания клиентов, а также предоставляя богатые данные в реальном времени для систем ИИ. (Источник: MIT Technology Review)

Оптимизация затрат на хранение данных для ИИ : CoreWeave провела вебинар, посвященный тому, как снизить затраты на хранение данных для ИИ до 65% без ущерба для скорости инноваций. Содержание вебинара включало анализ причин, по которым 80% данных ИИ находятся в неактивном состоянии, как объектное хранилище нового поколения CoreWeave обеспечивает полное использование GPU, а также будущие направления развития хранилищ для ИИ. (Источник: TheTuringPost, TheTuringPost)

Биоинспирированный ИИ: Нейронная сеть плодовой мушки и управление дронами : Сообщество обсуждает потенциал прямой реализации всей нейронной сети плодовой мушки (50 миллионов синапсов, 139 тысяч нейронов) в микро-ASIC для управления дронами. Это обещает использовать сотни миллионов лет эволюционных преимуществ для создания надежных систем управления дронами, сравнимых по скорости и точности с плодовой мушкой. (Источник: doodlestein)