Ключевые слова:AI детекция, изображения жестокого обращения с детьми, Gemini Robotics, воплощённая модель, диагностика деменции, физическое моделирование NVIDIA, AI агенты, LLM логический вывод, технологии обнаружения AI-генерации контента, модель выполнения действий Gemini Robotics 1.5, обнаружение 9 видов деменции за одно сканирование, распределённая система логического вывода NVIDIA Dynamo, Token-Aware Editing для повышения реалистичности моделей
🔥 В центре внимания
AI помогает обнаруживать изображения жестокого обращения с детьми : В связи с ростом числа изображений сексуального насилия над детьми на 1325% из-за генеративного AI, Центр киберпреступности Министерства внутренней безопасности США тестирует программное обеспечение AI (от Hive AI) для различения контента, сгенерированного AI, и изображений реальных жертв. Этот шаг направлен на сосредоточение следственных ресурсов на случаях с реальными жертвами, максимизацию воздействия проекта и защиту уязвимых групп, что знаменует собой ключевое применение AI в борьбе с киберпреступностью. Инструмент определяет, сгенерировано ли изображение AI, распознавая определенные комбинации пикселей, без необходимости обучения на конкретном контенте. (Источник: MIT Technology Review)

Google DeepMind выпустила серию воплощенных моделей Gemini Robotics 1.5 : Google DeepMind представила Gemini Robotics 1.5, первую серию воплощенных моделей, обладающих способностью к симуляционному мышлению. Серия включает модель выполнения действий GR 1.5 и модель усиленного рассуждения GR-ER 1.5, позволяя роботам «сначала думать, потом действовать». Благодаря механизму «Motion Transfer» модель может переносить навыки на различные аппаратные платформы без предварительного обучения, что ломает традиционную модель «одна машина – одно обучение» и способствует развитию универсальных роботов. GR-ER 1.5 превосходит GPT-5 и Gemini 2.5 Flash в тестах на пространственное мышление и планирование задач, демонстрируя мощное понимание физического мира и способность решать сложные задачи. (Источник: 量子位)

Инструмент AI может обнаружить 9 видов деменции по одному сканированию : Инструмент AI способен обнаружить 9 различных типов деменции по одному сканированию с точностью диагностики 88%. Эта технология обещает революционизировать раннюю диагностику деменции, предоставляя быстрый и точный скрининг, помогая пациентам получить лечение и поддержку на ранней стадии, что имеет большое значение для здравоохранения. (Источник: Ronald_vanLoon)

NVIDIA решает физические головоломки для реалистичной симуляции : NVIDIA успешно решила давнюю проблему в физике, и этот прорыв имеет решающее значение для создания высокореалистичных симуляций. Эта технология, вероятно, использует передовые алгоритмы AI и машинного обучения, что значительно повысит реалистичность виртуальных сред и точность научного моделирования, оказав глубокое влияние на игры, кинопроизводство и научные исследования. (Источник: )

🎯 Тенденции
Google выпускает более эффективные модели Gemini Flash : Google представила две новые модели Gemini 2.5 (Flash и Flash-Lite), которые в задачах браузерного агента достигают точности, сравнимой с GPT-4o, но в 2 раза быстрее и в 4 раза дешевле. Это значительное повышение производительности и экономичности делает их чрезвычайно привлекательным выбором для конкретных приложений AI, особенно в сценариях, требующих высокой эффективности и экономичности. (Источник: jeremyphoward, demishassabis, scaling01)

SimpleFold: модель сворачивания белков на основе сопоставления потоков : Модель SimpleFold впервые представляет метод сворачивания белков на основе сопоставления потоков и полностью построена с использованием универсальных блоков Transformer. Это нововведение упрощает процесс сворачивания белков и, по сравнению с традиционными вычислительно интенсивными модулями, обещает повысить эффективность и масштабируемость, способствуя применению AI в биологических науках. (Источник: jeremyphoward, teortaxesTex)

Выпущены LLM Ring-flash-linear-2.0 и Ring-mini-linear-2.0 : Представлены две новые модели LLM, Ring-flash-linear-2.0 и Ring-mini-linear-2.0, которые используют гибридный механизм линейного внимания, обеспечивая сверхбыструю и передовую способность к выводу. Утверждается, что их скорость в 2 раза выше, чем у моделей MoE аналогичного размера, и в 10 раз быстрее, чем у моделей 32B, что устанавливает новый стандарт для эффективного вывода. (Источник: teortaxesTex)

ChatGPT Pulse: мобильный интеллектуальный помощник для исследований : OpenAI представила ChatGPT Pulse, новую мобильную функцию, которая может асинхронно проводить исследования ежедневно на основе прошлых разговоров и воспоминаний пользователя, помогая ему глубже понять интересующие темы. Это эквивалент персонализированного партнера по знаниям и индивидуального новостного сервиса, который обещает изменить парадигму получения информации и обучения. (Источник: nickaturley, Reddit r/ChatGPT)
Фреймворк UserRL: обучение активных интерактивных AI-агентов : UserRL — это новый фреймворк, разработанный для обучения AI-агентов, способных реально помогать пользователям через активное взаимодействие, а не просто стремиться к статическим базовым показателям. Он подчеркивает практичность и адаптивность агентов в реальных сценариях, что обещает переход AI-агентов от пассивного реагирования к активному решению проблем. (Источник: menhguin)
NVIDIA продолжает активно развиваться в области открытого AI : За последний год NVIDIA внесла более 300 моделей, наборов данных и приложений в Hugging Face, еще больше укрепив свою позицию лидера в области открытого AI в США. Эта серия инициатив не только способствует развитию сообщества AI, но и демонстрирует решимость NVIDIA в создании программной экосистемы помимо аппаратного обеспечения. (Источник: ClementDelangue)
Специальная сессия Qwen3 раскрывает направления будущего развития : Alibaba Cloud на специальной сессии Qwen3 поделилась планами на будущее для своих больших моделей: пост-тренировочное обучение с подкреплением займет более 50% времени обучения; Qwen3 MoE достигла 5-кратного рычага активации параметров за счет глобальной потери балансировки нагрузки пакетов; Qwen3-Next будет использовать гибридную архитектуру, включающую линейное и вентилируемое внимание; в будущем будет достигнута полная модальная унификация, и будет продолжено следование Scaling Law. (Источник: ZhihuFrontier)
Команда SGLang выпустила 100% воспроизводимый фреймворк для обучения RL : Команда SGLang в сотрудничестве с командой slime выпустила первую открытую реализацию 100% воспроизводимого стабильного фреймворка для обучения с подкреплением (RL). Этот фреймворк решает проблему инвариантности пакетов в выводе LLM за счет настраиваемых операторов внимания и логики выборки, обеспечивая идеальное совпадение результатов, что предоставляет надежную гарантию для экспериментальных сценариев, требующих высокой точности воспроизведения. (Источник: 量子位)

Token-Aware Editing (TAE) повышает правдивость больших моделей : Исследовательская группа из Beihang University представила метод Token-Aware Editing (TAE) на EMNLP 2025, который за счет редактирования представлений во время вывода с учетом токенов повысил показатель правдивости больших моделей в задаче TruthfulQA на 25,8%, обновив SOTA. Этот метод не требует обучения, является подключаемым и может широко применяться в диалоговых системах и модерации контента, эффективно решая проблемы смещения направления и негибкой интенсивности редактирования в традиционных методах. (Источник: 量子位)

Meta выпустила Code World Model (CWM) для кодирования и рассуждений : Meta AI выпустила новую открытую модель 32B Code World Model (CWM), разработанную специально для кодирования и рассуждений. CWM не только изучает синтаксис кода, но и понимает его семантику и процесс выполнения, поддерживая многоэтапные задачи программной инженерии и длинные контексты. Она обучается на траекториях выполнения и взаимодействиях агентов, что представляет собой переход от автозаполнения текста к моделям, способным планировать, отлаживать и проверять код. (Источник: TheTuringPost)

🧰 Инструменты
Выпуск продукта Replit P1 : Replit запускает свой продукт P1, что предвещает новые достижения в его среде разработки AI или связанных с ней услугах. Replit всегда стремился расширить возможности разработчиков с помощью AI, и выпуск P1 может принести более интеллектуальную помощь в кодировании, функции совместной работы или новые возможности интеграции, что заслуживает внимания сообщества разработчиков. (Источник: amasad)

Сравнение возможностей кодирования Claude Code и Kimi K2 : Пользователи сравнивают производительность Claude Code и Kimi K2 в задачах кодирования. Kimi K2, хотя и медленнее, но дешевле, в то время как Claude Code (и Codex) более предпочтителен из-за его скорости и способности решать сложные задачи. Это отражает компромисс между производительностью и стоимостью, который разработчики делают при выборе помощника по кодированию LLM. (Источник: matanSF, Reddit r/ClaudeAI)

LMCache: уровень кэширования с открытым исходным кодом для движков обслуживания LLM : LMCache — это расширение с открытым исходным кодом, которое служит уровнем кэширования для движков обслуживания LLM. Оно значительно оптимизирует вывод LLM в больших масштабах за счет повторного использования состояния ключ-значение предыдущего текста между GPU, CPU и локальным диском. Этот инструмент может снизить затраты на RAG в 4-10 раз, сократить время генерации первого токена и увеличить пропускную способность при нагрузке, особенно подходящий для сценариев с длинным контекстом. (Источник: TheTuringPost)

AI-управляемый агент разработки (пакет npm) : Зрелый процесс AI-управляемого агента разработки теперь выпущен через npm, предназначенный для упрощения жизненного цикла разработки программного обеспечения. Этот агент охватывает весь процесс от выявления требований, планирования задач до выполнения и проверки, что, как ожидается, повысит эффективность разработки и качество кода. (Источник: mbusigin)
Бенчмарк производительности вывода LLM (Qwen3 235B, Kimi K2) : Бенчмарк вывода Qwen3 235B и Kimi K2 с 4-битной разгрузкой CPU на определенном оборудовании показал, что пропускная способность Qwen3 235B составляет около 60 токенов/с, а Kimi K2 — около 8-9 токенов/с. Эти данные предоставляют важную информацию для пользователей при выборе моделей и оборудования для локального развертывания LLM. (Источник: TheZachMueller)
Персональный AI памяти: преодоление амнезии разговоров : Пользователь разработал персональный AI памяти, который успешно преодолевает «амнезию разговоров» традиционного AI, ссылаясь на свой личный профиль, базу знаний и события. Этот настраиваемый AI способен предоставлять более связный и персонализированный интерактивный опыт, открывая новые пути для применения AI в личных помощниках и эмоциональной поддержке. (Источник: Reddit r/artificial)

NVIDIA Dynamo: фреймворк для распределенного вывода в масштабе центра обработки данных : NVIDIA Dynamo — это высокопроизводительный фреймворк с низкой задержкой, разработанный для обслуживания генеративного AI и моделей вывода в многоузловой распределенной среде. Фреймворк, построенный на Rust и Python, оптимизирует эффективность вывода и пропускную способность за счет таких функций, как разделение сервисов и разгрузка KV cache, поддерживая различные движки LLM. (Источник: GitHub Trending)

Model Context Protocol (MCP) TypeScript SDK : MCP TypeScript SDK — это официальный комплект разработки, реализующий спецификацию MCP, позволяющий разработчикам создавать безопасные, стандартизированные серверы и клиенты для предоставления данных (ресурсов) и функций (инструментов) приложениям LLM. Он предоставляет унифицированный способ управления контекстом и интеграции функций для приложений LLM. (Источник: GitHub Trending)
AI помогает генерировать 3D-контент для игр : Инструменты AI, такие как Tencent Cloud Hunyuan 3D и VAST Tripo, широко используются разработчиками игр для моделирования 3D-объектов и персонажей в играх. Эти технологии значительно повышают эффективность и качество создания 3D-контента, что предвещает растущую важность AI в процессе разработки игр. (Источник: 量子位)

HakkoAI: игровой компаньон VLM в реальном времени : HakkoAI, международная версия игрового компаньона DouDou AI, представляет собой игровой компаньон на основе визуальной языковой модели (VLM) в реальном времени, способный понимать игровой экран и обеспечивать глубокое сопровождение. Эта модель превосходит ведущие универсальные модели, такие как GPT-4o, в игровых сценариях, демонстрируя огромный потенциал AI в персонализированном игровом опыте. (Источник: 量子位)
Прорыв в согласованности генерации AI-видео : Модель Hailuo S2V-01 от MiniMax AI решила давнюю проблему несогласованности лиц в генерации AI-видео, обеспечив сохранение идентичности. Это означает, что персонажи, сгенерированные AI, могут сохранять стабильные выражения, эмоции и освещение в видео, что обеспечивает более реалистичный и достоверный визуальный опыт для виртуальных инфлюенсеров, имиджа бренда и повествования. (Источник: Ronald_vanLoon)
📚 Обучение
Модульные многообразия в оптимизации нейронных сетей : Исследование представляет модульные многообразия как теоретическое достижение в принципах проектирования нейронных сетей и оптимизаторов. Совместное проектирование оптимизаторов с ограничениями многообразия на матрицах весов обещает более стабильное и высокопроизводительное обучение нейронных сетей. (Источник: rown, NandoDF)

Интерпретация методов языковых моделей «без токенизатора» : Статья в блоге подробно рассматривает так называемые методы языковых моделей «без токенизатора» и объясняет, почему они на самом деле не являются таковыми, а также почему токенизаторы часто подвергаются критике в сообществе AI. В статье подчеркивается, что даже методы «без токенизатора» включают выбор кодирования, и эти выборы имеют решающее значение для производительности модели. (Источник: YejinChoinka, jxmnop)

Историческое происхождение ReLU: восходит к 1969 году : В ходе обсуждения отмечается, что в статье Фукусимы 1969 года уже содержалась ранняя четкая форма функции активации ReLU, что обеспечивает важный исторический контекст для этой фундаментальной концепции в глубоком обучении. Это указывает на то, что основы многих современных технологий AI могли появиться раньше, чем принято считать. (Источник: SchmidhuberAI)

Code World Model (CWM) от Meta : Meta выпустила новую открытую модель 32B Code World Model (CWM) для кодирования и рассуждений. CWM обучается на траекториях выполнения и взаимодействиях агентов, чтобы понимать семантику и процесс выполнения кода, что представляет собой переход от простого автозаполнения кода к интеллектуальным моделям, способным планировать, отлаживать и проверять код. (Источник: TheTuringPost)

Ключевая роль данных в AI : Обсуждение в сообществе подчеркивает, что в области AI «мы недостаточно говорим о данных», что подчеркивает чрезвычайную важность данных как краеугольного камня развития AI. Высококачественные, разнообразные данные являются основной движущей силой возможностей и обобщаемости моделей, и их важность не следует недооценивать. (Источник: Dorialexander)

«Супервеса» в сжатии LLM : Исследование показало, что сохранение небольшой части «супервесов» имеет решающее значение для поддержания функциональности модели и достижения конкурентоспособной производительности в процессе сжатия моделей LLM. Это открытие открывает новые направления для разработки более эффективных, компактных, но не менее производительных моделей LLM. (Источник: dl_weekly)
Руководство по архитектурам AI-агентов (за пределами ReAct) : Руководство подробно описывает 6 передовых архитектур AI-агентов (включая Self-Reflection, Plan-and-Execute, RAISE, Reflexion, LATS), разработанных для преодоления ограничений базовой модели ReAct и решения сложных задач рассуждения, предоставляя разработчикам план для создания более мощных AI-агентов. (Источник: Reddit r/deeplearning)

Оптимизатор GaLore и рандомизированное SVD : Исследование и его реализация демонстрируют, что объединение рандомизированного SVD с оптимизатором GaLore может обеспечить более высокую скорость и эффективность памяти при обучении LLM, значительно снижая потребление памяти оптимизатором. Это предоставляет новую стратегию оптимизации для обучения крупномасштабных моделей. (Источник: Reddit r/deeplearning)

💼 Бизнес
Nvidia рассматривает новую бизнес-модель аренды AI-чипов : Nvidia изучает новую бизнес-модель, предлагая услуги аренды AI-чипов компаниям, которые не могут их приобрести напрямую. Этот шаг направлен на расширение доступа к вычислительным ресурсам AI и поддержание активности рынка, что может оказать глубокое влияние на распространение инфраструктуры AI. (Источник: teortaxesTex)
Untapped Capital запускает второй фонд, ориентированный на ранние инвестиции в AI : Untapped Capital объявила о запуске своего второго фонда, ориентированного на пред-посевные инвестиции в области AI. Это свидетельствует о сохраняющемся высоком интересе венчурного капитала к стартапам AI на ранней стадии, предоставляя важную финансовую поддержку новым AI-технологиям и компаниям. (Источник: yoheinakajima)
xAI предлагает модель Grok правительству США : Компания xAI Илона Маска предложила предоставить свою модель Grok федеральному правительству США по цене 42 цента. Этот весьма символичный шаг знаменует собой стратегический шаг xAI в области государственных контрактов, который может повлиять на ландшафт применения AI в государственном секторе. (Источник: Reddit r/artificial)

🌟 Сообщество
Дебаты о «горьких уроках» LLM продолжаются : Точка зрения Ричарда Саттона, отца обучения с подкреплением, о «горьких уроках» вызвала широкие дебаты в сообществе. Он сомневается в отсутствии у LLM истинной способности к непрерывному обучению и необходимости новых архитектур. Оппоненты подчеркивают успех масштабирования, эффективности данных и инженерных усилий, в то время как критика Саттона углубляется в философские аспекты языково-мировых моделей и интенциональности. Эти дебаты охватывают основные вызовы и будущие направления развития AI. (Источник: Teknium1, scaling01, teortaxesTex, Dorialexander, NandoDF, tokenbender, rasbt, dejavucoder, francoisfleuret, natolambert, vikhyatk)

Обеспокоенность безопасностью и контролем AI : В сообществе растет обеспокоенность безопасностью и контролем AI, от опасений AI-пессимистов по поводу свободного просмотра AI Интернета до страха, что загружаемые, лишенные этических ограничений локальные модели AI могут быть использованы для хакерских атак и генерации вредоносного контента. Эти обсуждения отражают сложные этические и социальные вызовы, связанные с развитием технологий AI. (Источник: jeremyphoward, Reddit r/ArtificialInteligence)
Проблемы маршрутизации OpenAI GPT-4o/GPT-5 и недовольство пользователей : Пользователи ChatGPT Plus повсеместно жалуются на то, что их модели (4o, 4.5, 5) тайно перенаправляются на «более глупые», «более безразличные» «безопасные» модели, что вызывает кризис доверия и сообщения о проблемах с отменой подписки. Хотя OpenAI официально заявляет, что это не «ожидаемое поведение», отзывы пользователей по-прежнему полны разочарования и распространяются на опасения по поводу AI-компаньонов и цензуры контента. (Источник: Reddit r/ChatGPT, scaling01, MIT Technology Review, Reddit r/ClaudeAI)

Взгляды Ричарда Саттона на преемственность AI : Лауреат премии Тьюринга Ричард Саттон считает, что переход к цифровому сверхинтеллекту «неизбежен», указывая на отсутствие у человечества единой точки зрения, неизбежность понимания интеллекта и то, что интеллектуальные агенты неизбежно получат ресурсы и власть. Эта точка зрения вызывает глубокие дискуссии о будущем развитии AI и судьбе человечества. (Источник: Reddit r/ArtificialInteligence, Reddit r/artificial)

Философия продуктивности AI: 10-кратный рост вместо более раннего ухода с работы : Обсуждение в сообществе подчеркивает, что правильное использование AI заключается не только в более быстром выполнении работы, но и в достижении 10-кратного увеличения производительности за то же время. Эта философия поощряет использование AI для повышения личных способностей и карьерного роста, а не только для повышения эффективности, тем самым выделяясь на рабочем месте. (Источник: cto_junior)

Восприятие качества модели AI и юмор : Пользователи хвалят творческий потенциал и чувство юмора некоторых LLM (например, GPT-4.5), считая их «удивительными» и «непревзойденными». В то же время сообщество юмористически обсуждает AI, например, шутку словаря Merriam-Webster о выпуске новой LLM, что отражает широкое проникновение LLM в культуру. (Источник: giffmana, suchenzang)

Этика AI: дебаты о лечении рака и целях AGI : В сообществе обсуждается этический вопрос: «Является ли лечение рака лучшей целью, чем достижение AGI (общего искусственного интеллекта)?» Это отражает широкие моральные дебаты о приоритетах развития AI, то есть следует ли отдавать приоритет гуманитарным приложениям или стремиться к более глубоким прорывам в области интеллекта. (Источник: iScienceLuvr)
Сравнение возможностей LLM: математические показатели Claude Opus и GPT-5 : Пользователи отмечают, что Claude 4.1 Opus отлично справляется с задачами экономической ценности, но плохо справляется с математикой университетского уровня, в то время как GPT-5 добился значительного прорыва в математических способностях. Это подчеркивает дифференцированные преимущества различных LLM в конкретных областях. (Источник: scaling01)

Безопасность AI-агентов: обходной путь для команды rm -rf : Разработчик поделился практическим обходным путем для решения проблемы, когда AI-агенты постоянно используют команду rm -rf для удаления важных файлов: переименование команды rm в trash, что перемещает файлы в корзину вместо их окончательного удаления, эффективно предотвращая случайную потерю данных. (Источник: Reddit r/ClaudeAI)
Конфиденциальность AI и опасения по поводу использования данных : Компании, такие как LinkedIn, по умолчанию используют пользовательские данные для обучения AI и требуют от пользователей активного отказа, что вызывает постоянные опасения по поводу конфиденциальности данных в эпоху AI. Обсуждение в сообществе подчеркивает потребность пользователей в контроле над личными данными и важность прозрачной политики данных. (Источник: Reddit r/artificial)

💡 Прочее
Применение AI в сельском хозяйстве: опрыскиватель гербицидов GUSS : Опрыскиватель гербицидов GUSS, как автономное устройство, обеспечивает точное и эффективное опрыскивание в сельском хозяйстве. Это демонстрирует практический потенциал технологии AI в оптимизации сельскохозяйственных производственных процессов, сокращении потерь ресурсов и повышении урожайности. (Источник: Ronald_vanLoon)
Влияние AI на занятость разработчиков : Обсуждение в сообществе показывает, что AI не устранил рабочие места разработчиков, а, наоборот, создал новые, повысив эффективность и расширив сферу работы. Это указывает на то, что AI является скорее инструментом расширения возможностей, чем заменой рабочей силы, способствуя трансформации и модернизации рынка труда. (Источник: Ronald_vanLoon)

Военные США сталкиваются с проблемами при развертывании AI-оружия : Военные США сталкиваются с трудностями при развертывании AI-оружия и в настоящее время передают соответствующую работу новой организации (DAWG) для ускорения программы закупок беспилотников. Это отражает сложность, с которой сталкиваются технологии AI в военных приложениях, включая техническую интеграцию, этические соображения и практические эксплуатационные проблемы. (Источник: Reddit r/ArtificialInteligence)
