Ключевые слова:GPT-5, Саморазвитие ИИ, Воплощенный интеллект, Мультимодальная модель, Большая языковая модель, Обучение с подкреплением, ИИ-агент, Повышение производительности GPT-5, Роботизированная платформа Genie Envisioner, Предвзятость оценки найма LLM, Сверхдлинный контекст Qwen3, Проверка ответов CompassVerifier
🔥 В центре внимания
Выпуск GPT-5: Продуктивность и повышение производительности : OpenAI официально выпустила GPT-5, что знаменует собой новейшую итерацию ее флагманской модели. Основное внимание в этом выпуске уделяется улучшению пользовательского опыта за счет автоматического планирования базовых моделей и моделей глубокого вывода с помощью маршрутизатора в реальном времени, достигая баланса между скоростью и интеллектом. GPT-5 демонстрирует значительные улучшения в снижении галлюцинаций, повышении следования инструкциям и возможностях программирования, а также устанавливает новые рекорды в нескольких бенчмарках. Сэм Альтман сравнил его с «дисплеем Retina», подчеркнув его практичность как «AI уровня докторанта», а не просто прорыв в пределе интеллекта. Хотя технически он не достиг AGI, его более высокая скорость вывода и более низкие эксплуатационные расходы, как ожидается, будут способствовать широкому применению AI. (Источник: MIT Technology Review)

Прогресс в исследованиях самосовершенствования AI : Генеральный директор Meta Марк Цукерберг заявил, что компания работает над созданием систем AI, способных к самосовершенствованию. AI уже продемонстрировал способность к самосовершенствованию в нескольких аспектах, например, путем автоматического увеличения данных, поиска архитектуры моделей, обучения с подкреплением и других методов, постоянно оптимизируя свою производительность. Эта тенденция предвещает, что системы AI в будущем смогут автономно обучаться и превосходить установленные человеком границы производительности, что является ключевым путем к достижению более высокого уровня AI. (Источник: MIT Technology Review)

Genie Envisioner: Единая платформа мировой модели для манипуляций роботами : Исследователи представили Genie Envisioner (GE), единую базовую платформу мировой модели для манипуляций роботами. GE-Base — это модель диффузии видео, обусловленная инструкциями, способная захватывать пространственные, временные и семантические динамики реальных взаимодействий роботов. GE-Act отображает скрытые представления в исполняемые траектории действий, обеспечивая точный и универсальный вывод стратегий. GE-Sim, как нейронный симулятор, обусловленный действиями, поддерживает разработку стратегий с замкнутым циклом. Ожидается, что эта платформа обеспечит масштабируемую и практичную основу для универсального воплощенного интеллекта, управляемого инструкциями. (Источник: HuggingFace Daily Papers)
ISEval: Фреймворк для оценки способности больших мультимодальных моделей распознавать ошибочный ввод : Для решения проблемы способности больших мультимодальных моделей (LMMs) активно распознавать ошибочный ввод исследователи предложили фреймворк оценки ISEval. Этот фреймворк охватывает семь категорий ошибочных предпосылок и три показателя оценки. Исследование показало, что большинство LMMs с трудом активно обнаруживают текстовые дефекты без четких указаний и по-разному реагируют на различные типы ошибок. Например, они хорошо распознают логические ошибки, но плохо справляются с поверхностными языковыми ошибками и дефектами, обусловленными конкретными условиями. Это подчеркивает острую необходимость в активной проверке достоверности ввода для LMMs. (Источник: HuggingFace Daily Papers)
Исследование языковой предвзятости в оценке найма с помощью LLM : Исследование представило бенчмарк для оценки реакции больших языковых моделей (LLMs) на языковые дискриминационные маркеры в оценке найма. Благодаря тщательно разработанным симуляциям собеседований, исследование показало, что LLMs систематически наказывают определенные языковые паттерны, особенно расплывчатую речь, даже при одинаковом качестве контента. Это выявляет демографическую предвзятость в автоматизированных системах оценки, предоставляя базовую структуру для обнаружения и измерения языковой дискриминации в системах AI, что имеет широкое применение для справедливости автоматизированных решений. (Источник: HuggingFace Daily Papers)
🎯 Тенденции
Модели серии Qwen3 поддерживают сверхдлинный контекст до миллиона токенов : Модели Alibaba Cloud Qwen3-30B-A3B-2507 и Qwen3-235B-A22B-2507 теперь поддерживают сверхдлинный контекст до 1 миллиона токенов. Это стало возможным благодаря технологиям Dual Chunk Attention (DCA) и разреженного внимания MInference, которые не только улучшили качество генерации, но и увеличили скорость вывода для последовательностей почти в миллион токенов в 3 раза. Этот шаг значительно расширяет потенциал применения LLM в обработке сложных задач, таких как длинные документы и кодовые базы, а также совместим с vLLM и SGLang для эффективного развертывания. (Источник: Alibaba_Qwen)

Обновление Anthropic Claude Opus 4.1 и Sonnet 4 : Anthropic выпустила Claude Opus 4.1 и Sonnet 4, сосредоточившись на улучшении задач Agentic, кодирования в реальном мире и возможностей рассуждения. Новые модели обладают функцией «глубокого мышления», позволяющей гибко переключаться между режимами мгновенного ответа и глубокого вывода, сокращая выполнение сложных задач, занимающих часы, до минут. Это еще больше укрепляет позиционирование Claude в сценариях многомодельного сотрудничества, особенно выделяясь в сложных проверках кода и задачах высокого уровня рассуждения. (Источник: dl_weekly)
Microsoft запускает функцию Copilot 3D : Microsoft запустила бесплатную функцию Copilot 3D, которая может преобразовывать 2D-изображения в 3D-модели формата GLB, совместимые с различными 3D-просмотрщиками, инструментами дизайна и игровыми движками. Хотя в настоящее время функция плохо работает с изображениями животных и людей, она предоставляет пользователям удобную возможность преобразования 2D в 3D, что, как ожидается, будет полезно в таких областях, как дизайн продуктов и виртуальная реальность, дополнительно снижая барьер для создания 3D-контента. (Источник: The Verge)
HuggingFace Accelerate выпускает руководство по обучению на нескольких GPU : HuggingFace в сотрудничестве с Axolotl выпустила руководство Accelerate ND-Parallel, призванное упростить комбинацию и применение параллельных стратегий в обучении на нескольких GPU. Руководство подробно описывает такие стратегии, как параллелизм данных (DP), сегментированный параллелизм данных (FSDP), тензорный параллелизм (TP) и контекстный параллелизм (CP), а также предоставляет примеры конфигураций смешанного параллелизма, помогая разработчикам оптимизировать использование памяти и пропускную способность при обучении больших моделей и эффективно справляться с проблемами накладных расходов на связь в многоузловом обучении. (Источник: HuggingFace Blog)

🧰 Инструменты
OpenAI Codex CLI: Локальный кодирующий агент в терминале : OpenAI выпустила Codex CLI, легковесный кодирующий агент, работающий в локальном терминале. Пользователи могут установить его через npm install -g @openai/codex
или brew install codex
. Он поддерживает привязку к аккаунтам ChatGPT Plus/Pro/Team, позволяет бесплатно использовать новейшие модели, такие как GPT-5, а также оплачивать по мере использования через API Key. Codex CLI предлагает различные режимы песочницы, включая чтение-запись и только чтение, а также поддерживает настраиваемые конфигурации, призванные предоставить разработчикам эффективную и безопасную помощь в локальном программировании. (Источник: openai/codex — GitHub Trending)

HuggingFace AI Sheets: Инструмент для работы с наборами данных без кода : HuggingFace представила AI Sheets, инструмент с открытым исходным кодом без кода, предназначенный для создания, обогащения и преобразования наборов данных с использованием моделей AI. Интерфейс инструмента напоминает электронную таблицу, он поддерживает локальное развертывание или работу на Hugging Face Hub. Пользователи могут использовать тысячи открытых моделей (включая gpt-oss) для сравнения моделей, оптимизации подсказок, очистки данных, классификации, анализа и генерации синтетических данных, итеративно улучшать результаты генерации AI с помощью ручного редактирования и обратной связи в виде лайков, а также экспортировать их в Hub. (Источник: HuggingFace Blog)

Google Agent Development Kit (ADK) и его примеры : Google выпустила Agent Development Kit (ADK) — открытый, ориентированный на код инструментарий Python для создания, оценки и развертывания сложных AI Agent. ADK поддерживает богатую экосистему инструментов, модульные многоагентные системы и гибкое развертывание. Его библиотека примеров adk-samples
предоставляет различные примеры Agent, от диалоговых ботов до многоагентных рабочих процессов, призванные ускорить процесс разработки Agent и интегрироваться с протоколом A2A для удаленной связи между Agent. (Источник: google/adk-python — GitHub Trending & google/adk-samples — GitHub Trending)
Qwen Code CLI: Бесплатный инструмент для запуска кода : Alibaba Cloud Qwen Code CLI предоставляет 2000 бесплатных запусков кода в день, легко запускается командой npx @qwen-code/qwen-code@latest
. Инструмент поддерживает Qwen OAuth и предназначен для предоставления разработчикам удобного и эффективного опыта написания и тестирования кода. Команда Qwen заявила, что продолжит оптимизировать этот инструмент CLI и модель Qwen-Coder, стремясь достичь уровня производительности Claude Code, оставаясь при этом открытым исходным кодом. (Источник: Alibaba_Qwen)

📚 Обучение
Обновление библиотеки OpenAI Python : Официальная библиотека OpenAI Python предоставляет удобный доступ к OpenAI REST API, поддерживая Python 3.8+. Библиотека содержит определения типов для всех параметров запросов и полей ответов, а также предоставляет синхронные и асинхронные клиенты. Последние обновления включают бета-поддержку Realtime API для создания мультимодальных диалоговых систем с низкой задержкой, а также подробные описания проверки webhook, обработки ошибок, идентификаторов запросов и механизмов повторных попыток, что повышает эффективность разработки и надежность. (Источник: openai/openai-python — GitHub Trending)
Подборка AI Agent : e2b-dev/awesome-ai-agents
— это репозиторий GitHub, содержащий множество примеров и ресурсов автономных AI Agent. Этот список призван предоставить разработчикам централизованную библиотеку ресурсов, помогая им понять и изучить различные типы AI Agent, охватывающие широкий спектр сценариев применения, от простых до сложных, и является важным учебным материалом для исследования и создания AI Agent. (Источник: e2b-dev/awesome-ai-agents — GitHub Trending)
MeanFlow: Новая парадигма одношаговой генерации диффузионных моделей : Научное пространство предложило MeanFlow, новый метод, который, как ожидается, станет стандартом для ускоренной генерации диффузионных моделей. Этот метод направлен на достижение одношаговой генерации путем моделирования «средней скорости», а не «мгновенной скорости», преодолевая болевую точку медленной генерации традиционных диффузионных моделей. MeanFlow обладает четкими математическими принципами, может быть обучен с нуля с одной целью, а эффект одношаговой генерации близок к SOTA, предоставляя новые теоретические и практические направления для ускорения генеративных моделей AI. (Источник: WeChat)

Оптимизация полного жизненного цикла KV Cache для длинного контекста : Microsoft Research Asia поделилась практиками оптимизации полного жизненного цикла KV Cache, направленными на решение проблем задержки и хранения данных при выводе больших языковых моделей с длинным контекстом. Благодаря бенчмарку SCBench и предложенным методам, таким как MInference и RetrievalAttention, значительно снижается задержка на этапе Prefilling и уменьшается нагрузка на видеопамять KV Cache. Исследование подчеркивает системную оптимизацию между запросами и повторное использование Prefix Caching, предлагая решения для оптимизации масштабируемости и экономичности вывода LLM с длинным контекстом. (Источник: WeChat)

Фреймворк обучения с подкреплением FR3E повышает возможности исследования LLM : ByteDance, MAP и Манчестерский университет совместно предложили FR3E (First Return, Entropy-Eliciting Explore) — совершенно новый структурированный фреймворк исследования, призванный решить проблему недостаточного исследования LLM в обучении с подкреплением. FR3E, выявляя токены с высокой неопределенностью в траекториях вывода, направляет разнообразное развертывание, систематически перестраивает механизм исследования LLM, достигая динамического баланса между использованием и исследованием, и значительно превосходит существующие методы на нескольких бенчмарках математического вывода. (Источник: WeChat)

Исследование связи между максимальными значениями в механизме самовнимания и пониманием контекста : Новое исследование ICML 2025 показало, что в представлениях запросов (Q) и ключей (K) механизма самовнимания больших языковых моделей существуют высококонцентрированные максимальные значения, которые имеют решающее значение для понимания контекстных знаний. Исследование показало, что это явление широко распространено в моделях, использующих ротационное позиционное кодирование (RoPE), и проявляется уже на ранних слоях. Нарушение этих максимальных значений приводит к резкому снижению производительности модели в задачах, требующих понимания контекста, что открывает новые направления для проектирования, оптимизации и квантования LLM. (Источник: WeChat)

C3 Benchmark: Бенчмарк для тестирования двуязычных моделей голосового диалога (китайский-английский) : Пекинский университет и Tencent совместно выпустили C3 Benchmark — первый всеобъемлющий двуязычный (китайско-английский) оценочный бенчмарк для моделей разговорного диалога, который исследует сложные явления, такие как паузы, многозначные и омонимичные слова, ударения, синтаксическая неоднозначность и полисемия. Этот бенчмарк включает 1079 реальных сценариев и 1586 аудио-текстовых пар, призванных выявить критические недостатки текущих моделей голосового диалога и способствовать их прогрессу в понимании повседневной человеческой речи. (Источник: WeChat)

Chemma: Большая языковая модель для органического химического синтеза : Команда AI for Science Шанхайского университета Цзяотун выпустила большую модель химического синтеза Baiyulan (Chemma), впервые реализовав ускорение всего процесса органического синтеза с помощью большой химической языковой модели. Chemma не требует квантовых вычислений, полагаясь только на понимание химических знаний и способности к рассуждению, и превосходит существующие лучшие результаты в задачах одношагового/многошагового ретросинтеза, прогнозирования выхода/селективности и оптимизации реакций. Его фреймворк активного обучения «Co-Chemist» для человеко-машинного сотрудничества был успешно проверен в реальных реакциях, предоставляя новую парадигму для химических открытий. (Источник: WeChat)

Intern-Robotics: Полнофункциональный движок воплощенного интеллекта от Shanghai AI Lab : Shanghai AI Lab выпустила полнофункциональный движок воплощенного интеллекта Intern-Robotics, призванный приблизить «момент ChatGPT» в области воплощенного интеллекта. Этот движок представляет собой открытую и общедоступную инфраструктуру, ориентированную на достижение обобщения сущностей, обобщения сценариев, обобщения задач и подчеркивающую стремление к 100% успешности выполнения задач. Команда стремится решить проблему нехватки данных и постепенно достичь обобщения с нулевым числом примеров, ускоряя практическое применение воплощенного интеллекта, используя технический маршрут «Real to Sim to Real» и обучение с подкреплением в реальном мире. (Источник: WeChat)

SQLM: Фреймворк эволюции способности AI к рассуждению через самовопросы и самоответы : Команда Университета Карнеги-Меллона предложила SQLM — фреймворк самовопросов, не требующий внешних данных, который повышает способность AI к рассуждению через самовопросы и самоответы. Фреймворк включает две роли: задающего вопросы (proposer) и решателя (solver), которые обучаются с помощью обучения с подкреплением для максимизации ожидаемого вознаграждения. SQLM значительно повысил точность моделей в задачах арифметики, алгебры и программирования, предоставляя масштабируемый и самоподдерживающийся процесс для улучшения возможностей больших языковых моделей в условиях отсутствия высококачественных данных с ручной разметкой. (Источник: WeChat)

CompassVerifier: Модель верификации ответов AI и набор данных для оценки : Shanghai AI Lab и Университет Макао совместно выпустили универсальную модель верификации ответов CompassVerifier и набор данных для оценки VerifierBench, призванные решить проблему быстрого прогресса в обучении больших моделей при отставании в способности верифицировать ответы. CompassVerifier — это легкий, но мощный многодоменный универсальный верификатор, оптимизированный на основе моделей серии Qwen, способный достигать точности верификации, превосходящей универсальные большие модели, в таких областях, как математика, знания и научные рассуждения, а также служить моделью вознаграждения для обучения с подкреплением, предоставляя точную обратную связь для итеративной оптимизации LLM. (Источник: WeChat)

CoAct-1: Агент использования компьютера, где кодирование является действием : Исследователи предложили CoAct-1, многоагентную систему, которая использует кодирование как расширенное действие, призванную решить проблемы эффективности и надежности GUI-операционных Agent в сложных задачах. Orchestrator CoAct-1 может динамически делегировать подзадачи GUI Operator или Programmer Agent (способным писать и выполнять скрипты Python/Bash), тем самым обходя неэффективные GUI-операции. Этот метод достиг SOTA уровня успешности в бенчмарке OSWorld и значительно повысил эффективность, предоставляя более мощный путь к универсальной автоматизации компьютеров. (Источник: HuggingFace Daily Papers)
ReMoMask: Новый метод высококачественной генерации 3D-движений для игр : Пекинский университет предложил ReMoMask, фреймворк Text-to-Motion, основанный на генерации с усилением поиска, призванный высококачественно генерировать плавные и реалистичные 3D-движения по одной инструкции. ReMoMask интегрирует двунаправленную текстово-двигательную модель с импульсом, семантический пространственно-временной механизм внимания и RAG-безклассификаторное руководство, эффективно генерируя временные когерентные движения. Этот метод обновил производительность SOTA на стандартных бенчмарках, таких как HumanML3D и KIT-ML, и, как ожидается, полностью изменит процессы создания игр и анимации. (Источник: WeChat)

Обзор WebAgents: Большие модели для автоматизации веб-приложений : Исследователи Гонконгского политехнического университета опубликовали первый обзор WebAgents, всесторонне систематизирующий прогресс исследований в области использования больших моделей для создания AI Agent следующего поколения для автоматизации веб-приложений. Обзор суммирует репрезентативные методы WebAgents с точки зрения архитектуры (восприятие, планирование и рассуждение, выполнение), обучения (данные, стратегии) и надежности (безопасность, конфиденциальность, обобщение), а также исследует будущие направления исследований, такие как справедливость, объяснимость, наборы данных и персонализированные WebAgents, предоставляя руководство для создания более интеллектуальных и безопасных систем автоматизации веб-приложений. (Источник: WeChat)

InfiAlign: Фреймворк выравнивания способности LLM к рассуждению : InfiAlign — это масштабируемый и эффективный по выборке фреймворк пост-обучения, который выравнивает LLM для улучшения способности к рассуждению путем объединения SFT и DPO. В основе фреймворка лежит мощный конвейер выбора данных, который автоматически отбирает высококачественные данные для выравнивания из открытых наборов данных для рассуждений. InfiAlign достиг производительности, сравнимой с DeepSeek-R1-Distill-Qwen-7B, на модели Qwen2.5-Math-7B-Base, используя при этом всего около 12% обучающих данных, и продемонстрировал значительное улучшение в задачах математического рассуждения, предлагая практическое решение для выравнивания больших моделей рассуждения. (Источник: HuggingFace Daily Papers)
💼 Бизнес
План реализации опционов для сотрудников OpenAI для предотвращения переманивания : В ответ на утечку талантов OpenAI запустила новый раунд реализации опционов для сотрудников по оценке в 500 миллиардов долларов, стремясь удержать таланты с помощью реальных денег. Этот шаг, как ожидается, поднимет оценку OpenAI до нового максимума. В то же время, еженедельная активная аудитория ChatGPT достигла 700 миллионов, число платных корпоративных пользователей выросло до 5 миллионов, а годовой регулярный доход, по прогнозам, превысит 20 миллиардов долларов, что свидетельствует о хорошей динамике развития OpenAI в области продуктов и коммерциализации. (Источник: 量子位)

Amazon Web Services создает крупнейшую агрегационную платформу моделей AI : Amazon Web Services (AWS) объявила, что модель gpt-oss от OpenAI впервые станет доступна через Amazon Bedrock и Amazon SageMaker, что еще больше обогатит экосистему моделей в рамках ее стратегии «Choice Matters» (Выбор имеет значение). AWS теперь предлагает более 400 основных коммерческих и открытых больших моделей, стремясь дать предприятиям возможность выбирать наиболее подходящую модель в зависимости от производительности, стоимости и требований к задачам, а не гнаться за одной «самой сильной» моделью, способствуя синергии нескольких моделей. (Источник: 量子位)

Ant Group инвестирует в компанию по производству ловких рук для воплощенного интеллекта : Ant Group возглавила раунд ангельских инвестиций на сотни миллионов юаней в компанию Lingxin Qiaoshou, занимающуюся воплощенным интеллектом. Lingxin Qiaoshou — единственная в мире компания, которая достигла массового производства тысяч ловких рук с высокой степенью свободы, занимая 80% рынка. Их серия ловких рук Linker Hand обладает высокой степенью свободы, многосенсорной системой и ценовыми преимуществами, уже применяясь в промышленных, медицинских и других сценариях. Это финансирование будет использовано для создания технологических резервов и строительства площадок для сбора данных, ускоряя развертывание ловких рук в практических приложениях. (Источник: 量子位)

🌟 Сообщество
Поляризация пользовательского опыта GPT-5 : После выпуска GPT-5 отзывы пользователей разделились. Некоторые пользователи хвалят его значительные улучшения в программировании и сложных задачах рассуждения, считая генерацию кода более чистой и точной, а также отмечая чрезвычайно сильную способность обработки длинного контекста. Однако другие пользователи выразили разочарование снижением персонализации модели, творческого письма и способности к эмоциональной поддержке, считая ее «скучной» и «бездушной», а механизм маршрутизации модели привел к нестабильному опыту, и даже некоторые пользователи отменили подписку из-за этого. (Источник: Reddit r/ChatGPT & Reddit r/LocalLLaMA & Reddit r/ChatGPT & Reddit r/ChatGPT)

Применение AI в воспитании детей и связанные с этим споры : Работающие родители используют инструменты AI, такие как ChatGPT, в качестве «со-родителей», применяя их для планирования питания, оптимизации режима сна и даже для эмоциональной поддержки. Пространство для излияния души без осуждения со стороны AI снижает психологическую нагрузку на родителей. Однако эта новая технология также вызывает споры, включая возможность предоставления неточных советов, риск утечки конфиденциальных данных (например, инцидент с утечкой данных ChatGPT), а также потенциальное отчуждение в межличностных отношениях и воздействие на окружающую среду из-за чрезмерной зависимости от AI. (Источник: 36氪)

Инцидент с компенсацией пользователю Airbnb из-за поддельных изображений AI : На Airbnb произошел инцидент, когда арендодатель использовал поддельные изображения AI для обмана пользователей с целью получения компенсации, что подчеркивает риски AI в обслуживании клиентов. AI-служба поддержки не смогла распознать изображения, сгенерированные AI, что привело к ошибочному решению о выплате компенсации пользователем. Хотя OpenAI ранее выпускала детектор изображений, распознавание AI-изображений AI все еще имеет ограничения, особенно перед лицом технологии «частичной подделки». Этот инцидент вызвал опасения относительно надежности инструментов обнаружения контента AI и способности C2C-платформ справляться с наплывом дипфейков. (Источник: 36氪)

Строительство бункеров судного дня AI-магнатами Кремниевой долины вызывает горячие споры : Лидеры AI-индустрии Кремниевой долины, такие как Марк Цукерберг и Сэм Альтман, как сообщается, строят или владеют убежищами на случай апокалипсиса, что вызывает обеспокоенность общественности по поводу будущего развития AI и потенциальных рисков. Хотя они отрицают связь с AI, этот шаг все же интерпретируется как подготовка к чрезвычайным ситуациям, таким как пандемии, кибервойны, климатические катастрофы. В сообществе обсуждается, не видят ли эти люди, которые лучше всего разбираются в технологиях AI, нечто неизвестное обычным людям, и не принесло ли развитие AI уже непредсказуемые риски. (Источник: 量子位)

o3 выигрывает чемпионат Kaggle AI по шахматам : В финале первого чемпионата Google Kaggle AI по шахматам o3 от OpenAI разгромил Grok 4 от Илона Маска со счетом 4-0, завоевав титул чемпиона. Этот матч рассматривался как «война прокси» между OpenAI и xAI, призванная проверить критическое мышление, стратегическое планирование и способность больших моделей к импровизации. Хотя Grok 4 ранее демонстрировал сильный импульс, в финале он часто ошибался, в то время как o3 продемонстрировал системно стабильную стратегию, не проиграв ни одной партии на протяжении всего турнира, став непобедимым чемпионом. (Источник: WeChat)

Обсуждение вступления AI в «долину разочарования» : В социальных сетях появилось множество дискуссий о том, что AI вступил в «долину разочарования», особенно после выпуска GPT-5. Пользователи отмечают, что ограничения AI не были эффективно преодолены, а выгода от увеличения масштаба моделей и вычислительной мощности уменьшается. Эта точка зрения утверждает, что прогресс AI стал «менее очевидным», проявляясь в основном в экспертных областях, а не на уровне, воспринимаемом обычными пользователями, что предвещает возможный период стагнации в развитии AI, требующий совершенно новых архитектурных прорывов. (Источник: Reddit r/ArtificialInteligence)

💡 Прочее
Docker предупреждает о рисках безопасности инструментария MCP : Docker выпустил предупреждение, указывая на серьезные уязвимости безопасности в инструментарии разработки, управляемом AI и построенном на протоколе Model Context Protocol (MCP), включая утечку учетных данных, несанкционированный доступ к файлам и удаленное выполнение кода, причем уже были зафиксированы реальные случаи. Эти инструменты встраивают LLM в среду разработки, предоставляя им автономные права на операции, но им не хватает изоляции и надзора. Docker рекомендует избегать установки MCP-серверов через npm, вместо этого использовать подписанные контейнеры, и подчеркивает важность изоляции контейнеров и сети с нулевым доверием. (Источник: WeChat)

Программа стимулирования разработчиков приложений Huawei HarmonyOS 2025 : Huawei объявила, что количество устройств HarmonyOS 5 превысило десять миллионов, и запустила «Программу стимулирования разработчиков приложений HarmonyOS 2025», инвестировав сотни миллионов юаней в субсидии, при этом один разработчик может получить до 6 миллионов юаней в качестве приза. Эта программа направлена на ускорение развития экосистемы HarmonyOS, привлечение разработчиков к созданию приложений для AI и нескольких устройств, реализуя принцип «одна разработка, многоплатформенное развертывание». Huawei предоставляет полную поддержку разработки, включая технологическое обеспечение, быстрое тестирование, эффективную публикацию и эксплуатацию, стремясь создать стабильную экосистему разработчиков. (Источник: WeChat)

Выпущен отечественный AI-супернодовый сервер YuanNao SD200 : Inspur Information выпустила супернодовый AI-сервер «YuanNao SD200», призванный решить вычислительные задачи, связанные с работой больших моделей с триллионами параметров. Сервер использует инновационную архитектуру многохостовой низколатентной памяти с семантической связью, разработанную собственными силами, может агрегировать 64 отечественных GPU-чипа, предоставляя до 4 ТБ унифицированной видеопамяти и 64 ГБ унифицированной оперативной памяти, поддерживая модели со сверхдлинными последовательностями в триллионы. Фактические тесты показывают, что SD200 достигает отличной эффективности масштабирования вычислительной мощности на моделях, таких как DeepSeek R1, предоставляя мощную поддержку для приложений в области AI4 Science и промышленности. (Источник: WeChat)
