Ключевые слова:GPT-5, Саморазвитие ИИ, Воплощенный интеллект, Мультимодальная модель, Большая языковая модель, Обучение с подкреплением, ИИ-агент, Повышение производительности GPT-5, Роботизированная платформа Genie Envisioner, Предвзятость оценки найма LLM, Сверхдлинный контекст Qwen3, Проверка ответов CompassVerifier

🔥 В центре внимания

Выпуск GPT-5: Продуктивность и повышение производительности : OpenAI официально выпустила GPT-5, что знаменует собой новейшую итерацию ее флагманской модели. Основное внимание в этом выпуске уделяется улучшению пользовательского опыта за счет автоматического планирования базовых моделей и моделей глубокого вывода с помощью маршрутизатора в реальном времени, достигая баланса между скоростью и интеллектом. GPT-5 демонстрирует значительные улучшения в снижении галлюцинаций, повышении следования инструкциям и возможностях программирования, а также устанавливает новые рекорды в нескольких бенчмарках. Сэм Альтман сравнил его с «дисплеем Retina», подчеркнув его практичность как «AI уровня докторанта», а не просто прорыв в пределе интеллекта. Хотя технически он не достиг AGI, его более высокая скорость вывода и более низкие эксплуатационные расходы, как ожидается, будут способствовать широкому применению AI. (Источник: MIT Technology Review)

GPT-5 is here. Now what?

Прогресс в исследованиях самосовершенствования AI : Генеральный директор Meta Марк Цукерберг заявил, что компания работает над созданием систем AI, способных к самосовершенствованию. AI уже продемонстрировал способность к самосовершенствованию в нескольких аспектах, например, путем автоматического увеличения данных, поиска архитектуры моделей, обучения с подкреплением и других методов, постоянно оптимизируя свою производительность. Эта тенденция предвещает, что системы AI в будущем смогут автономно обучаться и превосходить установленные человеком границы производительности, что является ключевым путем к достижению более высокого уровня AI. (Источник: MIT Technology Review)

The Download: how AI is improving itself, and hidden greenhouse gases

Genie Envisioner: Единая платформа мировой модели для манипуляций роботами : Исследователи представили Genie Envisioner (GE), единую базовую платформу мировой модели для манипуляций роботами. GE-Base — это модель диффузии видео, обусловленная инструкциями, способная захватывать пространственные, временные и семантические динамики реальных взаимодействий роботов. GE-Act отображает скрытые представления в исполняемые траектории действий, обеспечивая точный и универсальный вывод стратегий. GE-Sim, как нейронный симулятор, обусловленный действиями, поддерживает разработку стратегий с замкнутым циклом. Ожидается, что эта платформа обеспечит масштабируемую и практичную основу для универсального воплощенного интеллекта, управляемого инструкциями. (Источник: HuggingFace Daily Papers)

ISEval: Фреймворк для оценки способности больших мультимодальных моделей распознавать ошибочный ввод : Для решения проблемы способности больших мультимодальных моделей (LMMs) активно распознавать ошибочный ввод исследователи предложили фреймворк оценки ISEval. Этот фреймворк охватывает семь категорий ошибочных предпосылок и три показателя оценки. Исследование показало, что большинство LMMs с трудом активно обнаруживают текстовые дефекты без четких указаний и по-разному реагируют на различные типы ошибок. Например, они хорошо распознают логические ошибки, но плохо справляются с поверхностными языковыми ошибками и дефектами, обусловленными конкретными условиями. Это подчеркивает острую необходимость в активной проверке достоверности ввода для LMMs. (Источник: HuggingFace Daily Papers)

Исследование языковой предвзятости в оценке найма с помощью LLM : Исследование представило бенчмарк для оценки реакции больших языковых моделей (LLMs) на языковые дискриминационные маркеры в оценке найма. Благодаря тщательно разработанным симуляциям собеседований, исследование показало, что LLMs систематически наказывают определенные языковые паттерны, особенно расплывчатую речь, даже при одинаковом качестве контента. Это выявляет демографическую предвзятость в автоматизированных системах оценки, предоставляя базовую структуру для обнаружения и измерения языковой дискриминации в системах AI, что имеет широкое применение для справедливости автоматизированных решений. (Источник: HuggingFace Daily Papers)

🎯 Тенденции

Модели серии Qwen3 поддерживают сверхдлинный контекст до миллиона токенов : Модели Alibaba Cloud Qwen3-30B-A3B-2507 и Qwen3-235B-A22B-2507 теперь поддерживают сверхдлинный контекст до 1 миллиона токенов. Это стало возможным благодаря технологиям Dual Chunk Attention (DCA) и разреженного внимания MInference, которые не только улучшили качество генерации, но и увеличили скорость вывода для последовательностей почти в миллион токенов в 3 раза. Этот шаг значительно расширяет потенциал применения LLM в обработке сложных задач, таких как длинные документы и кодовые базы, а также совместим с vLLM и SGLang для эффективного развертывания. (Источник: Alibaba_Qwen)

Qwen3系列模型支持百万级超长上下文

Обновление Anthropic Claude Opus 4.1 и Sonnet 4 : Anthropic выпустила Claude Opus 4.1 и Sonnet 4, сосредоточившись на улучшении задач Agentic, кодирования в реальном мире и возможностей рассуждения. Новые модели обладают функцией «глубокого мышления», позволяющей гибко переключаться между режимами мгновенного ответа и глубокого вывода, сокращая выполнение сложных задач, занимающих часы, до минут. Это еще больше укрепляет позиционирование Claude в сценариях многомодельного сотрудничества, особенно выделяясь в сложных проверках кода и задачах высокого уровня рассуждения. (Источник: dl_weekly)

Microsoft запускает функцию Copilot 3D : Microsoft запустила бесплатную функцию Copilot 3D, которая может преобразовывать 2D-изображения в 3D-модели формата GLB, совместимые с различными 3D-просмотрщиками, инструментами дизайна и игровыми движками. Хотя в настоящее время функция плохо работает с изображениями животных и людей, она предоставляет пользователям удобную возможность преобразования 2D в 3D, что, как ожидается, будет полезно в таких областях, как дизайн продуктов и виртуальная реальность, дополнительно снижая барьер для создания 3D-контента. (Источник: The Verge)

HuggingFace Accelerate выпускает руководство по обучению на нескольких GPU : HuggingFace в сотрудничестве с Axolotl выпустила руководство Accelerate ND-Parallel, призванное упростить комбинацию и применение параллельных стратегий в обучении на нескольких GPU. Руководство подробно описывает такие стратегии, как параллелизм данных (DP), сегментированный параллелизм данных (FSDP), тензорный параллелизм (TP) и контекстный параллелизм (CP), а также предоставляет примеры конфигураций смешанного параллелизма, помогая разработчикам оптимизировать использование памяти и пропускную способность при обучении больших моделей и эффективно справляться с проблемами накладных расходов на связь в многоузловом обучении. (Источник: HuggingFace Blog)

HuggingFace Accelerate发布多GPU训练指南

🧰 Инструменты

OpenAI Codex CLI: Локальный кодирующий агент в терминале : OpenAI выпустила Codex CLI, легковесный кодирующий агент, работающий в локальном терминале. Пользователи могут установить его через npm install -g @openai/codex или brew install codex. Он поддерживает привязку к аккаунтам ChatGPT Plus/Pro/Team, позволяет бесплатно использовать новейшие модели, такие как GPT-5, а также оплачивать по мере использования через API Key. Codex CLI предлагает различные режимы песочницы, включая чтение-запись и только чтение, а также поддерживает настраиваемые конфигурации, призванные предоставить разработчикам эффективную и безопасную помощь в локальном программировании. (Источник: openai/codex — GitHub Trending)

OpenAI Codex CLI:终端本地编码Agent

HuggingFace AI Sheets: Инструмент для работы с наборами данных без кода : HuggingFace представила AI Sheets, инструмент с открытым исходным кодом без кода, предназначенный для создания, обогащения и преобразования наборов данных с использованием моделей AI. Интерфейс инструмента напоминает электронную таблицу, он поддерживает локальное развертывание или работу на Hugging Face Hub. Пользователи могут использовать тысячи открытых моделей (включая gpt-oss) для сравнения моделей, оптимизации подсказок, очистки данных, классификации, анализа и генерации синтетических данных, итеративно улучшать результаты генерации AI с помощью ручного редактирования и обратной связи в виде лайков, а также экспортировать их в Hub. (Источник: HuggingFace Blog)

HuggingFace AI Sheets:无代码数据集工具

Google Agent Development Kit (ADK) и его примеры : Google выпустила Agent Development Kit (ADK) — открытый, ориентированный на код инструментарий Python для создания, оценки и развертывания сложных AI Agent. ADK поддерживает богатую экосистему инструментов, модульные многоагентные системы и гибкое развертывание. Его библиотека примеров adk-samples предоставляет различные примеры Agent, от диалоговых ботов до многоагентных рабочих процессов, призванные ускорить процесс разработки Agent и интегрироваться с протоколом A2A для удаленной связи между Agent. (Источник: google/adk-python — GitHub Trending & google/adk-samples — GitHub Trending)

Google Agent Development Kit (ADK)及其示例

Qwen Code CLI: Бесплатный инструмент для запуска кода : Alibaba Cloud Qwen Code CLI предоставляет 2000 бесплатных запусков кода в день, легко запускается командой npx @qwen-code/qwen-code@latest. Инструмент поддерживает Qwen OAuth и предназначен для предоставления разработчикам удобного и эффективного опыта написания и тестирования кода. Команда Qwen заявила, что продолжит оптимизировать этот инструмент CLI и модель Qwen-Coder, стремясь достичь уровня производительности Claude Code, оставаясь при этом открытым исходным кодом. (Источник: Alibaba_Qwen)

Qwen Code CLI:免费代码运行工具

📚 Обучение

Обновление библиотеки OpenAI Python : Официальная библиотека OpenAI Python предоставляет удобный доступ к OpenAI REST API, поддерживая Python 3.8+. Библиотека содержит определения типов для всех параметров запросов и полей ответов, а также предоставляет синхронные и асинхронные клиенты. Последние обновления включают бета-поддержку Realtime API для создания мультимодальных диалоговых систем с низкой задержкой, а также подробные описания проверки webhook, обработки ошибок, идентификаторов запросов и механизмов повторных попыток, что повышает эффективность разработки и надежность. (Источник: openai/openai-python — GitHub Trending)

OpenAI Python库更新

Подборка AI Agent : e2b-dev/awesome-ai-agents — это репозиторий GitHub, содержащий множество примеров и ресурсов автономных AI Agent. Этот список призван предоставить разработчикам централизованную библиотеку ресурсов, помогая им понять и изучить различные типы AI Agent, охватывающие широкий спектр сценариев применения, от простых до сложных, и является важным учебным материалом для исследования и создания AI Agent. (Источник: e2b-dev/awesome-ai-agents — GitHub Trending)

MeanFlow: Новая парадигма одношаговой генерации диффузионных моделей : Научное пространство предложило MeanFlow, новый метод, который, как ожидается, станет стандартом для ускоренной генерации диффузионных моделей. Этот метод направлен на достижение одношаговой генерации путем моделирования «средней скорости», а не «мгновенной скорости», преодолевая болевую точку медленной генерации традиционных диффузионных моделей. MeanFlow обладает четкими математическими принципами, может быть обучен с нуля с одной целью, а эффект одношаговой генерации близок к SOTA, предоставляя новые теоретические и практические направления для ускорения генеративных моделей AI. (Источник: WeChat)

MeanFlow:一步生成扩散模型新范式

Оптимизация полного жизненного цикла KV Cache для длинного контекста : Microsoft Research Asia поделилась практиками оптимизации полного жизненного цикла KV Cache, направленными на решение проблем задержки и хранения данных при выводе больших языковых моделей с длинным контекстом. Благодаря бенчмарку SCBench и предложенным методам, таким как MInference и RetrievalAttention, значительно снижается задержка на этапе Prefilling и уменьшается нагрузка на видеопамять KV Cache. Исследование подчеркивает системную оптимизацию между запросами и повторное использование Prefix Caching, предлагая решения для оптимизации масштабируемости и экономичности вывода LLM с длинным контекстом. (Источник: WeChat)

长上下文KV Cache全生命周期优化

Фреймворк обучения с подкреплением FR3E повышает возможности исследования LLM : ByteDance, MAP и Манчестерский университет совместно предложили FR3E (First Return, Entropy-Eliciting Explore) — совершенно новый структурированный фреймворк исследования, призванный решить проблему недостаточного исследования LLM в обучении с подкреплением. FR3E, выявляя токены с высокой неопределенностью в траекториях вывода, направляет разнообразное развертывание, систематически перестраивает механизм исследования LLM, достигая динамического баланса между использованием и исследованием, и значительно превосходит существующие методы на нескольких бенчмарках математического вывода. (Источник: WeChat)

强化学习框架FR3E提升LLM探索能力

Исследование связи между максимальными значениями в механизме самовнимания и пониманием контекста : Новое исследование ICML 2025 показало, что в представлениях запросов (Q) и ключей (K) механизма самовнимания больших языковых моделей существуют высококонцентрированные максимальные значения, которые имеют решающее значение для понимания контекстных знаний. Исследование показало, что это явление широко распространено в моделях, использующих ротационное позиционное кодирование (RoPE), и проявляется уже на ранних слоях. Нарушение этих максимальных значений приводит к резкому снижению производительности модели в задачах, требующих понимания контекста, что открывает новые направления для проектирования, оптимизации и квантования LLM. (Источник: WeChat)

自注意力机制中极大值与上下文理解关联研究

C3 Benchmark: Бенчмарк для тестирования двуязычных моделей голосового диалога (китайский-английский) : Пекинский университет и Tencent совместно выпустили C3 Benchmark — первый всеобъемлющий двуязычный (китайско-английский) оценочный бенчмарк для моделей разговорного диалога, который исследует сложные явления, такие как паузы, многозначные и омонимичные слова, ударения, синтаксическая неоднозначность и полисемия. Этот бенчмарк включает 1079 реальных сценариев и 1586 аудио-текстовых пар, призванных выявить критические недостатки текущих моделей голосового диалога и способствовать их прогрессу в понимании повседневной человеческой речи. (Источник: WeChat)

C3 Benchmark:中英双语语音对话模型测试基准

Chemma: Большая языковая модель для органического химического синтеза : Команда AI for Science Шанхайского университета Цзяотун выпустила большую модель химического синтеза Baiyulan (Chemma), впервые реализовав ускорение всего процесса органического синтеза с помощью большой химической языковой модели. Chemma не требует квантовых вычислений, полагаясь только на понимание химических знаний и способности к рассуждению, и превосходит существующие лучшие результаты в задачах одношагового/многошагового ретросинтеза, прогнозирования выхода/селективности и оптимизации реакций. Его фреймворк активного обучения «Co-Chemist» для человеко-машинного сотрудничества был успешно проверен в реальных реакциях, предоставляя новую парадигму для химических открытий. (Источник: WeChat)

Chemma:有机化学合成大语言模型

Intern-Robotics: Полнофункциональный движок воплощенного интеллекта от Shanghai AI Lab : Shanghai AI Lab выпустила полнофункциональный движок воплощенного интеллекта Intern-Robotics, призванный приблизить «момент ChatGPT» в области воплощенного интеллекта. Этот движок представляет собой открытую и общедоступную инфраструктуру, ориентированную на достижение обобщения сущностей, обобщения сценариев, обобщения задач и подчеркивающую стремление к 100% успешности выполнения задач. Команда стремится решить проблему нехватки данных и постепенно достичь обобщения с нулевым числом примеров, ускоряя практическое применение воплощенного интеллекта, используя технический маршрут «Real to Sim to Real» и обучение с подкреплением в реальном мире. (Источник: WeChat)

Intern-Robotics:上海AI Lab具身全栈引擎

SQLM: Фреймворк эволюции способности AI к рассуждению через самовопросы и самоответы : Команда Университета Карнеги-Меллона предложила SQLM — фреймворк самовопросов, не требующий внешних данных, который повышает способность AI к рассуждению через самовопросы и самоответы. Фреймворк включает две роли: задающего вопросы (proposer) и решателя (solver), которые обучаются с помощью обучения с подкреплением для максимизации ожидаемого вознаграждения. SQLM значительно повысил точность моделей в задачах арифметики, алгебры и программирования, предоставляя масштабируемый и самоподдерживающийся процесс для улучшения возможностей больших языковых моделей в условиях отсутствия высококачественных данных с ручной разметкой. (Источник: WeChat)

AI自问自答推理能力进化框架SQLM

CompassVerifier: Модель верификации ответов AI и набор данных для оценки : Shanghai AI Lab и Университет Макао совместно выпустили универсальную модель верификации ответов CompassVerifier и набор данных для оценки VerifierBench, призванные решить проблему быстрого прогресса в обучении больших моделей при отставании в способности верифицировать ответы. CompassVerifier — это легкий, но мощный многодоменный универсальный верификатор, оптимизированный на основе моделей серии Qwen, способный достигать точности верификации, превосходящей универсальные большие модели, в таких областях, как математика, знания и научные рассуждения, а также служить моделью вознаграждения для обучения с подкреплением, предоставляя точную обратную связь для итеративной оптимизации LLM. (Источник: WeChat)

CompassVerifier:AI答案验证模型与评测集

CoAct-1: Агент использования компьютера, где кодирование является действием : Исследователи предложили CoAct-1, многоагентную систему, которая использует кодирование как расширенное действие, призванную решить проблемы эффективности и надежности GUI-операционных Agent в сложных задачах. Orchestrator CoAct-1 может динамически делегировать подзадачи GUI Operator или Programmer Agent (способным писать и выполнять скрипты Python/Bash), тем самым обходя неэффективные GUI-операции. Этот метод достиг SOTA уровня успешности в бенчмарке OSWorld и значительно повысил эффективность, предоставляя более мощный путь к универсальной автоматизации компьютеров. (Источник: HuggingFace Daily Papers)

ReMoMask: Новый метод высококачественной генерации 3D-движений для игр : Пекинский университет предложил ReMoMask, фреймворк Text-to-Motion, основанный на генерации с усилением поиска, призванный высококачественно генерировать плавные и реалистичные 3D-движения по одной инструкции. ReMoMask интегрирует двунаправленную текстово-двигательную модель с импульсом, семантический пространственно-временной механизм внимания и RAG-безклассификаторное руководство, эффективно генерируя временные когерентные движения. Этот метод обновил производительность SOTA на стандартных бенчмарках, таких как HumanML3D и KIT-ML, и, как ожидается, полностью изменит процессы создания игр и анимации. (Источник: WeChat)

ReMoMask:高质量3D动作生成新方法

Обзор WebAgents: Большие модели для автоматизации веб-приложений : Исследователи Гонконгского политехнического университета опубликовали первый обзор WebAgents, всесторонне систематизирующий прогресс исследований в области использования больших моделей для создания AI Agent следующего поколения для автоматизации веб-приложений. Обзор суммирует репрезентативные методы WebAgents с точки зрения архитектуры (восприятие, планирование и рассуждение, выполнение), обучения (данные, стратегии) и надежности (безопасность, конфиденциальность, обобщение), а также исследует будущие направления исследований, такие как справедливость, объяснимость, наборы данных и персонализированные WebAgents, предоставляя руководство для создания более интеллектуальных и безопасных систем автоматизации веб-приложений. (Источник: WeChat)

WebAgents综述:大模型赋能Web自动化

InfiAlign: Фреймворк выравнивания способности LLM к рассуждению : InfiAlign — это масштабируемый и эффективный по выборке фреймворк пост-обучения, который выравнивает LLM для улучшения способности к рассуждению путем объединения SFT и DPO. В основе фреймворка лежит мощный конвейер выбора данных, который автоматически отбирает высококачественные данные для выравнивания из открытых наборов данных для рассуждений. InfiAlign достиг производительности, сравнимой с DeepSeek-R1-Distill-Qwen-7B, на модели Qwen2.5-Math-7B-Base, используя при этом всего около 12% обучающих данных, и продемонстрировал значительное улучшение в задачах математического рассуждения, предлагая практическое решение для выравнивания больших моделей рассуждения. (Источник: HuggingFace Daily Papers)

💼 Бизнес

План реализации опционов для сотрудников OpenAI для предотвращения переманивания : В ответ на утечку талантов OpenAI запустила новый раунд реализации опционов для сотрудников по оценке в 500 миллиардов долларов, стремясь удержать таланты с помощью реальных денег. Этот шаг, как ожидается, поднимет оценку OpenAI до нового максимума. В то же время, еженедельная активная аудитория ChatGPT достигла 700 миллионов, число платных корпоративных пользователей выросло до 5 миллионов, а годовой регулярный доход, по прогнозам, превысит 20 миллиардов долларов, что свидетельствует о хорошей динамике развития OpenAI в области продуктов и коммерциализации. (Источник: 量子位)

OpenAI员工期权兑现计划防挖角

Amazon Web Services создает крупнейшую агрегационную платформу моделей AI : Amazon Web Services (AWS) объявила, что модель gpt-oss от OpenAI впервые станет доступна через Amazon Bedrock и Amazon SageMaker, что еще больше обогатит экосистему моделей в рамках ее стратегии «Choice Matters» (Выбор имеет значение). AWS теперь предлагает более 400 основных коммерческих и открытых больших моделей, стремясь дать предприятиям возможность выбирать наиболее подходящую модель в зависимости от производительности, стоимости и требований к задачам, а не гнаться за одной «самой сильной» моделью, способствуя синергии нескольких моделей. (Источник: 量子位)

亚马逊云科技构建最大AI模型聚合平台

Ant Group инвестирует в компанию по производству ловких рук для воплощенного интеллекта : Ant Group возглавила раунд ангельских инвестиций на сотни миллионов юаней в компанию Lingxin Qiaoshou, занимающуюся воплощенным интеллектом. Lingxin Qiaoshou — единственная в мире компания, которая достигла массового производства тысяч ловких рук с высокой степенью свободы, занимая 80% рынка. Их серия ловких рук Linker Hand обладает высокой степенью свободы, многосенсорной системой и ценовыми преимуществами, уже применяясь в промышленных, медицинских и других сценариях. Это финансирование будет использовано для создания технологических резервов и строительства площадок для сбора данных, ускоряя развертывание ловких рук в практических приложениях. (Источник: 量子位)

蚂蚁集团投资具身智能灵巧手公司

🌟 Сообщество

Поляризация пользовательского опыта GPT-5 : После выпуска GPT-5 отзывы пользователей разделились. Некоторые пользователи хвалят его значительные улучшения в программировании и сложных задачах рассуждения, считая генерацию кода более чистой и точной, а также отмечая чрезвычайно сильную способность обработки длинного контекста. Однако другие пользователи выразили разочарование снижением персонализации модели, творческого письма и способности к эмоциональной поддержке, считая ее «скучной» и «бездушной», а механизм маршрутизации модели привел к нестабильному опыту, и даже некоторые пользователи отменили подписку из-за этого. (Источник: Reddit r/ChatGPT & Reddit r/LocalLLaMA & Reddit r/ChatGPT & Reddit r/ChatGPT)

GPT-5用户体验两极分化

Применение AI в воспитании детей и связанные с этим споры : Работающие родители используют инструменты AI, такие как ChatGPT, в качестве «со-родителей», применяя их для планирования питания, оптимизации режима сна и даже для эмоциональной поддержки. Пространство для излияния души без осуждения со стороны AI снижает психологическую нагрузку на родителей. Однако эта новая технология также вызывает споры, включая возможность предоставления неточных советов, риск утечки конфиденциальных данных (например, инцидент с утечкой данных ChatGPT), а также потенциальное отчуждение в межличностных отношениях и воздействие на окружающую среду из-за чрезмерной зависимости от AI. (Источник: 36氪)

AI在育儿中的应用与争议

Инцидент с компенсацией пользователю Airbnb из-за поддельных изображений AI : На Airbnb произошел инцидент, когда арендодатель использовал поддельные изображения AI для обмана пользователей с целью получения компенсации, что подчеркивает риски AI в обслуживании клиентов. AI-служба поддержки не смогла распознать изображения, сгенерированные AI, что привело к ошибочному решению о выплате компенсации пользователем. Хотя OpenAI ранее выпускала детектор изображений, распознавание AI-изображений AI все еще имеет ограничения, особенно перед лицом технологии «частичной подделки». Этот инцидент вызвал опасения относительно надежности инструментов обнаружения контента AI и способности C2C-платформ справляться с наплывом дипфейков. (Источник: 36氪)

Airbnb因AI伪造图片致用户赔偿事件

Строительство бункеров судного дня AI-магнатами Кремниевой долины вызывает горячие споры : Лидеры AI-индустрии Кремниевой долины, такие как Марк Цукерберг и Сэм Альтман, как сообщается, строят или владеют убежищами на случай апокалипсиса, что вызывает обеспокоенность общественности по поводу будущего развития AI и потенциальных рисков. Хотя они отрицают связь с AI, этот шаг все же интерпретируется как подготовка к чрезвычайным ситуациям, таким как пандемии, кибервойны, климатические катастрофы. В сообществе обсуждается, не видят ли эти люди, которые лучше всего разбираются в технологиях AI, нечто неизвестное обычным людям, и не принесло ли развитие AI уже непредсказуемые риски. (Источник: 量子位)

硅谷AI大佬建造末日地堡引发热议

o3 выигрывает чемпионат Kaggle AI по шахматам : В финале первого чемпионата Google Kaggle AI по шахматам o3 от OpenAI разгромил Grok 4 от Илона Маска со счетом 4-0, завоевав титул чемпиона. Этот матч рассматривался как «война прокси» между OpenAI и xAI, призванная проверить критическое мышление, стратегическое планирование и способность больших моделей к импровизации. Хотя Grok 4 ранее демонстрировал сильный импульс, в финале он часто ошибался, в то время как o3 продемонстрировал системно стабильную стратегию, не проиграв ни одной партии на протяжении всего турнира, став непобедимым чемпионом. (Источник: WeChat)

Kaggle AI国际象棋锦标赛o3夺冠

Обсуждение вступления AI в «долину разочарования» : В социальных сетях появилось множество дискуссий о том, что AI вступил в «долину разочарования», особенно после выпуска GPT-5. Пользователи отмечают, что ограничения AI не были эффективно преодолены, а выгода от увеличения масштаба моделей и вычислительной мощности уменьшается. Эта точка зрения утверждает, что прогресс AI стал «менее очевидным», проявляясь в основном в экспертных областях, а не на уровне, воспринимаемом обычными пользователями, что предвещает возможный период стагнации в развитии AI, требующий совершенно новых архитектурных прорывов. (Источник: Reddit r/ArtificialInteligence)

AI进入“幻灭的低谷”讨论

💡 Прочее

Docker предупреждает о рисках безопасности инструментария MCP : Docker выпустил предупреждение, указывая на серьезные уязвимости безопасности в инструментарии разработки, управляемом AI и построенном на протоколе Model Context Protocol (MCP), включая утечку учетных данных, несанкционированный доступ к файлам и удаленное выполнение кода, причем уже были зафиксированы реальные случаи. Эти инструменты встраивают LLM в среду разработки, предоставляя им автономные права на операции, но им не хватает изоляции и надзора. Docker рекомендует избегать установки MCP-серверов через npm, вместо этого использовать подписанные контейнеры, и подчеркивает важность изоляции контейнеров и сети с нулевым доверием. (Источник: WeChat)

Docker警告MCP工具链安全风险

Программа стимулирования разработчиков приложений Huawei HarmonyOS 2025 : Huawei объявила, что количество устройств HarmonyOS 5 превысило десять миллионов, и запустила «Программу стимулирования разработчиков приложений HarmonyOS 2025», инвестировав сотни миллионов юаней в субсидии, при этом один разработчик может получить до 6 миллионов юаней в качестве приза. Эта программа направлена на ускорение развития экосистемы HarmonyOS, привлечение разработчиков к созданию приложений для AI и нескольких устройств, реализуя принцип «одна разработка, многоплатформенное развертывание». Huawei предоставляет полную поддержку разработки, включая технологическое обеспечение, быстрое тестирование, эффективную публикацию и эксплуатацию, стремясь создать стабильную экосистему разработчиков. (Источник: WeChat)

华为鸿蒙应用开发者激励计划2025

Выпущен отечественный AI-супернодовый сервер YuanNao SD200 : Inspur Information выпустила супернодовый AI-сервер «YuanNao SD200», призванный решить вычислительные задачи, связанные с работой больших моделей с триллионами параметров. Сервер использует инновационную архитектуру многохостовой низколатентной памяти с семантической связью, разработанную собственными силами, может агрегировать 64 отечественных GPU-чипа, предоставляя до 4 ТБ унифицированной видеопамяти и 64 ГБ унифицированной оперативной памяти, поддерживая модели со сверхдлинными последовательностями в триллионы. Фактические тесты показывают, что SD200 достигает отличной эффективности масштабирования вычислительной мощности на моделях, таких как DeepSeek R1, предоставляя мощную поддержку для приложений в области AI4 Science и промышленности. (Источник: WeChat)

国产AI超节点服务器元脑SD200发布

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *