Ключевые слова:OpenAI, Аппаратное обеспечение ИИ, Google DeepMind, NVIDIA, Huawei, Microsoft, xAI, Робот с ИИ, Умная колонка без экрана, Физически информированные нейронные сети, x86 RTX SOC, Atlas 950/960 SuperPoD, Grok 4 Fast
🔥 В центре внимания
Аппаратные амбиции OpenAI и борьба за таланты с Apple : После приобретения io, OpenAI активно переманивает инженеров по аппаратному обеспечению из Apple, планируя выпустить безэкранные умные колонки, умные очки и другие AI-устройства уже к концу 2026 года. Этот шаг знаменует стремление OpenAI перевернуть традиционные режимы взаимодействия человека с компьютером, привлекая таланты высокими зарплатами и обещаниями «меньшей бюрократии». Однако компания сталкивается с огромными трудностями в оспаривании доминирующего положения Apple в области аппаратного обеспечения, а также с печальным опытом таких компаний, как Meta, в сфере AI-оборудования. (来源: The Information)

Google DeepMind использует AI для решения сложных задач гидродинамики : Google DeepMind в сотрудничестве с Университетом Брауна, Нью-Йоркским университетом и Стэнфордским университетом впервые систематически обнаружил трудноуловимые нестабильные сингулярности в уравнениях жидкости, используя физически информированные нейронные сети (PINN) и высокоточные методы численной оптимизации. Это достижение открывает новую парадигму для исследований нелинейной гидродинамики и, как ожидается, значительно повысит точность и эффективность в таких областях, как прогнозирование траекторий тайфунов и аэродинамическое проектирование самолетов. (来源: 量子位)

NVIDIA инвестирует 5 миллиардов долларов в Intel для совместной разработки AI-чипов : NVIDIA официально объявила об инвестировании 5 миллиардов долларов в «старого соперника» Intel, став одним из ее крупнейших акционеров. Обе компании будут совместно разрабатывать AI-чипы для ПК и центров обработки данных, включая новый x86 RTX SOC, с целью глубокой интеграции GPU и CPU и переосмысления будущей вычислительной архитектуры. Этот шаг рассматривается как переопределение будущей вычислительной архитектуры двумя гигантами чипов, но может оказать влияние на AMD и TSMC. (来源: 量子位)

Huawei представила мощнейшие в мире AI-суперузлы и кластеры : На конференции Huawei Connect компания Huawei представила суперузлы Atlas 950/960 SuperPoD и кластеры SuperCluster, поддерживающие от тысяч до миллионов карт Ascend, с производительностью FP8 до 8-30 EFlops, и, как ожидается, сохранит первое место в мире по вычислительной мощности в течение следующих двух лет. Также были объявлены планы по развитию чипов Ascend и Kunpeng и представлен протокол межсоединения Lingqu, направленный на компенсацию разрыва в технологическом процессе отдельных чипов за счет инноваций в системной архитектуре и содействие дальнейшему развитию искусственного интеллекта. (来源: 量子位)

Microsoft объявила о строительстве крупнейшего в мире AI-центра обработки данных Fairwater : Microsoft объявила о строительстве AI-центра обработки данных под названием Fairwater в Висконсине, который будет вмещать сотни тысяч GPU NVIDIA GB200, обеспечивая производительность в 10 раз превышающую самый быстрый суперкомпьютер в мире. Центр использует замкнутую систему жидкостного охлаждения и работает на возобновляемых источниках энергии, предназначен для поддержки экспоненциального расширения обучения и вывода AI, и является одним из объектов AI-инфраструктуры, строящихся Microsoft в различных регионах мира. (来源: NandoDF, Reddit r/ArtificialInteligence)

🎯 Тенденции
xAI выпустила Grok 4 Fast, новый стандарт производительности и стоимости : xAI выпустила мультимодальную модель вывода Grok 4 Fast (mini) с контекстным окном в 2 миллиона токенов, значительно повышающую эффективность вывода и производительность поиска. Ее интеллектуальный уровень сопоставим с Gemini 2.5 Pro, но стоимость снижена примерно в 25 раз. Она заняла первое место в рейтинге Search Arena и восьмое место в Text Arena, переопределив соотношение стоимости и эффективности. Новая агентная структура команды инфраструктуры RL является ядром ее обучения. (来源: scaling01, Yuhu_ai_, ArtificialAnlys)

Применение AI-роботов в различных областях: полиция, кухня, строительство и автоматизация логистики : Технологии AI и робототехники ускоренно проникают в различные области, такие как общественная безопасность, кухни, строительство и логистика. Китай представил высокоскоростного сферического полицейского робота, способного автономно задерживать преступников. Кухонные роботы, строительные роботы и двуногие шагающие роботы также реализуют автоматизацию и интеллектуализацию в таких сценариях, как логистические центры Amazon. Scythe Robotics выпустила улучшенный автономный робот-газонокосилку M.52. (来源: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

Выпущена визуально-языковая модель Moondream 3 с нативной поддержкой функции «указания» : Представлена предварительная версия Moondream 3 — визуально-языковой модели с 9 миллиардами параметров и 2 миллиардами активных MoE, которая, сохраняя эффективность и простоту развертывания, предлагает передовые возможности визуального вывода и нативно поддерживает интерактивную функцию «указания», повышая интуитивность взаимодействия человека с компьютером. (来源: vikhyatk, _akhaliq, suchenzang)

Прогресс в AI-управляемых мировых моделях и генерации видео : Исследование продемонстрировало технологию вероятностной структурной интеграции (PSI), способную изучать полные мировые модели из необработанных видео. Luma AI представила модель вывода видео Ray3, способную генерировать HDR-видео студийного качества, а также новый черновой режим. AI-генерируемые миры можно исследовать на VisionPro. (来源: connerruhl, NandoDF, drfeifei)

Развертывание LLM на мобильных устройствах и инновации в аудиомоделях : Модель Qwen3 8B успешно реализована на iPhone Air с 4-битным квантованием, демонстрируя потенциал эффективного развертывания больших языковых моделей на мобильных устройствах. Xiaomi выпустила в открытый доступ MiMo-Audio, аудиоязыковую модель с 7 миллиардами параметров, которая благодаря масштабному предварительному обучению и парадигме предсказания следующего токена в стиле GPT-3 достигает мощных возможностей обучения с малым количеством примеров и обобщения, охватывая различные аудиозадачи. (来源: awnihannun, huggingface, Reddit r/LocalLLaMA)

AI-биобезопасность и дизайн вирусных геномов : Исследования показывают, что AI теперь способен разрабатывать более смертоносные вирусные геномы, хотя это требует руководства команды экспертов и подсказок с определенными последовательностями, что вызывает опасения по поводу применения AI в биобезопасности и подчеркивает необходимость строгого контроля потенциальных рисков в процессе развития AI. (来源: TheRundownAI, Reddit r/artificial)

Инновации в AI-оборудовании и вычислительной архитектуре : Архитектура NVIDIA Blackwell названа «GPU следующего десятилетия», и ее оптимизация и детали реализации привлекают большое внимание. В то же время, интеллектуальные процессорные блоки (IPU) Graphcore, как массово-параллельные процессоры, превосходно справляются с графовыми вычислениями и разреженными рабочими нагрузками, предоставляя уникальные преимущества в области AI-вычислений. Фотонный процессор Массачусетского технологического института способен выполнять сверхбыстрые AI-вычисления с чрезвычайно высокой энергоэффективностью. (来源: percyliang, TheTuringPost, Ronald_vanLoon)

Прогресс AI в принятии решений, творчестве и ситуационной осведомленности : LLM превосходят венчурных капиталистов в выборе основателей. AI используется для создания приборных панелей телеметрии автомобилей в реальном времени, а также для описания движений людей с помощью «физического AI». KlingAI исследует сочетание AI и кинопроизводства, продвигая концепцию «AI-управляемого автора». (来源: BorisMPower, code, genmon, Kling_ai)

Рост пользователей и достижения AI-платформ : Активность пользователей платформы Perplexity Discover быстро растет, число ежедневных активных пользователей превысило 1 миллион, что делает ее источником ежедневной информации с высоким соотношением сигнал/шум. Модели OpenAI решили 12 из 12 задач на Всемирном финале ICPC 2025 года, причем 11 задач были решены правильно с первой попытки, что демонстрирует мощные возможности AI в алгоритмических соревнованиях и программировании. (来源: AravSrinivas, MostafaRohani)

Прогресс и перспективы технологий автономного вождения : Tesla FSD (Full Self-Driving) больше не требует от водителя держать руки на руле, вместо этого используется камера в салоне для мониторинга того, смотрит ли водитель на дорогу. В то же время, существует мнение, что гуманоидные роботы в будущем смогут управлять любыми транспортными средствами, что вызывает дискуссии о распространении автономного вождения и привычках человеческого вождения. (来源: kylebrussell, EERandomness)
🧰 Инструменты
DSPy: упрощение программирования LLM, фокус на коде, а не на Prompt engineering : DSPy — это новый фреймворк для программирования LLM, который позволяет разработчикам сосредоточиться на логике кода, а не на сложном Prompt engineering. Он повышает эффективность, экономичность и надежность приложений LLM за счет определения естественной формы намерений, типов оптимизаторов и модульного дизайна. Его можно использовать для генерации синтетических клинических заметок, решения проблем Prompt-инъекций и он предоставляет порт для языка Ruby. (来源: lateinteraction, lateinteraction, lateinteraction, lateinteraction, lateinteraction, lateinteraction, lateinteraction)
AI-кодирующие агенты и экосистема инструментов разработки : GPT-5 Codex CLI поддерживает автоматизированную проверку кода и планирование длительных задач. OpenHands предоставляет универсальные кодирующие агенты, вызываемые с различных платформ. Replit Agent 3 предлагает многоуровневый контроль автономности и может преобразовывать отзывы клиентов в автоматизированное расширение платформы. Основная архитектура Cline перестроена для поддержки многоинтерфейсной интеграции. (来源: dejavucoder, gdb, gdb, kylebrussell, doodlestein, gneubig, pirroh, amasad, amasad, amasad, amasad, cline, cline)

Инструменты и фреймворки для разработки LLM-приложений : LlamaIndex в сочетании с Dragonfly может создавать RAG-системы реального времени. tldraw Agent может превращать эскизы в играбельные игры. Turbopuffer — это эффективная векторная база данных. Trackio — это легкая бесплатная библиотека для отслеживания экспериментов. Платформа Yupp.ai позволяет сравнивать производительность AI-моделей в решении математических задач. Модель с открытым исходным кодом CodonTransformer способствует оптимизации экспрессии белков. (来源: jerryjliu0, max__drake, Sirupsen, ClementDelangue, yupp_ai, yupp_ai, huggingface)

AI-помощь в голосовом взаимодействии и создании контента : Wispr Flow/Superwhisper предлагает высококачественный опыт голосового взаимодействия. Higgsfield Photodump Studio предоставляет бесплатное обучение персонажей и генерацию модных фотографий. Index TTS2 и VibeVoice-7B — это модели преобразования текста в речь. Генерация изображений DALL-E 3 может выполнять сложные команды, такие как создание фотографий, где взрослая версия себя обнимает детскую версию себя. (来源: kylebrussell, _akhaliq, dotey, Reddit r/ChatGPT)

Применение AI-инструментов в специфических областях : Paper2Agent преобразует исследовательские работы в интерактивные AI-помощники. Deterministic Global-Optimum Logistics Demo решает проблемы оптимизации маршрутов в больших масштабах. DeepContext MCP повышает эффективность поиска кода в Claude Code. В JetBrains IDEs разрабатывается функция автодополнения менее чем за 100 мс. Neon Snapshots API предоставляет функции контроля версий и контрольных точек для AI-агентов. Roo Code интегрирован с семейством моделей GLM 4.5, предлагая планы кодирования с фиксированной ставкой. (来源: TheTuringPost, Reddit r/MachineLearning, Reddit r/ClaudeAI, Reddit r/MachineLearning, matei_zaharia, Zai_org)

AI-инфраструктура и инструменты оптимизации : NVIDIA Run:ai Model Streamer — это SDK с открытым исходным кодом, разработанный для значительного снижения задержки холодного запуска вывода LLM. Cerebras Inference обеспечивает высокоскоростной вывод до 2000 токенов в секунду для ведущих моделей, таких как Qwen3 Coder. Vercel AI Gateway считается отличным бэкенд-сервисом для AI SDK, который благодаря быстрой итерации функций и поддержке моделей Cerebras Systems предоставляет разработчикам эффективную и недорогую AI-инфраструктуру. (来源: dl_weekly, code, dzhng)

Другие AI-инструменты и платформы : StackOverflow запустил собственный AI-продукт для вопросов и ответов, интегрирующий технологию RAG. NotebookLM предлагает персонализированное руководство по проектам, предоставляя индивидуальные инструкции по использованию на основе описания проекта пользователя, а также поддерживает многоязычные видеообзоры. (来源: karminski3, demishassabis)

📚 Обучение
Новости AI-исследований и академических конференций : NeurIPS 2025 принял статьи «Searching Latent Program Spaces» и «Grafting Diffusion Transformers» в качестве устных докладов, исследующих пространства скрытых программ и преобразования архитектуры Diffusion Transformer. Продолжается второй этап рецензирования статей для AAAI 2026. Конференция AI Dev 25 будет посвящена AI-кодирующим агентам и тестированию программного обеспечения. Количество общедоступных наборов данных на платформе Hugging Face превысило 500 000, и запущен проект ML for Science. (来源: k_schuerholt, DeepLearningAI, DeepLearningAI, huggingface, huggingface, realDanFu, drfeifei, Reddit r/MachineLearning)

Теория обучения и оптимизации LLM : Обсуждается проблема низкой эффективности обучения с подкреплением (RL) при обучении передовых моделей, указывается, что его вычислительная стоимость на бит информации значительно выше, чем у предварительного обучения. Предложена метакогниция LLM для повышения точности и эффективности вывода LLM, уменьшая «раздувание токенов». Команда Янна ЛеКуна предложила фреймворк LLM-JEPA. Тенденции развития вычислительной и информационной эффективности предварительного обучения Transformer, в будущем возможно перефокусирование на информационную эффективность. (来源: dwarkesh_sp, NandoDF, teortaxesTex, percyliang)

Ресурсы для изучения AI Agents и технологий RAG : Представлены дорожная карта обучения и краткое руководство по AI Agents, а также сравнительный анализ RAG Pipeline, Self RAG и Agentic RAG, чтобы помочь учащимся систематически освоить технологии AI-агентов. Эндрю Ын обсуждает применение AI-кодирующих агентов в автоматизированном тестировании программного обеспечения. (来源: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, DeepLearningAI)

Безопасность и оценка производительности AI-моделей : Подчеркивается, что надежная способность AI-агентов вызывать инструменты является ключом к общему интеллекту. Модель Guardian служит уровнем безопасности, обнаруживая и фильтруя вредоносные подсказки и выводы, обеспечивая безопасность AI. Обсуждаются причины и решения проблемы недетерминированности вывода LLM, указывается, что пакетная обработка является основным фактором, и предлагаются операции, инвариантные к пакетам. (来源: omarsar0, TheTuringPost, TheTuringPost)

Исследования применения AI в науке и инженерии : Интерпретируемые клинические модели в сочетании с XGBoost и Shap повышают прозрачность в области медицины. В бенчмарке EpilepsyBench модель SeizureTransformer показала 27-кратный разрыв в производительности, исследователи тренируют архитектуру Bi-Mamba-2 + U-Net + ResCNN для исправления. Mojo matmul реализует более быстрое умножение матриц на архитектуре NVIDIA Blackwell. Фреймворк ST-AR улучшает понимание и качество генерации изображений моделями. (来源: Reddit r/MachineLearning, Reddit r/MachineLearning, jeremyphoward, _akhaliq)

Методы и вызовы в обучении AI : Важность качества и количества данных в обучении, подчеркивается, что высококачественные человеческие данные превосходят большое количество синтетических данных. Dorialexander ставит под сомнение «бит/параметр» как единицу измерения. Jeff Dean о карьере ученого-компьютерщика. Generative AI Expert Roadmap и дорожная карта изучения Python предоставляют руководство по обучению. (来源: weights_biases, Dorialexander, JeffDean, Ronald_vanLoon, Ronald_vanLoon)