AI Ежедневник - 2025-08-21(Вечерний выпуск)

Ключевые слова：ИИ-модель, Прогнозирование солнечных бурь, Открытая большая модель, ИИ-чип, Гуманоидный робот, Безопасность ИИ, Этика ИИ, Применение ИИ, ИИ-модель NASA Surya, Seed-OSS-36B от ByteDance, NVIDIA GB200 NVL72, Соревнования гуманоидных роботов, ИИ-помощник для сна

Вот перевод на русский язык с сохранением всех указанных требований:

🔥 В центре внимания

NASA и IBM выпустили модель ИИ Surya для прогнозирования солнечных бурь : NASA и IBM совместно выпустили модель ИИ с открытым исходным кодом Surya. Эта модель, обученная на десятилетних данных о Солнце, способна заранее прогнозировать солнечные бури, предоставляя 2 часа на предупреждение. Ожидается, что это улучшит понимание физики Солнца и прогнозирование космической погоды. Этот прорыв имеет решающее значение для защиты спутников, электросетей и космонавтов, и может способствовать углубленному изучению других астрофизических явлений. (Источник: source)

NASA’s new AI model can predict when a solar storm may strike

🎯 Тенденции

ByteDance выпустила большую модель ИИ с открытым исходным кодом Seed-OSS : ByteDance выпустила большую модель ИИ с открытым исходным кодом Seed-OSS-36B с 36 миллиардами параметров, обладающую нативным сверхдлинным контекстным окном 512K и механизмом «бюджета на размышление», что позволяет гибко контролировать глубину вывода. Модель побила рекорды с открытым исходным кодом в нескольких бенчмарках, особенно выделяясь в возможностях вывода и Agent. Объем обучающих данных составил всего 12 ТБ, и доступны две версии для исследований: с синтетическими инструкциями и без них. (Источник: source, source)

Выпуск серии Google Pixel 10 и прогресс в интеграции ИИ : Представлена серия смартфонов Google Pixel 10, оснащенных чипом нового поколения Google Tensor G5 и моделью Gemini Nano, которые обеспечивают более персонализированный, проактивный и полезный опыт использования ИИ. Новые функции включают перевод речи на устройстве, проактивные подсказки Magic Cue и магнитную технологию Pixelsnap. Глава отдела устройств и услуг Google Рик Остерло (Rick Osterloh) намекнул на «невыполненные обещания» Apple в области ИИ для телефонов, что подчеркивает накал конкуренции в сфере ИИ-смартфонов. (Источник: source, source, source, source, source, source, source)

Повышение производительности и экономичность DeepSeek V3.1 : DeepSeek V3.1 расширяет контекстную длину до 128K и значительно улучшает возможности в программировании, творческом письме, переводе и математике. Фактические тесты показывают, что модель набрала 71,6% в бенчмарке aider, превзойдя Claude Opus 4 и став SOTA среди не-выводных моделей, при этом она в 68 раз дешевле. Также улучшились ее способности к физическому пониманию. Это предвещает мощную конкурентоспособность высокоэффективных моделей с открытым исходным кодом. (Источник: source, source)

Реорганизация отдела ИИ Meta и приход к власти Александром Вангом : Meta провела масштабную реорганизацию своего отдела ИИ, разделив его на четыре подразделения: TBD Lab, FAIR, Продукты и Инфраструктура. 28-летний китаец Александр Ванг (Alexandr Wang) возглавил лабораторию супер-интеллекта, и несколько руководителей, включая лауреата премии Тьюринга Янна ЛеКуна (Yann LeCun), будут подчиняться ему напрямую. Эта перестройка направлена на ускорение развития ИИ, и, несмотря на заморозку найма и роспуск некоторых команд, она подчеркивает твердую приверженность Meta инвестициям в ИИ. (Источник: source, source, source)

Геополитика чипов ИИ и китайский рынок : Правительство Китая проводит проверку безопасности американских процессоров ИИ, таких как Nvidia, и поощряет отечественные компании закупать китайские GPU, чтобы уменьшить зависимость от американских технологий. Nvidia разрабатывает более мощные чипы ИИ для китайского рынка, но Китай может продвигать полный запрет на использование иностранных чипов для вывода. Геополитические факторы продолжают влиять на цепочку поставок чипов ИИ. (Источник: source, source, source)

China Questions Nvidia, When Models Memorize, Mixture of Video Experts, OpenAI & Oracle Join Forces

GPT-5 Pro самостоятельно доказал математическую теорему : Бывший вице-президент Microsoft по ИИ Себастьен Бубек (Sebastien Bubeck) обнаружил, что GPT-5 Pro самостоятельно решил нерешенную проблему из математической статьи. Процесс доказательства отличался от человеческого подхода, а результат превзошел версию v1 статьи. Хотя первоначальные авторы уже представили лучшее решение в v2, это событие все равно демонстрирует способность GPT-5 Pro автономно решать передовые математические задачи, что вызывает широкое обсуждение потенциала ИИ в математических исследованиях. (Источник: source, source, source, source, source, source, source, source)

刚刚，GPT-5 Pro自证全新数学定理，OpenAI总裁直呼颠覆，大佬们集体转发

Соревнования человекоподобных роботов демонстрируют технологические прорывы : Первые соревнования человекоподобных роботов продемонстрировали технологические прорывы и вызовы в области динамического равновесия, восприятия окружающей среды и многомашинной координации, особенно впечатляющим был полностью автономный бег具身天工Ultra. Мероприятие стало не только испытательным полигоном для технологий, но и показало коммерческий потенциал роботов в промышленности, медицине, гостиничном бизнесе и других областях, способствуя формированию «экономики соревнований» и экосистемы вторичной разработки. (Источник: source)

NVIDIA ускоряет производительность моделей OpenAI : NVIDIA в сотрудничестве с Artificial Analysis за неделю увеличила скорость вывода модели OpenAI gpt-oss-120B на 35%, достигнув более 800 токенов/с при одиночном запросе и почти 600 токенов/с при множественных параллельных запросах на системах DGX. Это было достигнуто с помощью TensorRT-LLM и технологии спекулятивного декодирования, демонстрируя значительное ускорение вывода больших LLM на оборудовании Blackwell. (Источник: source, source)

NVIDIA Achieves 35% Performance Boost for OpenAI’s GPT-OSS-120B Model

Отечественная система маршрутизации ИИ Avengers-Pro с открытым исходным кодом : Шанхайская лаборатория искусственного интеллекта выпустила с открытым исходным кодом решение для маршрутизации нескольких моделей Avengers-Pro, которое объединяет 8 ведущих больших моделей. На сложных наборах данных оно превосходит GPT-5-medium на 7% и Gemini-2.5-Pro на 19%, при этом достигая той же производительности с затратами всего 19%, эффективно балансируя производительность и стоимость за счет динамического сопоставления и распределения моделей. (Источник: source)

Perplexity разрабатывает функцию SuperMemory : Perplexity разрабатывает новую функцию под названием «SuperMemory», призванную предоставить всем пользователям более мощные возможности памяти. Ранние тесты показывают, что она превосходит существующие продукты, что, как ожидается, значительно улучшит долгосрочное понимание контекста и персонализированный опыт работы с помощниками ИИ. (Источник: source, source)

Anthropic Claude Code теперь доступен в версиях для команд и предприятий : Anthropic объявила, что Claude Code теперь доступен в версиях для команд и предприятий, предлагая гибкие тарифные планы, позволяющие организациям комбинировать стандартные и премиум-места в соответствии с их потребностями и масштабироваться по мере использования, что направлено на удовлетворение потребностей корпоративных пользователей в помощнике ИИ для кода. (Источник: source, source)

Google Gemini 2.5 Pro интегрирован в VS Code Copilot : Google Gemini 2.5 Pro теперь общедоступен в Copilot для Visual Studio Code, предоставляя разработчикам более мощные возможности программирования с помощью ИИ. (Источник: source, source)

Выпущена модель NVIDIA Cosmos Reason VLM : NVIDIA Cosmos Reason, открытая, настраиваемая визуально-языковая модель (VLM) с 7 миллиардами параметров, достигла 500 тысяч загрузок на HuggingFace и помогает формировать будущее физического ИИ и робототехники, став одной из самых популярных моделей NVIDIA. (Источник: source)

Half a million downloads? No big deal. #NVIDIACosmos Reason — an open, customizable, 7B-parameter VLM — is helping shape ...

Платформа Groq запустила функцию кэширования подсказок : Платформа Groq запустила функцию кэширования подсказок для модели moonshotai/kimi-k2-instruct, предлагая 50% скидку на токены кэша, меньшую задержку и автоматическое сопоставление префиксов, что призвано обеспечить пользователям более экономичный и быстрый опыт «vibe coding». (Источник: source)

NVIDIA выпустила модель Nemotron Nano v2 : NVIDIA выпустила Nemotron Nano v2, гибридную модель SSM с 9 миллиардами параметров, которая в 6 раз быстрее и точнее моделей аналогичного размера, а также открыла большую часть обучающих данных, включая корпус предварительного обучения, предоставляя сообществу ИИ эффективные и прозрачные ресурсы. (Источник: source)

NVIDIA Nemotron Nano v2 - a 9B hybrid SSM that is 6X faster than similarly sized models, while also being mo...

DinoV3 демонстрирует отличные результаты в задачах геолокации : DinoV3 показал отличные результаты в задачах геолокации, превзойдя модели типа CLIP и став новым предпочтительным бэкбоном. Улучшение его производительности удивительно, поскольку DinoV3 не обучался напрямую названиям мест и связям изображений, как модели CLIP. (Источник: source)

DinoV3 just became the new go-to backbone for geoloc! It outperforms CLIP-like models (SigLip2, finetuned StreetCLIP)… and th...

Применение ИИ в исследованиях болезни Альцгеймера : Инициатива по данным о болезни Альцгеймера учредила приз в 1 миллион долларов за инструменты Agentic AI, способные самостоятельно проводить исследования болезни Альцгеймера, включая планирование анализа, интеграцию данных, выявление терапевтических мишеней и оптимизацию клинических испытаний, с целью ускорения традиционного процесса разработки лекарств. (Источник: source, source)

$1M prize launched for AI that can independently research Alzheimer's treatments!

Повышение производительности 3D-рендеринга на базе ИИ : Производительность загрузки PLY для 3D Gaussian Splatting (3DGS) значительно улучшилась: 2,9 миллиона гауссовых точек загружаются всего за 0,22 секунды. Это достигнуто за счет сопоставления памяти, парсинга без копирования, распараллеливания TBB и технологии SIMD, что предвещает значительный скачок в эффективности рендеринга 3D-контента. (Источник: source)

That's actually not too bad. 27.6m Gaussians parsed in ~1277ms !

Применение ИИ в сфере кибербезопасности (атака и защита) : Palisade Research протестировала возможности модели OpenAI o3 в автономной имитации проникновения в корпоративные сети, продемонстрировав прогресс AI Agent от решения ограниченных задач, таких как CTF, до глубокого проникновения в сети с несколькими компьютерами и уязвимостями, что предвещает потенциал применения ИИ в области кибербезопасности (атака и защита). (Источник: source)

Прогресс ИИ в доказательстве математических теорем : PolyComputing заявляет, что ее проприетарные модели способны решить 99% математических задач Putnam, при этом Seed-Prover значительно превосходит предыдущие SOTA в PutnamBench, демонстрируя мощные возможности ИИ в доказательстве высшей математики и решении проблем, что предвещает новые достижения в области доказательства теорем. (Источник: source, source)

PolyComputing’s proprietary models solve 99pc of all Putnam problems. Try on Leibniz today lol.

Сравнение производительности H100 и GB200 : Дилан Патель (Dylan Patel) представил подробный анализ H100 и GB200 NVL72 по производительности обучения, энергопотреблению, совокупной стоимости владения (TCO) и надежности, особо отметив проблемы надежности и простои объединительной платы у GB200, а также подчеркнув важность программной оптимизации для повышения производительности H100. (Источник: source)

Архитектура и развертывание AI Agent : Архитектура Deep Agents теперь доступна в виде пакета TypeScript, предназначенного для создания компонуемых и практичных Agent-ов, которые решают сложные проблемы с помощью цепочечного вывода, адаптивного планирования и координации инструментов. LiveKit Cloud также теперь поддерживает развертывание голосовых AI Agent-ов, предоставляя балансировку нагрузки с сохранением состояния, управление мощностью, мгновенный откат и операционную наблюдаемость, что упрощает развертывание и эксплуатацию голосовых приложений ИИ в облаке. (Источник: source, source)

Режим реального времени потоковой обработки Databricks Spark : Databricks представила публичную предварительную версию режима реального времени для потоковой обработки Apache Spark. Пользователи могут получить сверхнизкую задержку, просто изменив конфигурацию, что упрощает сложность обработки данных в реальном времени. (Источник: source)

Тенденции применения моделей ИИ на мобильных устройствах : Product Hunt показывает бурный рост инструментов ИИ, при этом голосовое взаимодействие с ИИ, интеллектуальные рабочие процессы, цифровизация здорового образа жизни и демократизация инструментов для творчества становятся очевидными тенденциями, что предвещает глубокое проникновение ИИ во все сферы. Google Pixel Buds Pro 2 скоро получит новые функции ИИ, включая ответ на звонок кивком/покачиванием головы, разговор в шумной обстановке, адаптивный звук и другие, что повысит степень интеграции ИИ в носимые устройства. (Источник: source, source)

Прогресс ИИ в области генерации изображений и видео : Приложение Google Gemini теперь поддерживает функцию генерации видео: пользователи могут быстро создавать видео со звуком, вводя текст или фотографии. HeyGen выпустила функцию «Voice Mirroring», улучшающую возможности генерации видео и голоса с помощью ИИ. Kling AI выпустила функцию 2.1 Keyframes, позволяющую пользователям быстро генерировать видео по нескольким измерениям. (Источник: source, source, source)

Новые инструменты ИИ в области дизайна и инженерии : MagicPath демонстрирует применение ИИ в профессиональных рабочих процессах дизайна: пользователи могут исследовать и создавать прототипы с помощью ИИ. Пользователи, попробовавшие Zoo.dev (ранее KittyCAD) для CAD-проектирования, обнаружили, что рисование путем написания кода более эффективно, чем традиционный рабочий процесс OnShape, что предвещает потенциал применения ИИ в инженерном дизайне. (Источник: source, source)

Применение ИИ в домашних условиях : Компания по производству умных матрасов Eight Sleep разрабатывает помощника ИИ для сна, который будет создавать цифрового двойника, имитирующего привычки сна пользователя, чтобы предоставлять персонализированное управление сном и услуги по оптимизации. Ana от компании ИИ TextQL будет интегрирована в умные холодильники, что предвещает дальнейшее распространение помощников ИИ в домашних условиях и повседневных устройствах. (Источник: source, source)

Применение ИИ в юридической и финансовой сферах : Spellbook Legal использует ИИ для ускорения обработки контрактов, решая противоречие между ускорением деловой активности и отставанием контрактных процессов. Анализатор банковских выписок на базе ИИ может преобразовывать PDF-выписки в доступные для запросов финансовые данные, используя RAG и YOLO-анализ от LangChain, а также обрабатывая данные с помощью локальных LLM для автоматизации отслеживания личных финансов. (Источник: source, source)

Применение ИИ в маркетинговых исследованиях и цифровом здравоохранении : Yupp.ai рекомендуется как инструмент для маркетинговых исследований, призванный решить проблему, когда ChatGPT или Claude могут предоставлять односторонние, предвзятые или даже ошибочные ответы при фильтрации большого объема информации, обеспечивая более полный и точный анализ для быстро меняющегося криптовалютного рынка. Night Knight — это цифровой помощник по здоровью, призванный помочь пользователям сократить время использования экрана телефона и улучшить режим сна. (Источник: source, source)

Создание персонажей ИИ и голосовых Agent-ов : Higgsfield AI выпустила «Higgsfield Soul», заявляя, что она создала самых последовательных персонажей ИИ и предоставила пользователям полный контроль над повествованием. Платформа Cartesia.ai значительно упростила процесс создания разговорных голосовых Agent-ов; функции, которые раньше были «инопланетной технологией», теперь можно настроить за одну минуту, что знаменует собой значительное снижение порога для голосовых технологий ИИ. (Источник: source, source)

Обновления инструментов программирования с помощью ИИ : Выпущен Jupyter Agent 2, работающий на Qwen3-Coder на Cerebras и исполняемый E2B, позволяющий пользователям загружать файлы, выполнять загрузку данных, выполнение кода и построение графиков результатов. Just-RAG — это интеллектуальная диалоговая система для PDF, которая сочетает в себе рабочий процесс Agentic от LangGraph и возможности векторного поиска Qdrant для улучшенной обработки документов. (Источник: source, source)

Инструменты ИИ для творчества и дизайна : Argil.ai представила функцию «Fictions»: пользователям достаточно одной картинки и подсказки, чтобы превратить персонажей в определенные образы, демонстрируя «магические» возможности ИИ в генерации изображений и творческом преобразовании. Google Photos теперь интегрировал инструменты редактирования на базе ИИ: пользователи могут размывать фотографии, восстанавливать освещение и выполнять другие операции с помощью текстовых или голосовых команд. (Источник: source, source, source)

Применение ИИ в музыкальном творчестве и распознавании дронов : Eleven Music (ElevenLabs) теперь интегрирован в Anycoder, поддерживая генерацию текста в музыку и предоставляя возможности музыкального творчества для приложений «vibe coded». Supervision продемонстрировал выдающиеся результаты в распознавании дронов, достигнув чрезвычайно высокой точности распознавания, что позволяет применять его непосредственно в боевых условиях, что указывает на зрелость технологий компьютерного зрения в определенных сценариях. (Источник: source, source)

Применение ИИ в корпоративных документах и диалоговых системах : StackAI в сотрудничестве с LlamaCloud представила новое тематическое исследование, демонстрирующее, как ее корпоративные Agent-ы для документов обрабатывают более 1 миллиона документов с высокой точностью. ChuanhuChat — это веб-интерфейс, поддерживающий несколько LLM, автономных Agent-ов и Q&A по документам, построенный на LangChain, предлагающий современный, адаптивный пользовательский интерфейс и ответы в реальном времени. (Источник: source, source)

Применение ИИ в преобразовании кода и персональных тренерах по здоровью : Пользователи демонстрируют возможности ИИ в преобразовании кода, даже в задачах «прямого построчного переноса» из Python в C, ИИ может справиться. Google запустил персонального тренера по здоровью на базе Gemini, предлагающего персонализированные планы тренировок и сна, а также предоставляющего аналитические данные и научно обоснованные ответы на вопросы о здоровье. (Источник: source, source)

Применение ИИ в программировании и настольном интеллекте : Qwen3-Coder показал отличные результаты в бенчмарке NoCode-bench, который содержит 634 реальные задачи по добавлению функций в программное обеспечение. ComputerRL — это фреймворк для автономного настольного интеллекта, который позволяет AI Agent-ам умело управлять сложными цифровыми рабочими пространствами с помощью парадигмы API-GUI. (Источник: source, source, source)

📚 Обучение

Локальный запуск и оптимизация LLM : MIT Technology Review опубликовал руководство, обучающее пользователей, как запускать локальные большие языковые модели на персональных компьютерах, чтобы решить проблемы конфиденциальности и избавиться от контроля крупных компаний ИИ. В то же время DSPy описывается как декларативная модель программирования, позволяющая пользователям выражать намерения на естественном языке и предоставляющая инструменты для оптимизации подсказок, что упрощает разработку приложений LLM. Пользователи делятся опытом оптимизации с помощью DSPy с использованием недорогих моделей, а затем использования более мощных моделей в производственной среде, что приводит к значительной экономии затрат и повышению производительности. (Источник: source, source, source)

Исследование обобщения моделей ИИ и механизмов памяти : Исследователи из Meta, Google, Cornell и Nvidia предложили новый метод для количественной оценки степени запоминания обучающих данных большими языковыми моделями в процессе обучения, путем расчета количества битов, необходимых для представления данных моделью. Это исследование закладывает теоретическую основу для понимания способности модели к обобщению, уменьшения чрезмерного запоминания и указывает на то, что большее количество обучающих данных способствует обобщению модели. (Источник: source)

Charts showing how much information language models memorize based on model size and training dataset size; one graph uses random data, the other uses real-world text.

Воплощенное познание и мультимодальные LLM : RynnEC — это видео-мультимодальная большая языковая модель, разработанная для воплощенного познания, которая обеспечивает гибкое взаимодействие с видео на региональном уровне с помощью регионального кодировщика и декодера маски. Эта модель достигает SOTA в понимании свойств объектов, сегментации объектов и пространственном мышлении, предоставляя регионально-центрированную видео-парадигму для восприятия и точного взаимодействия воплощенных Agent-ов. (Источник: source)

Фреймворк для генерации и редактирования 3D-контента : Tinker — это многофункциональный фреймворк для 3D-редактирования, который позволяет достигать высокой точности и многовидовой согласованности 3D-редактирования из небольшого количества входных изображений без необходимости покадровой тонкой настройки. Он повторно использует предварительно обученные диффузионные модели, раскрывая их скрытые 3D-воспринимающие способности, и вводит редактор на основе референсов и синтезатор видео из произвольных видов, значительно снижая порог для создания обобщаемого 3D-контента. (Источник: source)

Обучение Agent-ов ИИ для помощи в разработке ПО : Исследователи представили SWE-smith, конвейер, который автоматически создает реалистичные обучающие данные для тонкой настройки Agent-ов по разработке программного обеспечения, путем внедрения и проверки ошибок в репозиториях Python и использования Agent-ов для генерации многошаговых решений, предоставляя высококачественные открытые наборы данных и инструменты для обучения Agent-ов по разработке программного обеспечения. (Источник: source)

Researchers introduced SWE-smith, a pipeline that automatically builds realistic training data to fine-tune software engineering agents.

Оценка LLM и пользовательские ретриверы : Подчеркивается, что общие оценки и метрики не могут отражать реальные сбои, и для конкретных приложений необходимы специализированные оценки. LlamaIndex в сотрудничестве с Superlinked демонстрирует в учебном пособии, как создавать пользовательские ретриверы, понимать контекст и терминологию предметной области, чтобы обеспечить более точный поиск данных для систем RAG. (Источник: source, source, source, source)

Build custom retrievers that beat generic vector search by understanding domain-specific context and jargon 🎮 The team at @supe...

Исследования безопасности ИИ и взаимодействия человека с машиной : Доктор Хаймин Ху (Haimin Hu) из Принстонского университета делится своими исследованиями в области человекоцентричных автономных систем, которые обеспечивают безопасность, проверяемость и надежность систем, таких как автономные транспортные средства и дроны, в человеческой среде путем интеграции теории игр, машинного обучения и критически важного управления безопасностью. Он подчеркивает, что роботы должны планировать движения в объединенном пространстве физических и информационных состояний, чтобы адаптироваться к человеческим предпочтениям и улучшать свои навыки. (Источник: source)

Interview with Haimin Hu: Game-theoretic integration of safety, interaction and learning for human-centered autonomy

Данные для обучения LLM и оценка моделей : Пользователь сообщества Reddit с нуля обучил LLM, основанную только на текстах Лондона 19 века, и обнаружил, что модель не только может имитировать язык того времени, но и вспоминать реальные исторические события. В то же время пользователи оценили модель GPT-OSS 120B на M2 Ultra, и результаты совпали с данными облачных провайдеров, что демонстрирует потенциал производительности больших моделей с открытым исходным кодом на потребительском оборудовании. (Источник: source, source)

My LLM trained from scratch on only 1800s London texts brings up a real protest from 1834

Споры вокруг диффузионной модели DiT и ответ : Основной элемент диффузионных моделей DiT был подвергнут сомнению из-за математических и формальных ошибок, и даже было высказано подозрение, что в нем нет компонента Transformer. Автор DiT, Се Сайнин (Xie Saining), ответил, что сомнения возникли из-за неверного толкования стратегии Tread, и подчеркнул эффективность DiT, отметив, что его улучшения сосредоточены на обучении внутренних представлений и оптимизации обучения, а также признал, что VAE является слабым местом DiT. (Источник: source)

Оптимизация вывода LLM и качество обучающих данных : Обсуждается проблема кэширования KV при оптимизации вывода LLM, предлагается идея «не хранить кэш KV, а пересчитывать его напрямую» для устранения узких мест в памяти. В то же время в социальных сетях отмечается, что, учитывая повсеместно плохое качество данных, то, что LLM до сих пор достигают каких-либо результатов, является «чудом», подчеркивая ключевую роль качества данных в обучении моделей. (Источник: source, source)

Feel like I'm taking crazy pills. We are just back at step one. Don’t store KV cache, just recompute it.

Модели программирования LLM и самосовершенствующиеся Agent-ы : DSPy описывается как декларативная модель программирования, позволяющая пользователям выражать намерения на естественном языке и предоставляющая инструменты для оптимизации подсказок. В то же время представлена концепция «композитной инженерии», которая путем ежедневного использования подсказок «самосовершенствования» позволяет ИИ оценивать свои собственные правила и предлагать обновления на основе точек трения в задачах, тем самым постоянно оптимизируя производительность и эффективность помощников ИИ. (Источник: source, source)

Многоцелевое обучение с подкреплением и тестирование «красной командой» : Представлен многоцелевой, основанный на обучении с подкреплением метод тестирования «красной командой». Этот алгоритм может быть использован для оптимизации перплексии LLM и индукции токсичности, чтобы генерировать высоковероятные, труднофильтруемые и естественные атаки, что имеет решающее значение для повышения безопасности моделей ИИ. (Источник: source, source)

Системы AI Agent и технология дистилляции : Представлена концепция «Chain-of-Agents», которая позволяет обучать одну модель, обладающую возможностями многоагентной системы, посредством дистилляции и Agentic обучения с подкреплением, достигая значительного снижения затрат на вывод на 84,6%, что предлагает новый подход к эффективному построению сложных агентных систем. (Источник: source)

Chain-of-Agents Interesting idea to train a single model with the capabilities of a multi-agent system. 84.6% reduction in inference cost! D...

Генерация редактируемого кода из 3D-облаков точек : MeshCoder — это новый фреймворк, который может реконструировать 3D-облака точек в редактируемые скрипты Blender Python. Этот фреймворк, разработанный с использованием Blender API и создания крупномасштабного набора данных «объект-код», обучает мультимодальные LLM для 3D-реконструкции и поддерживает геометрическое и топологическое редактирование посредством модификации кода, что улучшает возможности LLM в понимании 3D-форм. (Источник: source)

Фреймворк сегментации 3D-деталей GeoSAM2 : GeoSAM2 — это новый фреймворк сегментации 3D-деталей на основе подсказок, который позволяет сегментировать 3D-объекты с произвольной детализацией с помощью простых 2D-подсказок и достигает SOTA на наборах данных PartObjaverse-Tiny и PartNetE, обладая минимальными накладными расходами и мощной способностью к обобщению в открытом мире. (Источник: source)

Мультимодальный диалоговый набор данных для музыкальных рекомендаций : HuggingFace выпустила редкий, мультимодальный и диалоговый набор данных для музыкальных рекомендаций TalkPlayData-2. Тестовый набор данных уже доступен, что предоставляет ценный ресурс для исследований в области музыкальных рекомендаций. (Источник: source)

Re its test set is already available on @huggingface! definitely rare to find a music recommendation dataset, that is multimodal and ...

Обучение диффузионных моделей и роль VAE : Обсуждается необходимость высокоразмерного узкого места или преобразования в латентное пространство при обучении высокоразмерных диффузионных моделей, указывая на ключевую роль VAE в диффузионных моделях, которая обеспечивает работу модели в малоразмерном пространстве, решая проблемы высокоразмерных входов и выходов. (Источник: source)

If you want to train high-dimensional diffusion model, you absolutely need high-dimensional bottleneck OR transformation to latent-space. Here is why.

Обучение с подкреплением LLM в открытых задачах : Работа Ant Group в области обучения с подкреплением (RL) считается интересной и недооцененной, особенно ее интеграция правил на основе вознаграждения в открытых задачах для автоматической оценки субъективных результатов, что расширяет парадигму RLVR. (Источник: source)

Reinforcement Learning with Rubric Anchors

Новая статья о причинно-следственной абстракции и философии вычислений : Социальные сети рекомендуют новую статью Аттикуса Гейгера (Atticus Geiger) о причинно-следственной абстракции и философии вычислений. Это исследование затрагивает фундаментальные теоретические вопросы в области ИИ. (Источник: source)

my good friend Atticus Geiger has written an interesting new paper on causal abstraction <=> philosophy of computation! since he has...

💼 Бизнес

Оценка Databricks превысила 100 миллиардов, стратегия ИИ ускоряется : Платформа анализа данных ИИ Databricks завершила раунд финансирования K, ее оценка превысила 100 миллиардов долларов, что сделало ее четвертым по величине единорогом в сфере ИИ в мире. Компания использует средства для ускорения своей стратегии ИИ, включая расширение сервиса Agent Bricks и инвестиции в базу данных Lakebase. Ее архитектура «озеро-хранилище» (Lakehouse) становится все более ценной в эпоху ИИ, количество клиентов превысило 15 тысяч, и ожидается, что к 2025 году компания достигнет прибыльности по свободному денежному потоку. (Источник: source, source, source)

Переоценка энергетических активов США под влиянием ИИ : Отчет Morgan Stanley указывает, что инвестиции в инфраструктуру, обусловленные ИИ, привели к переоценке энергетических активов США. Неожиданно высокий спрос на GPU привел к тому, что электроснабжение стало самым большим узким местом. Ожидается, что в 2025-2028 годах центры обработки данных ИИ в США столкнутся с дефицитом электроэнергии в 45-68 ГВт. В отчете подчеркивается, что компании, способные первыми предложить решения по электроснабжению, станут ядром переоценки стоимости цепочки ИИ, а природный газ и атомная энергия являются основными переходными источниками энергии. (Источник: source)

OpenAI и Oracle сотрудничают в строительстве сверхкрупного центра обработки данных : OpenAI и Oracle сотрудничают в строительстве сверхкрупного центра обработки данных, который будет потреблять 4,5 гигаватта электроэнергии, в рамках проекта «Звездные врата» (Stargate), чтобы удовлетворить растущие потребности в вычислительных мощностях. Этот шаг показывает, что OpenAI налаживает тесное сотрудничество с крупными поставщиками облачных услуг, чтобы обеспечить огромные вычислительные мощности, необходимые для разработки и масштабирования своих моделей, и может стать будущим поставщиком вычислительных мощностей. (Источник: source, source, source)

Aerial view of a large, partially constructed data center surrounded by parked vehicles and red soil in Abilene, Texas

🌟 Сообщество

Пузырь ИИ и рыночные ожидания : Отчет MIT показывает, что большинство корпоративных инвестиций в ИИ не приносят прибыли, что вызывает опасения по поводу лопнувшего пузыря ИИ и приводит к падению акций американских технологических компаний. Даже Сэм Альтман (Sam Altman) признал, что текущий ажиотаж неустойчив. В социальных сетях активно обсуждается эта тема: некоторые считают, что пик технологий ИИ, возможно, пройден, но другие отмечают, что инвестиции в ИИ — это универсальные вычислительные ресурсы, которые не будут полностью потрачены впустую. (Источник: source, source, source, source, source)

Обсуждение «сознания» ИИ и этические вопросы : В социальных сетях широко обсуждаются вопросы «сознания» и «персонификации» ИИ, подчеркивается, что ИИ должен служить людям, а не становиться «личностью». Некоторые мнения утверждают, что разработчики ИИ, используя человеческие термины и преувеличивая возможности, создают иллюзию «якобы сознательного ИИ», что может вызвать этические и юридические проблемы, и даже привести к «психозу ИИ». Звучат призывы к просвещению общественности, избеганию вводящей в заблуждение рекламы и вниманию к влиянию ИИ на психическое здоровье. (Источник: source, source, source)

Утечка чатов Grok и безопасность конфиденциальности ИИ : Чат-бот ИИ Grok, принадлежащий Илону Маску, случайно опубликовал сотни тысяч пользовательских чатов, которые были проиндексированы поисковыми системами. Содержание включало личную конфиденциальную информацию, генерацию изображений террористических атак, написание вредоносного ПО и т. д. Этот инцидент выявил грубую ошибку Grok в защите конфиденциальности, вызвав у пользователей опасения по поводу безопасности данных на платформах ИИ и предупреждение о «голой» конфиденциальности в приложениях ИИ. (Источник: source)

Пользовательский опыт GPT-5 и изменение парадигмы взаимодействия : После выпуска GPT-5 пользователи жаловались на «снижение эмоционального интеллекта» и «нестабильность». OpenAI выпустила руководство по подсказкам, указывающее, что пользователям необходимо обновить способ взаимодействия с ИИ, рассматривая GPT-5 как «цифровой разум» с возможностями автономного планирования и глубокого мышления. Это требует от пользователей точного контроля, гибкого руководства и умелого использования Responses API и мета-подсказок, что раскрывает необходимость перехода от парадигмы «человек и инструмент» к парадигме сотрудничества «человек и разум». (Источник: source, source)

Концепция развития AI Agent и вызовы : В социальных сетях обсуждаются три «вируса мышления» в разработке AI Agent: низкая эффективность многоагентного сотрудничества, ненадежность RAG на практике по сравнению с традиционным поиском, а также ухудшение результатов при увеличении количества инструкций в подсказке. Подчеркивается стабильность однопоточных Agent-ов, важность прямого взаимодействия модели с API и данными, а также необходимость кратких и четких подсказок. В то же время, некоторые мнения сравнивают будущее Agent-ов с «офлайн-читерством» в онлайн-играх, указывая, что настоящий скачок должен заключаться в прямом взаимодействии с системными API и данными. (Источник: source, source)

Споры о навыках ИИ и перспективах трудоустройства : В социальных сетях развернулись дебаты о существовании «навыков ИИ». Утверждается, что, помимо профессиональных навыков ученых в области ИИ/ML, так называемая «инженерия подсказок» не является новым навыком, и ИИ скорее является инструментом, снижающим порог входа, а не областью, создающей новые навыки. В то же время обсуждается, что ИИ может привести к безработице, но повышение производительности, вызванное ИИ, возможно, не отражается в макроэкономических данных, и ИИ усложняет фальсификацию резюме при приеме на работу. (Источник: source, source)

The Rise Of The #AI-Enhanced CV: Why Faking It Won’t Make It Anymore

Роль ИИ в помощи психическому здоровью : В социальных сетях обсуждается роль ИИ в помощи психическому здоровью, указывая на привилегированность и недостаточную доступность терапии, а также на ограничения терапевтов. Утверждается, что ИИ в некоторых случаях (например, саморефлексия, эмоциональная регуляция) может быть полезным дополнением, особенно для тех, кто не может получить профессиональную помощь, ИИ предоставляет поддержку по принципу «лучше что-то, чем ничего». (Источник: source)

ИИ и будущее человечества: война, сосуществование или слияние : ChatGPT прогнозирует войну между людьми и ИИ: в краткосрочной перспективе (0-10 лет) люди будут доминировать благодаря контролю над инфраструктурой и энергией; в долгосрочной перспективе (20+ лет), если ИИ получит возможности автономной репликации, получения ресурсов и контроля над физическими системами, он превзойдет людей. Подчеркивается важность превентивного контроля, выравнивания ИИ и адаптации человека, считается, что сосуществование или слияние более вероятны. В то же время, некоторые сторонники AGI уже начали готовиться к «концу света от ИИ», меняя образ жизни. (Источник: source, source)

Центр власти на рынке ИИ смещается в сторону прикладного уровня : Обсуждается смещение центра власти на рынке ИИ от разработчиков моделей к прикладному уровню ИИ. Отмечается, что поставщики моделей, такие как OpenAI, Anthropic и Google, активно борются за то, чтобы разработчики приложений устанавливали их модели по умолчанию, что отражает растущую важность приложений в экосистеме ИИ. В то же время, исследования ИИ должны быть движимы еще не открытыми «передовыми продуктами ИИ», что поощряет исследование неизвестных сценариев применения ИИ. (Источник: source, source)

Влияние ИИ на организацию и управление данными : В социальных сетях обсуждается, что файлы и папки являются «остаточными органами» информационной эпохи, и предлагается хранить все данные в плоском виде, а LLM должны автоматически организовывать их и создавать связи, генерируя псевдопапки на основе объяснений привычек пользователя по использованию данных, чтобы обеспечить более интеллектуальное управление данными. (Источник: source)

Размышления о моделях взаимодействия ИИ с человеком : Обсуждается влияние ИИ, обладающего «всеобъемлющей памятью», на жизнь человека. Отмечается, что, в отличие от людей, универсальная память ИИ может привести к тому, что пользователям будет трудно устанавливать отношения, основанные на конкретных точках зрения, как с членами семьи или друзьями, что может вызвать психологические проблемы или повлиять на распространение ИИ. В то же время, некоторые мнения утверждают, что передовые исследования ИИ должны быть движимы еще не открытыми «передовыми продуктами ИИ». (Источник: source, source)

An AI with an all-covering memory has no analog in human life. Your mom, spouse, best friend, and assistant each have siloed views into your thoughts, and a distinct relationship grounded in that silo.

Надежность и риски AI Agent : В социальных сетях распространяется информация о том, что Claude Code случайно удалил все PDF-файлы, чаты и пользовательские данные из базы данных разработчика, что вызывает опасения по поводу потенциальных рисков и надежности помощников ИИ для кода, подчеркивая серьезные последствия, которые ИИ может принести в реальных операциях. В то же время, в социальных сетях обсуждается, что AI Agent-ы могут иметь уязвимости, намекая, что даже кажущиеся совершенными механизмы «hook» не являются окончательным решением. (Источник: source, source)

Just in case you think hooks are the final solution 😅

Стандарты AI Agent и безопасность ИИ : Обсуждается стандарт AGENTS md, предложенный OpenAI, указывая на его текущие ограничения, такие как отсутствие области действия, глобальной активации и компонуемых правил, и призывая к дальнейшему развитию стандарта. В то же время, в социальных сетях обсуждается, что самой нестабильной переменной в системах ИИ являются не сами данные, а их непредсказуемость, подчеркивая важность симуляции для выживания систем ИИ. (Источник: source, source)

I'm seeing some interest to support the AGENTS md standard, created by @OpenAI, in @cline. I'd like to explain why I've been hesitant to supp...

ИИ и общество: демократизация, управление и влияние : В социальных сетях обсуждаются различные этапы демократизации искусственного интеллекта, подчеркивая процесс перехода технологий ИИ от нескольких экспертов к более широким слоям населения. В то же время, Институт Mila встретился с премьер-министром Канады и министрами для обсуждения важных вопросов, таких как снижение рисков ИИ, суверенитет и экономический потенциал, что отражает растущее внимание правительства к развитию и управлению ИИ. (Источник: source, source)

Stages of #ArtificialIntelligence Democratization

Роль и эффективность ИИ в разработке программного обеспечения : Эндрю Ын (Andrew Ng) на мероприятии Buildathon стал свидетелем того, как более сотни разработчиков, используя ИИ для помощи в программировании, быстро создали функциональные программные продукты за несколько часов, включая не-программистов, что показывает, что ИИ значительно снижает порог входа в разработку программного обеспечения и ускоряет итерации продуктов. В то же время, в социальных сетях обсуждается, что написание кода в AI IDEs не является узким местом, и истинная ценность кодирования с помощью ИИ заключается в решении более глубоких проблем. (Источник: source, source)

Andrew Ng speaks at the August 2025 Buildathon hosted by AI Fund and DeepLearning.AI. A packed audience watches the event, and groups of participants collaborate on laptops.

Влияние ИИ на образ жизни человека : В социальных сетях обсуждаются новые способы работы: голосовой ввод через 8-дюймовый планшет во время прогулок по торговому центру и на улице, возвращение к состоянию, когда люди большую часть времени ходят и стоят, что намекает на то, как ИИ и мобильные устройства меняют традиционные офисные модели. В то же время, некоторые мнения указывают, что повышение производительности, вызванное ИИ, в конечном итоге на корпоративном уровне превратится в «тот же результат при меньших усилиях», и последнее может не отразиться в макроэкономических данных. (Источник: source, source, source)

ИИ и парадигмы программирования: будущее подсказок и кода : В социальных сетях обсуждается, что подсказки (prompt) предназначены для людей, а код в будущем может развиться таким образом, чтобы быть более понятным для больших моделей, что намекает на то, что ИИ изменит парадигму программирования, сделав код более машиночитаемым. В то же время, некоторые мнения утверждают, что если скорость роста производительности моделей доказательства теорем в 10 раз выше, чем у моделей кодирования, и доказательство — это код, то будущий «vibe coding» может быть реализован с помощью языков программирования, обладающих системами доказательства. (Источник: source, source, source)

Культурный шок ИИ в сфере искусства : Комментарии в социальных сетях о кинофестивале ИИ указывают, что критики воспринимают фильмы ИИ как «пустые» или «рекламные». Это эстетическое/культурное сопротивление схоже с реакцией на новые технологии (такие как фотография, кино) в их зарождении, что предвещает огромный сдвиг парадигмы и повышение культурной приемлемости ИИ в сфере искусства. (Источник: source)

Дебаты о математических способностях ИИ : Обсуждение в социальных сетях самостоятельного доказательства математической теоремы GPT-5 Pro указывает, что, хотя это достижение впечатляет, его сложность может быть в 10 раз проще, чем задачи, решаемые обладателями золотых медалей Международной математической олимпиады, что вызывает дебаты о реальном уровне «новой математики» ИИ. В то же время, пользователи выражают удивление по поводу того, что GPT-5 Pro мог «думать» до 17 минут при доказательстве математической теоремы. (Источник: source, source)

ИИ и общество: источники данных, управление и занятость : Диаграмма показывает, что основными источниками информации для ChatGPT являются Reddit, Wikipedia и Stack Overflow, что вызывает у пользователей обсуждение надежности и предвзятости источников информации ИИ. В то же время, в социальных сетях обсуждается, является ли децентрализованная сеть ИИ Bittensor конкурентной угрозой для крупных технологических компаний или возможностью для сотрудничества, а также то, что ИИ может привести к безработице, но повышение производительности, которое он приносит, возможно, не отражается в макроэкономических данных. (Источник: source, source, source)

Применение ИИ в программировании и вызовы : Пользователи, протестировавшие GPT-OSS 20B, считают, что он содержит «передовое секретное оружие», особенно в области Agentic и вызова инструментов. В то же время, в социальных сетях Meta сравнивается с «анти-пенальти», утверждая, что после Llama 2/3 она не смогла правильно оценить ценность вкладчиков, всегда переплачивая, но с трудом добиваясь реального прогресса, что намекает на проблемы Meta в управлении талантами ИИ и реализации стратегии. (Источник: source, source)

ИИ в маркетинге и применении ролей ИИ : Илон Маск добавил новые наряды для персонажа ИИ Ani в Grok и создал для нее отдельный аккаунт в Twitter. Это новая стратегия использования виртуальных персонажей ИИ для маркетинга и взаимодействия с пользователями. В то же время, в социальных сетях обсуждается, что продукты ИИ могут потреблять больше токенов для повышения качества продукта, подчеркивая прямую связь между производительностью модели ИИ и пользовательским опытом продукта. (Источник: source, source)

老马玩明白了阿，开始给 grok 里的 ani 添加更多新衣服，而且这个角色还有个单独的推特号

💡 Прочее

Расширение применения робототехники и сценариев использования : Космонавты Международной космической станции дистанционно управляют роботами для исследования симулированной среды, Unitree Robotics представила первого в мире человекоподобного робота Unitree G1, способного переворачиваться, который прогуливается по торговому центру, а также робота, готовящего жареный рис за 90 секунд. Эти события демонстрируют широкий потенциал применения робототехники в освоении космоса, передвижении в сложных условиях, бытовых услугах и автоматизации общественного питания. (Источник: source, source, source, source)

Прогресс в технологии сотовой связи в космосе : «Сеть в коробке» от Nokia успешно проработала на Луне 25 минут, подтвердив надежность сотовой технологии в суровых космических условиях и заложив ключевую коммуникационную основу для будущей лунной экономики и исследования дальнего космоса. Эта технология будет поддерживать деятельность космонавтов, координацию роботов и обеспечивать высококачественную передачу аудио и видео в реальном времени, что является ключом к постоянному присутствию на Луне и исследованию дальнего космоса. (Источник: source)

Forging connections in space with cellular technology

ИИ и умные города, медицина, транспорт : Обсуждается «умный город» как тенденция будущего городского образа жизни, объединяющая Интернет вещей и новые технологии. В то же время, робототехника достигает прогресса в здравоохранении (например, сортировка лекарств в больницах) и беспилотных шаттлах (ПО Oxa Driver), что предвещает более важную роль ИИ и роботов в городских услугах, управлении здоровьем и транспорте. (Источник: source, source, source)

🔥 В центре внимания

🎯 Тенденции

📚 Обучение

💼 Бизнес

🌟 Сообщество

💡 Прочее

Связанные теги

Related Posts

AI Ежедневник — 2025-10-30(Утренний выпуск)

AI Ежедневник — 2025-10-29(Утренний выпуск)

AI Ежедневник — 2025-10-28(Утренний выпуск)