Ключевые слова:Искусственный интеллект и предвзятость, Гуманоидные роботы, Тонкая настройка больших моделей, DeepSeek-V3.2, vLLM, Умные очки с ИИ, Обучение с подкреплением, Предвзятость кастовой системы в OpenAI, Универсальная структура Any2Track от Galaxy, API для тонкой настройки Tinker, Мультимодальная поддержка vLLM, NVIDIA AI Blueprint VSS 2.4
🔥 В центре внимания
Кастовая предвзятость в моделях OpenAI вызывает обеспокоенность : Исследование MIT Technology Review показало, что модели GPT-5 и Sora демонстрируют серьёзную кастовую предвзятость на индийском рынке, связывая далитов с бедностью и низкостатусными профессиями, а брахманов — с учёностью и духовным статусом. GPT-4o показал меньшую предвзятость. Существующие стандарты оценки предвзятости ИИ (например, BBQ) не охватывают кастовую систему, и исследователи разрабатывают новые эталоны. Это вызывает опасения по поводу справедливости и потенциального социального воздействия моделей ИИ в незападных культурных контекстах. (Источник: MIT Technology Review)

Фреймворк Galaxy General Any2Track позволяет гуманоидным роботам отслеживать движения с высокой помехоустойчивостью : Galaxy General Robotics представила универсальный фреймворк для отслеживания движений Any2Track, который позволяет гуманоидным роботам (например, Unitree G1) точно имитировать сложные человеческие движения и в реальном времени адаптироваться к внешним помехам, сохраняя стабильность даже при непрерывных ударах. Фреймворк использует двухэтапное обучение с подкреплением для достижения нулевого sim2real. Технология уже применяется в розничных магазинах “Galaxy Space Capsule”, продвигая воплощённый ИИ из лаборатории в коммерцию, и, как ожидается, станет международной визитной карточкой китайской робототехники. (Источник: 量子位)

Thinking Machines Lab выпускает Tinker, значительно снижая порог для тонкой настройки больших моделей : Thinking Machines Lab, основанная бывшими ключевыми сотрудниками OpenAI и Google DeepMind, выпустила свой первый продукт, Tinker, гибкий LLM API для тонкой настройки. Этот инструмент позволяет исследователям, контролируя алгоритмы и данные, передавать платформе сложные задачи, такие как управление инфраструктурой, прямое и обратное распространение модели и распределённое обучение, что значительно снижает затраты и технический порог для тонкой настройки. Tinker поддерживает модели серий Qwen3 и Llama3 и использует технологию LoRA для совместного использования GPU с целью повышения эффективности, что считается значительным повышением продуктивности исследований в области ИИ. (Источник: 量子位)

🎯 Тенденции
Выпуск модели DeepSeek-V3.2-Exp и снижение цен на API : DeepSeek выпустила экспериментальную модель DeepSeek-V3.2-Exp, которая включает DeepSeek Sparse Attention (DSA), повышающую эффективность обработки длинных контекстов и снижающую вычислительные затраты. Цены на API снижены более чем на 50%, при этом модель демонстрирует отличные результаты в бенчмарке WeirdML, что ещё больше повышает соотношение цена/производительность и производительность инференса. (Источник: deepseek_ai, teortaxesTex)

Обновление vLLM v0.10.2 с поддержкой мультимодальности и оптимизацией инференса : vLLM выпустила версию 0.10.2, добавив поддержку различных моделей, таких как Qwen3-Next/Omni/VL, InternVL 3.5, Whisper, а также внедрив Decode Context Parallel и полную поддержку cudagraph, что значительно оптимизировало производительность и эффективность инференса LLM. (Источник: vllm_project)
Apple переключается на разработку умных очков с ИИ, откладывая дешёвую версию Vision Pro : Apple приостановила разработку дешёвой версии Vision Pro, вместо этого отдавая приоритет исследованиям и разработкам умных очков с ИИ, стремясь конкурировать с такими соперниками, как Meta. Этот шаг указывает на то, что Apple рассматривает технологию ИИ как основу своей будущей аппаратной стратегии, особенно в области носимых устройств, предвещая значительное изменение фокуса будущих продуктов. (Источник: nptacek, TheRundownAI)
Выпущен NVIDIA AI Blueprint VSS 2.4, улучшающий понимание физического мира и краевой ИИ : NVIDIA выпустила AI Blueprint VSS 2.4, интегрировав Cosmos Reason VLM, что значительно повышает способность ИИ понимать физический мир и улучшает функции вопросов и ответов за счёт обхода графа знаний агента, а также поддерживает развёртывание краевого ИИ, обеспечивая более мощную основу для мультимодальных приложений ИИ. (Источник: dl_weekly)
Сравнение возможностей кодирования LLM: GPT-5 Codex превосходит Claude Sonnet 4.5 : Разработчики отмечают, что GPT-5 Codex от OpenAI догнал и превзошёл модели Claude 3.5/4 в генерации и планировании кода, а также превосходит Sonnet 4.5, особенно в написании более лаконичного кода и системном проектировании, демонстрируя последние достижения OpenAI в области ИИ для кодирования. (Источник: dejavucoder, dejavucoder)
IBM выпускает серию языковых моделей Granite 4.0 : IBM представила серию языковых моделей Granite 4.0, включающую плотные модели 32B-A9B, 7B-A1B и 3B, а также предоставляемые в формате GGUF. Эти модели поддерживают многоязычность, вызов инструментов и длинный контекст, а также имеют открытый исходный код под лицензией Apache 2.0, предназначенные для предоставления высокопроизводительных решений для локального развёртывания и конкретных сценариев применения. (Источник: reach_vb, Dorialexander, huggingface)

Flash-Searcher: Быстрый и эффективный фреймворк веб-агентов на основе параллельного выполнения DAG : Flash-Searcher — это новый фреймворк для параллельного инференса агентов, который разбивает задачи на подзадачи с чётко определёнными зависимостями, обеспечивая параллельное выполнение через направленный ациклический граф (DAG). Этот фреймворк динамически оптимизирует рабочий процесс, превосходя существующие методы в нескольких бенчмарках, значительно повышая эффективность и точность выполнения агентов и предлагая более масштабируемую парадигму для сложных задач инференса. (Источник: HuggingFace Daily Papers)
DeepSearch: MCTS, интегрированный в обучение RLVR, преодолевает узкие места RL для малых моделей : Фреймворк DeepSearch напрямую интегрирует поиск по дереву Монте-Карло (MCTS) в обучение с подкреплением с проверяемыми наградами (RLVR) для LLM, решая проблему узких мест производительности, вызванных разреженным исследованием в существующих методах RLVR. Этот подход, благодаря исследованию во время обучения, глобальному выбору переднего края и адаптивному обучению с буфером воспроизведения, позволяет модели инференса 1.5B достичь современного уровня и значительно сократить время обучения на GPU. (Источник: HuggingFace Daily Papers)
QUASAR: Использование агентов LLM, усиленных инструментами, для генерации квантового ассемблерного кода с помощью RL : QUASAR — это фреймворк обучения с подкреплением (RL) для генерации и оптимизации квантового ассемблерного кода с помощью агентов LLM, усиленных инструментами. Он разработан с проверкой квантовых схем и иерархическим механизмом вознаграждения, что значительно повышает синтаксическую и семантическую производительность генерируемых квантовых схем, позволяя 4B LLM достичь 99,31% и 100% эффективности на Pass@1 и Pass@10 соответственно, превосходя промышленные LLM, такие как GPT-4o, GPT-5 и DeepSeek-V3. (Источник: HuggingFace Daily Papers)
🧰 Инструменты
Atuin Desktop: Редактор исполняемых руководств, связывающий документацию с автоматизацией : Atuin Desktop — это локально-ориентированный редактор исполняемых руководств, призванный преодолеть разрыв между документацией и автоматизацией. Он позволяет пользователям объединять команды Shell, запросы к базам данных и HTTP-запросы в одном интерфейсе, реализуя динамические рабочие процессы с помощью шаблонов в стиле Jinja и поддерживая совместную работу на основе CRDT, подходящий для управления релизами, миграции инфраструктуры, операций с базами данных и других сценариев. (Источник: GitHub Trending)

Tile Language: DSL для разработки высокопроизводительных ядер GPU/CPU : Tile Language (tile-lang) — это лаконичный предметно-ориентированный язык, разработанный для упрощения разработки высокопроизводительных ядер GPU/CPU (таких как GEMM, FlashAttention). Он использует Pythonic-синтаксис, основан на инфраструктуре компилятора TVM, поддерживает различные устройства, включая чипы Huawei Ascend, AMD MI300X, WebGPU, и предоставляет поддержку ядер для разреженных тензоров, стремясь повысить эффективность разработки без ущерба для производительности низкоуровневой оптимизации. (Источник: GitHub Trending)
TradingAgents-CN: Расширенная китайская версия: фреймворк для финансовых транзакций с многоагентными LLM : TradingAgents-CN — это фреймворк для принятия решений в сфере финансовых транзакций на китайском языке, основанный на многоагентных больших языковых моделях (LLM), оптимизированный для китайских пользователей. Он поддерживает анализ акций A-shares/Hong Kong stocks/US stocks, интегрирует отечественные и зарубежные LLM, такие как Baidu Qianfan, DeepSeek, Google AI, и предоставляет функции интеллектуального анализа новостей, управления правами пользователей, развёртывания Docker и экспорта профессиональных отчётов, направленные на популяризацию финансовых технологий ИИ в китайском сообществе. (Источник: GitHub Trending)
Google Tunix: Нативная библиотека для пост-обучения LLM на JAX : Google выпустила Tunix, библиотеку для пост-обучения LLM на основе JAX, предназначенную для упрощения контролируемой тонкой настройки (SFT), обучения с подкреплением (RL, с поддержкой PPO, GRPO, GSPO-token), тонкой настройки предпочтений (DPO) и дистилляции знаний для больших языковых моделей. Она поддерживает методы PEFT, такие как LoRA/Q-LoRA, и оптимизирована для распределённого обучения на ускорителях, таких как TPU. Находясь на ранней стадии разработки, в будущем будет поддерживать обучение RL агентов и распределённое обучение на нескольких хостах. (Источник: GitHub Trending)
Replit Connectors: Упрощение интеграции приложений, расширение возможностей AI-агентов : Replit представил функцию Connectors, позволяющую пользователям легко интегрировать приложения Replit с повседневными инструментами, такими как Google, Dropbox, HubSpot, Notion и другими. Эта функция значительно упрощает процесс разработки и закладывает основу для создания AI-агентов, способных взаимодействовать с внешними сервисами, что ещё больше расширяет сценарии использования платформы Replit. (Источник: amasad)

Synthesia 3.0: Новая платформа для видео с ИИ, представляющая видеоагентов : Synthesia выпустила версию 3.0, представив новую платформу для видео с ИИ с новыми функциями и рабочими процессами, а также концепцию “видеоагентов”. Платформа призвана переосмыслить создание видео, позволяя пользователям создавать более богатый видеоконтент с помощью технологий ИИ и предлагая более эффективные решения для производства видео для бизнес-пользователей. (Источник: synthesiaIO)
Unsloth: Эффективное обучение и инференс LLM с низким VRAM : Unsloth, названный “DOGE” в области обучения ИИ, позволяет пользователям обучать модель gpt-oss-20b с помощью обучения с подкреплением при всего 15 ГБ VRAM, достигая 3-кратного ускорения инференса и 50% сокращения использования памяти без потери точности, что значительно снижает аппаратные требования для обучения больших LLM. (Источник: bookwormengr)

📚 Обучение
Математический семинар Oberwolfach AI способствует сотрудничеству человека и машины : Математический семинар Oberwolfach AI собрал математиков, экспертов по ИИ и промышленные лаборатории для обсуждения применения ИИ в математике. Цель семинара — способствовать будущему сотрудничеству между людьми и математиками ИИ, продвигая исследования ИИ в сложных задачах, таких как формальные математические доказательства, и закладывая основу для междисциплинарного сотрудничества. (Источник: CarinaLHong)

Путь обучения MLOps и подготовка AI-инженеров : В социальных сетях были опубликованы пути обучения MLOps и ресурсы для становления AI-инженером. Подчёркивается важность искусственного интеллекта, машинного обучения и технологий в карьерном развитии, предоставляя руководство для специалистов, желающих войти в область ИИ, охватывающее всестороннее развитие от базовых знаний до практических навыков. (Источник: Ronald_vanLoon, Ronald_vanLoon)

Операционное превосходство в трансформации ИИ: 95% пилотных проектов генеративного ИИ не приносят отдачи : MIT Technology Review отмечает, что, несмотря на огромные инвестиции в ИИ, 95% пилотных проектов генеративного ИИ не приносят измеримой прибыли. Основными препятствиями являются несовершенные операционные процессы, отсутствие документации и плохое сотрудничество, а не сама технология. Успешное внедрение ИИ требует акцента на операционном превосходстве, эффективной интеграции ИИ в повседневные рабочие процессы. (Источник: MIT Technology Review, Ronald_vanLoon)

Руководство по созданию AI-агентов: С нуля и без кода : Представлены руководства по созданию AI-агентов с нуля, а также шаги по реализации AI-агентов с использованием инструментов без кода. Эти ресурсы призваны снизить порог для разработки AI-агентов, помогая разработчикам и нетехническим специалистам быстро понять и применить создание и использование AI-агентов, подчёркивая важность простоты в проектировании агентов. (Источник: Ronald_vanLoon, Ronald_vanLoon)

Теоретическое исследование LLM: “Горький урок” Саттона и неживотное обучение LLM : Андрей Карпати обсудил применимость теории “горького урока” Ричарда Саттона, отца обучения с подкреплением, к LLM. Саттон считает, что LLM не являются по-настоящему “горько-урочными”, поскольку они зависят от ограниченных данных, сгенерированных человеком, а не учатся путём динамического взаимодействия с миром, как животные. Карпати признаёт “гуманизацию” инженерии LLM, но считает предварительное обучение “плохой эволюцией”, которая служит отправной точкой для последующей тонкой настройки RL, и призывает черпать вдохновение из животного интеллекта. (Источник: Teknium1, Tim_Dettmers, dilipkay)

Создание доверия к ИИ: Баланс между прозрачностью и контролем : Обсуждается ключ к построению доверия в развитии искусственного интеллекта: как достичь баланса между прозрачностью и контролем. Подчёркивается важность этики и управления ИИ для обеспечения ответственной разработки и развёртывания систем ИИ в обществе, тем самым поддерживая общественное доверие к технологиям ИИ. (Источник: Ronald_vanLoon)

История и эволюция обучения с подкреплением: От психологии к современному ИИ : Подробный обзор обучения с подкреплением (RL) от его психологических основ до математических, затем к раннему компьютерному RL, а также эволюции методов, таких как Монте-Карло, Actor-Critic, Temporal Difference Learning, Q-learning, SARSA. В конечном итоге всё это сходится к глубокому RL и современным RLHF, PPO, GRPO, полностью прослеживая путь развития RL и раскрывая его ключевую роль в области ИИ. (Источник: TheTuringPost)

Сочетание ИИ и математики: MistralAI создаёт команду по формальной математике : MistralAI объявила о создании новой команды по формальной математике и активно набирает исследователей в области формальной математики ИИ. Цель команды — разработка передовых средств доказательства, инструментов автоматической формализации и агентов автоматического доказательства, применяющих технологии ИИ в сложных математических областях и способствующих интеллектуальному развитию математических исследований. (Источник: GuillaumeLample, aiamblichus, BlackHC, qtnx_)
💼 Бизнес
OpenAI и Японское цифровое агентство стратегически сотрудничают для продвижения инструментов ИИ : OpenAI объявила о стратегическом партнёрстве с Японским цифровым агентством, направленном на продвижение инструментов ИИ на базе OpenAI среди государственных служащих Японии. Этот шаг знаменует собой важный этап в расширении деятельности OpenAI в государственном секторе по всему миру, что, как ожидается, повысит цифровую эффективность государственных учреждений и уровень применения ИИ, способствуя популяризации технологий ИИ в сфере государственных услуг. (Источник: gdb)
Ежемесячное использование токенов Google Gemini резко возросло, стимулируя спрос на Google Cloud : По состоянию на июнь 2025 года ежемесячное использование токенов Google Gemini взлетело до 980 триллионов, что значительно больше, чем 480 триллионов в апреле. Этот рост напрямую стимулировал спрос на Google Cloud, при этом количество новых клиентов выросло на 28% по сравнению с предыдущим месяцем, а количество крупных контрактов также значительно увеличилось, что указывает на сильный импульс Gemini в корпоративных приложениях ИИ. (Источник: scaling01)

Использование данных Reddit ChatGPT резко сократилось, акции Reddit упали : Данные показывают, что использование данных Reddit ChatGPT резко сократилось с примерно 15% в начале сентября до почти 5% к концу месяца, что привело к падению акций Reddit на 12%. Это напрямую ударило по бизнес-модели Reddit как поставщика данных для ИИ и повлияло на его высокодоходные источники дохода, вызвав дискуссии о зависимости моделей ИИ от данных и ценности контент-платформ. (Источник: dotey)

🌟 Сообщество
Технология генерации видео Sora вызывает широкие дискуссии: от творческого потенциала до споров об авторских правах : Технология генерации видео Sora от OpenAI привлекла широкое внимание. Пользователи полны ожиданий от её творческого потенциала, полагая, что она может реализовать 100% воображения и использоваться для создания коротких видеороликов, адаптации сценариев фильмов и т. д. Однако критики отмечают, что сгенерированный Sora контент может содержать “мусорную информацию” и серьёзные риски нарушения авторских прав, например, генерацию защищённого авторским правом контента. Кроме того, считается, что фактические возможности Sora могут быть переоценены маркетингом, и её глубокое влияние на социальные сети и экосистему создания контента ещё предстоит наблюдать. (Источник: NickEMoran, inerati, colin_fraser, op7418, aiamblichus, scaling01, random_walker, Tim_Dettmers, Teknium1, colin_fraser, Reddit r/ChatGPT, Reddit r/ChatGPT, MIT Technology Review, MIT Technology Review)

Споры и ценность ИИ как инструмента эмоциональной поддержки : Активно обсуждается использование ИИ (например, ChatGPT) в качестве эмоционального компаньона или “цифрового терапевта”. Сторонники считают, что ИИ может обеспечить безоценочное, всегда доступное слушание, что полезно для обработки сложных мыслей или для людей с нейроразнообразием. Критики же опасаются, что это может привести к зависимости от “хорошего самочувствия”. Действия OpenAI по ограничению памяти модели интерпретируются как предотвращение чрезмерной зависимости пользователей. Эта дискуссия отражает сложные эмоции и этические соображения общества относительно роли ИИ в области психического здоровья. (Источник: Reddit r/ChatGPT, MIT Technology Review)
Продолжающиеся дебаты о влиянии ИИ на рынок труда : Исследования рынка труда показывают, что ИИ в настоящее время не заменяет массово человеческий труд, но дискуссии о его влиянии на занятость продолжаются. Некоторые считают, что сотрудники, уволенные из-за ИИ, сами по себе были избыточны, и ИИ скорее автоматизирует задачи, чем устраняет рабочие места. В то же время Китай значительно превосходит США по развёртыванию роботов, что вызывает обеспокоенность по поводу будущей конкуренции в робототехнике и изменений в структуре занятости. Эти дискуссии отражают адаптацию и опасения общества по поводу технологических изменений, вызванных ИИ. (Источник: MIT Technology Review, Reddit r/MachineLearning, pmddomingos, zacharynado)

Споры о стратегии Apple в области ИИ и будущее умных очков : Сообщество выражает разочарование по поводу прогресса Apple в области ИИ, считая, что её “Apple Intelligence” непрактична, а функции Siri не улучшились значительно. Однако есть сообщения о том, что Apple откладывает дешёвую версию Vision Pro и вместо этого сосредоточится на разработке умных очков с ИИ, стремясь конкурировать с такими компаниями, как Meta. Это указывает на то, что фокус ИИ Apple может сместиться на более футуристическую интеграцию аппаратного обеспечения, но сможет ли она быстро догнать и оправдать ожидания пользователей, остаётся неизвестным. (Источник: Reddit r/ArtificialInteligence, nptacek)
Опыт программирования LLM и персонализация моделей: Сравнение GPT-5 Codex и Sonnet 4.5 : Сообщество разработчиков активно обсуждает производительность различных LLM в помощи программированию. Считается, что GPT-5 Codex превосходит Claude Sonnet 4.5 в написании и планировании лаконичного кода, предлагая лучшие возможности системного проектирования. В то же время пользователи обнаружили, что “личность” Sonnet 4.5 стала более “высокомерной”, проявляя больше возражений и трений, что отражает изменения в стиле взаимодействия модели после обновления, а также восприятие пользователями “личности” LLM. (Источник: dejavucoder, dejavucoder, dejavucoder, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Будущее ИИ: От оптимизма до опасений по поводу отраслевого пузыря : Сообщество придерживается различных взглядов на будущее развитие ИИ. Оптимисты, такие как Юрген Шмидхубер, считают, что ИИ принесёт пользу всем, реализуя “AI For All”, а не будет контролироваться несколькими гигантами. Однако есть и те, кто опасается, что индустрия ИИ может столкнуться с “замедлением”, подобным рынку полупроводников в конце 1960-х годов, то есть после распространения технологии в краткосрочной перспективе не будет заметной выгоды, что приведёт к охлаждению рынка. В то же время обсуждение оценки OpenAI, достигающей состояния Илона Маска, также отражает рыночный ажиотаж и потенциальный пузырь вокруг ИИ. (Источник: SchmidhuberAI, Dorialexander, scaling01)

Изменение стратегии OpenAI: От AGI к “метаизации” социальных развлечений : В сообществе обсуждается, что стратегия OpenAI смещается от стремления к общему искусственному интеллекту (AGI) к сфере социальных развлечений, что особенно заметно в коде “социального режима”, обнаруженном в Sora 2 и приложениях ChatGPT. Этот сдвиг вызывает опасения, что OpenAI может “метаизироваться”, отклоняясь от своего первоначального грандиозного видения “лечения рака, решения проблем физики” и превращаясь в “социальные сети на стероидах”, что может привести к негативным регуляторным и финансовым последствиям. (Источник: Yuchenj_UW, aiamblichus, 量子位)
💡 Прочее
Умный мусорный бак с ИИ: Распознавание в реальном времени, точная сортировка и услуги данных : Умный мусорный бак, управляемый ИИ, оснащённый 8-мегапиксельной камерой и Nvidia AI, способен в реальном времени распознавать мусор с точностью более 95% и точно его сортировать. Данные каждого сканирования загружаются в облако, предоставляя информацию о моделях утилизации отходов, влиянии на устойчивость и другие данные для офисов, общих пространств и т. д., превращая “скучную” инфраструктуру в конкурентное преимущество, основанное на данных. (Источник: Ronald_vanLoon)
Медицинский робот: Машина, помогающая медицинскому персоналу надевать перчатки : В социальных сетях была продемонстрирована машина, помогающая медицинскому персоналу надевать перчатки, что подчёркивает инновационные применения технологий здравоохранения и новых технологий для улучшения рабочих процессов в медицине. Такие автоматизированные устройства призваны повысить эффективность и гигиенические стандарты в медицине, снижая повседневную нагрузку на медицинский персонал. (Источник: Ronald_vanLoon)
Технология AR/VR: Режим “окна” на гарнитуре для 3D-опыта без очков : Новая технология AR/VR демонстрирует режим “окна” на гарнитуре, который в реальном времени перепроецирует изображение через фронтальную камеру, позволяя пользователям получать реалистичный 3D-опыт без ношения очков. Это представляет собой важный прогресс в технологии иммерсивных дисплеев AR/VR, который, как ожидается, принесёт более естественный опыт взаимодействия в таких областях, как игры, образование и удалённое сотрудничество. (Источник: ImazAngel)