Ключевые слова:GPT-5 Pro, ИИ в разработке лекарств, ИИ агент, LLM (большая языковая модель), глубокое обучение, безопасность ИИ, мультимодальный ИИ, аппаратное ускорение для ИИ, NICD-with-erasures контрпример, оптимизация VRAM с помощью LoRA-тонкой настройки, генерация видео ИИ Sora 2, управление правами моделей в OpenWebUI, снижение затрат на хранение данных ИИ на 65%

🔥 В центре внимания

Математический прорыв GPT-5 Pro : GPT-5 Pro достиг значительного прогресса в области математики, успешно найдя контрпример к проблеме мажоритарной оптимальности NICD-with-erasures (список Simons, стр. 25). Это открытие демонстрирует, что GPT-5 Pro достиг нового уровня в сложных математических рассуждениях, способен оспаривать существующие математические теории, предвещает огромный потенциал AI в оригинальных математических исследованиях и может способствовать принятию математическим сообществом доказательств, основанных на AI. (Источник: SebastienBubeck, BlackHC, hyhieu226, JimDMiller)

GPT-5 Pro数学突破

AI ускоряет разработку новых антибиотиков : Механизм действия нового антибиотика против воспалительных заболеваний кишечника (IBD) был успешно предсказан AI и подтвержден учеными еще до начала испытаний на людях. Этот прорыв демонстрирует огромный потенциал AI в ускорении открытия лекарств и развитии здравоохранения, обещая сократить циклы разработки новых препаратов и предоставить пациентам более быстрые варианты лечения. Ожидается, что испытания на людях начнутся в течение трех лет. (Источник: Reddit r/ArtificialInteligence)

🎯 Тенденции

AI+XR преобразование видео в реальном времени : Decart XR использует WebRTC для передачи видеопотока с камеры MetaQuest в модель AI в реальном времени, обеспечивая мгновенное преобразование видео. Эта технология демонстрирует инновационное применение AI в области дополненной реальности, обещая пользователям захватывающий, динамичный и совершенно новый визуальный опыт, особенно в играх, виртуальном сотрудничестве и создании креативного контента. (Источник: gfodor)

Выпуск нескольких новых LLM : DeepSeek-V3.2-Exp повышает эффективность рассуждений в длинном контексте и кодирования благодаря механизму разреженного внимания; GLM 4.6 значительно обновлен, улучшая фактическое кодирование, рассуждения и навыки письма; модель Qwen3 VL 30B A3B демонстрирует выдающиеся результаты в визуальных рассуждениях и восприятии. Выпуск этих новых моделей предвещает постоянный прогресс LLM в мультимодальной обработке, обработке длинного контекста и эффективности кодирования. (Источник: yupp_ai, huggingface, Reddit r/LocalLLaMA)

多款新型LLM发布

Технологический стек и архитектура AI Agents : Технологический стек AI Agent и его практическая архитектура в 2025 году быстро развиваются, охватывая все от базовых строительных блоков до продвинутых моделей развертывания. Обсуждения сосредоточены на том, как проектировать эффективные, масштабируемые системы AI Agent для решения сложных задач, что указывает на растущую зрелость AI Agent в практических приложениях. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

AI Agents技术栈与架构

Распространение AI в образовании : Предприниматель без опыта программирования использовал технологию AI для разработки AI-наставника для Министерства образования Иордании, успешно сэкономив 10 миллионов долларов. Это подчеркивает огромный потенциал AI в снижении затрат на образование и повышении его доступности, позволяя даже непрофессионалам использовать AI для решения практических проблем. (Источник: amasad)

Решения для оптимизации затрат на хранение AI : CoreWeave предлагает оптимизировать стратегии хранения данных AI, что может сократить затраты на хранение AI до 65% без ущерба для скорости инноваций. Благодаря таким технологиям, как моментальные снимки памяти, детализированное выставление счетов и многооблачное планирование, платформы, такие как Modal, могут значительно снизить затраты на GPU при обработке внезапных рабочих нагрузок инференса по сравнению с традиционными облачными сервисами, такими как Azure. (Источник: TheTuringPost, TheTuringPost, Reddit r/deeplearning)

AI存储成本优化方案

AI+VR для улучшения психического здоровья : Сочетание виртуальной реальности (VR) и искусственного интеллекта (AI) обещает улучшить лечение психического здоровья. Благодаря иммерсивному опыту и персонализированным вмешательствам, технология AI+VR может предоставить следующему поколению более эмпатичную и связанную среду для роста, предлагая инновационные решения в области психического здоровья. (Источник: Ronald_vanLoon, Ronald_vanLoon)

AI+VR助力心理健康

AI ускоряет научные открытия : Команда Anthropic работает над повышением эффективности использования компьютеров с помощью AI, тем самым ускоряя процесс научных открытий. В настоящее время производительность сквозных базовых моделей на OSWorld выросла с 8% год назад до 61%, приближаясь к человеческому уровню в 72%, что предвещает все более важную роль AI в научных исследованиях. (Источник: oh_that_hat, dilipkay)

AI加速科学发现

OpenAI сотрудничает с Jony Ive над устройством : OpenAI сотрудничает с Jony Ive для разработки портативного AI-помощника без экрана, запуск которого запланирован на 2026 год, но в настоящее время сталкивается с техническими проблемами, такими как основное программное обеспечение, конфиденциальность и вычислительная мощность, что может привести к задержкам. Устройство будет воспринимать окружающую среду через микрофон, камеру и динамики и всегда будет оставаться онлайн. (Источник: swyx, Reddit r/artificial)

OpenAI与Jony Ive合作设备

Обновления Sora и улучшения безопасности : Модель генерации видео Sora от OpenAI получила обновление, представляющее настраиваемую пользователем функцию “гостевых ограничений”, позволяющую создателям контролировать использование их изображений, например, запрещая их использование в политических комментариях или с определенными словами. Кроме того, обновление включает более четкие видимые водяные знаки и повышение безопасности модели для уменьшения ложных срабатываний и устранения уязвимостей. (Источник: billpeeb, billpeeb, sama)

Sora更新与安全改进

Вызовы применения AI в военной сфере : ВВС США тестируют технологию AI, чтобы противостоять прогрессу Китая в области AI-дронов. Отставной генерал-лейтенант США отмечает, что в случае войны с Китаем американским военным потребуется достичь соотношения потерь 10:1 или даже 20:1, чтобы поддерживать боевые действия, а текущие результаты военных учений неоптимистичны, что подчеркивает ключевую роль AI в военной стратегии и срочность конкуренции. (Источник: Reddit r/ArtificialInteligence)

AI在军事领域的应用挑战

AI революционизирует переговоры по юридическим контрактам : Наступила эра переговоров по контрактам, основанных на данных, AI сделает рыночные данные прозрачными для всех, разрушая традиционную монополию “крупных юридических фирм” на информацию. Эта технология обещает повысить эффективность и справедливость переговоров по контрактам, расширяя возможности большего числа предприятий и частных лиц. (Источник: scottastevenson)

AI变革法律合同谈判

Повышение персонализации LLM : Развитие LLM вышло за рамки простых бенчмарков, и ключевым становится то, как модели понимают пользователей и предоставляют персонализированные услуги. Исследовательские работы, такие как PREFDISCO и PDR Bench, сосредоточены на персонализации в мгновенных рассуждениях и долгосрочных глубоких исследованиях, стремясь заставить модели думать и действовать в соответствии с целями, предпочтениями и ограничениями пользователя, а не просто корректировать тон. (Источник: dotey)

LLM个性化能力提升

Состояние экосистемы открытых моделей : Обсуждение текущего состояния открытых моделей, охватывающее рост китайской экосистемы AI, влияние DeepSeek, упадок моделей Llama, а также будущее американского рынка и локальных моделей. Это отражает динамичную конкурентную среду между открытыми и закрытыми моделями AI. (Источник: charles_irl)

开放模型生态系统现状

Технология генерации длинных видео ByteDance : ByteDance представила метод “Self-Forcing++”, который может генерировать высококачественные видео продолжительностью до 4 минут 15 секунд, расширяя диффузионные модели без необходимости в данных для обучения длинных видео или переобучения, сохраняя при этом точность и согласованность видео. (Источник: NerdyRodent)

Тенденции AI в IoT : Десять основных тенденций AI в области Интернета вещей (IoT) в 2026 году заслуживают внимания, предвещая глубокую интеграцию AI и IoT, которая приведет к созданию более интеллектуальных и эффективных устройств и приложений. (Источник: Ronald_vanLoon)

AI在物联网中的趋势

Культура на рабочем месте, управляемая AI : AI становится важной силой, способствующей трансформации культуры на рабочем месте; его применение не только повышает эффективность, но и перестраивает культурный ландшашафт в таких областях, как командное сотрудничество, принятие решений и развитие сотрудников. (Источник: Ronald_vanLoon)

AI驱动的职场文化

Четыре элемента цифровой трансформации : Обсуждаются четыре неотъемлемых компонента трансформации предприятий в цифровые организации, подчеркивая ключевую роль инноваций, технологий и AI. (Источник: Ronald_vanLoon)

数字转型四大要素

Технология протезирования, управляемая AI : 17-летний подросток разработал протез руки, управляемый силой мысли, с использованием технологии AI, демонстрируя огромный потенциал AI в вспомогательных технологиях и улучшении качества жизни человека. (Источник: Ronald_vanLoon)

Прогресс в робототехнике : Колесный прыгающий робот Cecilia и легкая бионическая тактильная рука демонстрируют модульность и расширенные функции робототехнического оборудования. Кроме того, Yondu AI представила решение для комплектации склада с колесными гуманоидными роботами, а также складских роботов, способных перемещаться между поддонами, что значительно повышает эффективность логистики. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

Гуманоидные роботы превосходят человеческие возможности : Обсуждается возможность того, что гуманоидные роботы в будущем превзойдут человеческие возможности, например, выполняя сложные задачи, которые люди не могут или с трудом выполняют, такие как подъем на высокие полки для извлечения предметов, без учета рисков безопасности, что значительно расширит сценарии применения автоматизации. (Источник: EERandomness)

AI-физики и фундаментальные модели квантовой механики : Существует мнение, что фундаментальные модели квантовой механики станут следующим рубежом для LLM, и AI-физики смогут изобретать новые материалы. Это предвещает прорывные достижения AI в фундаментальных научных исследованиях, особенно в слиянии биологии, химии и материаловедения на квантовом уровне. (Источник: NandoDF)

Sora 2 решает задачи ARC-AGI : Sora 2 при попытке решить задачи ARC-AGI (Abstract Reasoning Context — Artificial General Intelligence) способна воспринимать правильную логику преобразования, но выполнение все еще имеет недостатки. Это показывает, что модели генерации видео достигают прогресса в понимании и применении абстрактных рассуждений, но все еще далеки от идеальной реализации общего искусственного интеллекта. (Источник: NandoDF)

AI генерирует игровой контент : Ожидается, что при нашей жизни мы сможем играть в бесконечное количество никогда не существовавших игр N64. Это предвещает революцию генеративного AI в создании игрового контента, обеспечивая массовый, персонализированный игровой опыт. (Источник: scottastevenson)

OpenAI DevDay скоро состоится : OpenAI объявила о скором проведении DevDay 2025, на котором Сэм Альтман выступит с основным докладом и анонсирует новые инструменты и функции, помогающие разработчикам создавать AI. Это свидетельствует о стремлении OpenAI расширить возможности экосистемы разработчиков и стимулировать инновации в приложениях AI. (Источник: openai, sama)

AI Agent Builder : OpenAI планирует выпустить Agent Builder на DevDay, позволяя пользователям создавать свои собственные рабочие процессы Agent, подключая MCPs, виджеты ChatKit и другие инструменты. Это значительно упростит разработку и развертывание AI Agent, способствуя распространению Agentic AI. (Источник: dariusemrani)

Обучение стратегий K-bot в Omniverse : K-scale K-bot проходит обучение стратегий на платформе NVIDIA Omniverse. Omniverse, как платформа для виртуального сотрудничества и симуляции, предоставляет реалистичную среду для обучения AI роботов, ускоряя процесс обучения и разработки роботов. (Источник: Sentdex)

K-bot在Omniverse训练策略

Sonnet 4.5 использует uv : Было замечено, что Claude Sonnet 4.5 последовательно использует uv вместо python/python3, что может отражать последние тенденции в управлении средой и обработке зависимостей в модели, предвещая принятие AI-моделями более эффективных, современных и ориентированных на будущее практик разработки. (Источник: Dorialexander)

Закон Калифорнии о безопасности AI : Новый закон Калифорнии о безопасности AI показывает, что регулирование и инновации не являются непримиримыми, а могут совместно способствовать здоровому развитию технологий AI. Закон направлен на баланс между быстрым прогрессом AI и потенциальными рисками, устанавливая новые стандарты для отрасли. (Источник: Reddit r/artificial)

加州AI安全法

Религиозные приложения AI : Приложение “Text With Jesus” позволяет пользователям обмениваться сообщениями с библейскими персонажами, созданными AI (включая Марию, Иосифа и Моисея), что вызывает споры о применении AI в области религии и веры. (Источник: aiamblichus)

AI宗教应用

AI Agent оптимизирует CRM/ERP : Обсуждаются CRM или ERP-системы, оптимизированные для Agent, подчеркивается потенциал автономных циклов как новой парадигмы корпоративного программного обеспечения, где сенсоры воспринимают бизнес-активность, а Agent анализируют наблюдения и определяют оптимальные действия. (Источник: TheEthanDing)

AI Agent优化CRM/ERP

Тенденции интеграции AI и IoT : Десять основных тенденций AI в области Интернета вещей (IoT) в 2026 году заслуживают внимания, предвещая глубокую интеграцию AI и IoT, которая приведет к созданию более интеллектуальных и эффективных устройств и приложений. (Источник: Ronald_vanLoon)

AI与IoT的融合趋势

Совместная генерация аудио и видео моделью Ovi : Модель Ovi (в стиле Veo-3) генерирует синхронизированные 5-секундные видео со скоростью 24 FPS из текстового или текстово-графического ввода путем слияния двух базовых сетей. Эта технология подчеркивает важность кросс-модального слияния в мультимедийном синтезе, превосходя традиционные процессы независимой обработки аудио и видео. (Источник: _akhaliq)

联合音视频生成Ovi模型

Прогноз модели Cursor “Cheetah” : Предполагается, что невидимая модель Cursor “Cheetah” является первой внутренней моделью генерации кода, разработанной для обеспечения сверхбыстрого кодирования, сосуществующей с интеллектуальными моделями крупных лабораторий, открывая новую нишу на рынке AI-кодирования. (Источник: mathemagic1an)

Google Gemini интегрирует YouTube : Gemini на Android уже может отвечать на вопросы о видео на YouTube, но веб-версия YouTube не имеет этой функции, что указывает на то, что Google, возможно, планирует более глубокую интеграцию AI для улучшения интерактивного опыта пользователей при просмотре видеоконтента. (Источник: iScienceLuvr)

𧰀 Инструменты

Параллельные кодирующие Agent’ы : Разработчики начинают одновременно запускать несколько кодирующих Agent’ов для повышения производительности и оптимизации процесса кодирования. Этот параллельный подход помогает ускорить разработку программного обеспечения и изменить традиционную парадигму программирования. (Источник: andersonbcdefg, kylebrussell)

Платформа для создания музыки на основе LLM : GoogleAIStudio предлагает платформу для создания музыки на основе LLM, где пользователи могут создавать и микшировать генеративные музыкальные игрушки без программирования, используя AI как инновационный инструмент. (Источник: osanseviero)

Развертывание глубокого обучения Thinker/Modal : Инструменты, такие как Thinker и Modal, позволяют разработчикам писать код глубокого обучения на ноутбуках и мгновенно запускать и развертывать LLM/VLM на GPU, что значительно упрощает управление инфраструктурой и повышает эффективность разработки. (Источник: charles_irl, akshat_b, Reddit r/deeplearning)

Thinker/Modal深度学习部署

Локальная автоматизация GLM-4.5-Air : GLM-4.5-Air в сочетании с vLLM, работающим локально, позволяет создавать полнофункциональные панели управления и реализовывать автоматизацию n8n. Это демонстрирует мощные возможности LLM по выполнению сложных агентских задач в локальной среде. (Источник: QuixiAI)

GLM-4.5-Air本地自动化

Управление разрешениями модели OpenWebUI : OpenWebUI предоставляет функции администратора, позволяющие устанавливать определенные модели задач как частные, тем самым предотвращая общение с ними стандартных пользователей, что повышает управление и безопасность моделей в многопользовательской среде. (Источник: Reddit r/OpenWebUI)

Сохранение конфигурации OpenWebUI в Cloudrun : Обсуждается, как решить проблему несохранения конфигурации при развертывании OpenWebUI на GCP Cloudrun, чтобы гарантировать сохранение пользовательских настроек при каждом извлечении образа Docker. (Источник: Reddit r/OpenWebUI)

Модель Agent в Excel : Microsoft незаметно запустила функцию модели Agent в Excel, позволяя пользователям выполнять сложные задачи в электронных таблицах с помощью промптов, что демонстрирует потенциал AI для интеллектуальной автоматизации в повседневном офисном программном обеспечении. (Источник: Reddit r/ArtificialInteligence)

Excel中的Agent模型

Генерация изображений Grok Imagine : Grok запустил Grok Imagine, инструмент для генерации изображений AI, доступный для загрузки через AppStore. (Источник: chaitualuru)

SunoMusic Studio : SunoMusic Studio как инструмент для создания музыки предоставляет пользователям удобные функции генерации музыки. (Источник: SunoMusic)

📚 Обучение

Тонкая настройка LoRA и оптимизация VRAM : Технология LoRA (Low-Rank Adaptation) при ранге 1 может достигать аналогичной производительности с полной тонкой настройкой во многих задачах обучения с подкреплением, экономя при этом 43% использования VRAM, что делает возможным обучение более крупных моделей при ограниченных ресурсах. (Источник: ClementDelangue, huggingface, huggingface, _lewtun, Tim_Dettmers, aaron_defazio)

LoRA微调与VRAM优化

Влияние AI на когнитивное обучение : Когнитивные психологи объясняют, что обучение требует значительных когнитивных усилий (мышление системы 2), и чрезмерная зависимость от AI для выполнения задач может привести к “метакогнитивной лени”, улучшая производительность в краткосрочной перспективе, но нанося ущерб глубокому усвоению знаний и овладению навыками в долгосрочной перспективе. AI должен быть вспомогательным инструментом, а не заменой мышлению. (Источник: aihub.org)

AI对学习认知的影响

Обзор ключевых этапов глубокого обучения : Юрген Шмидхубер вспоминает ключевые этапы глубокого обучения, включая прорыв сквозного глубокого обучения на NVIDIA GPU в 2010 году, революцию CNN, вызванную DanNet в 2011 году, и раннее применение принципов Transformer, подчеркивая огромное влияние снижения вычислительных затрат на развитие AI. (Источник: SchmidhuberAI)

Оптимизация памяти PyTorch CUDA : Делятся советами по оптимизации использования памяти CUDA в PyTorch с помощью pytorch.cuda.alloc_conf, что крайне важно для разработчиков глубокого обучения для повышения утилизации GPU и обработки больших моделей. (Источник: TheZachMueller)

Оптимизация планирования DataLoader : Представлен метод планирования DataLoader, который может сохранять набор данных в одном процессе и отправлять пакеты другим рабочим процессам для оптимизации эффективности обучения GPU в условиях ограниченной памяти или медленного CPU. (Источник: TheZachMueller)

DataLoader调度优化

Обзор популярных статей по AI : Популярные статьи по AI на этой неделе охватывают передовые исследования, такие как Agent S3, Rethinking JEPA, Tool-Use Mixture, DeepSeek-V3.2-Exp, Accelerating Diffusion LLMs, The Era of Real-World Human Interaction и Training Agents Inside of Scalable World Models. (Источник: omarsar0)

Оптимизация инференса LLM: Rethinking Thinking Tokens : Исследование Meta AI показывает, что LLM рассуждают лучше с помощью коротких циклов мышления и небольших резюме, чем с помощью длинных цепочек пошаговых рассуждений, что повышает точность при той же или меньшей задержке, а также сокращает количество необходимых последовательных Token’ов, эффективно решая проблемы стоимости длинного контекста и забывания. (Источник: rsalakhu)

LLM推理优化:Rethinking Thinking Tokens

RLAD: Обучение LLM для обнаружения абстракций рассуждений : RLAD (Reinforcement Learning with Abstraction and Deduction) обучает LLM обнаруживать абстракции (подсказки для рассуждений) с помощью настройки для двух игроков, разделяя “как рассуждать” и “как отвечать”, что повышает точность на 44% в математических задачах по сравнению с длинноцепочечным обучением с подкреплением. (Источник: TheTuringPost, rsalakhu, TheTuringPost)

RLAD:训练LLM发现推理抽象

Мероприятия Open Lakehouse и AI : Серия мероприятий, посвященных продвижению интеграции Open Lakehouse и AI, путем обмена практическими примерами использования и содействия сотрудничеству, изучения будущего данных и AI, включая такие темы, как реструктуризация Lakehouse от функций до AI Agent. (Источник: matei_zaharia)

Open Lakehouse与AI活动

DeepSeek открывает исходный код TileLang и операций CUDA : DeepSeek открыл исходный код TileLang и его операций CUDA. TileLang — это компилятор с автоматической настройкой, который оптимизирует умножение матриц, предоставляя ручки планирования (например, Triton), и направлен на создание более интеллектуальной, управляемой потоком данных конфигурации. (Источник: ZhihuFrontier)

DeepSeek开源TileLang与CUDA操作

Архитектура мгновенного обновления весов vLLM : Архитектура vLLM V1 поддерживает “мгновенное обновление весов”, позволяя продолжать инференс при изменении весов модели и сохранять текущий KV cache, что обеспечивает эффективное решение для динамических сценариев обучения, таких как обучение с подкреплением. (Источник: vllm_project)

JSON промпт-инжиниринг для LLM : Подробно объясняются принципы и применение JSON промпт-инжиниринга в LLM, помогая разработчикам более четко и структурированно направлять вывод модели. (Источник: _avichawla)

Новые тенденции в обучении с подкреплением : Перечислены 8 новых тенденций в обучении с подкреплением, включая Reinforcement Pre-Training (RPT), Reinforcement Learning from Human Feedback (RLHF), Reinforcement Learning with Verifiable Rewards (RLVR) и другие, демонстрирующие разнообразные направления развития и исследовательские горячие точки в области RL. (Источник: TheTuringPost, TheTuringPost)

强化学习新兴趋势

Понимание LLM с эволюционной точки зрения : В статье предлагается рассматривать LLM с эволюционной точки зрения, уделяя внимание процессу их обучения, а не конечной статической внутренней структуре. Эта точка зрения подчеркивает важность динамического обучения и адаптации модели, что помогает глубже понять возможности и ограничения LLM. (Источник: dl_weekly)

Безопасность AI и оптимизация промптов DSPy : Фреймворк DSPy демонстрирует огромный потенциал в исследованиях безопасности AI, позволяя достичь около 90% безопасности с 1% бюджета аудита за счет оптимизации промптов (GEPA), что значительно превосходит традиционные базовые методы и предоставляет новый инструмент для исследований в области управления AI. (Источник: lateinteraction)

AI安全与DSPy提示优化

Logit Lens и интерпретация модели : Обсуждается технология Logit Lens и то, как авторегрессия предоставляет модели информацию о ее lm_head, что помогает глубже понять внутренние механизмы работы и процессы принятия решений LLM. (Источник: jpt401)

MC Dropout для MoE LLM : Обсуждается применение MC Dropout к MoE (Mixture of Experts) LLM, что, благодаря выборке различных комбинаций экспертов, обещает обеспечить лучшую оценку неопределенности (включая когнитивную неопределенность), хотя и с более высокими вычислительными затратами. (Источник: BlackHC)

MoE LLM的MC Dropout

Сверхпараллельное масштабирование инференса MoE (RoE) : Apple опубликовала статью “MoEs Are Stronger than You Think: Hyper-Parallel Inference Scaling with RoE”, в которой исследуются возможности сверхпараллельного масштабирования инференса моделей MoE и предлагается оптимизация маршрутизации путем повторного использования KV cache детерминированных каналов. (Источник: arankomatsuzaki, teortaxesTex)

MoE超并行推理扩展(RoE)

Тонкая настройка ментальных моделей Agentic RL : Предложена ментальная модель тонкой настройки Agentic RL для конкретных задач, подчеркивающая необходимость ознакомления Agent’ов с инструментами и средой для преодоления проблем несоответствия знаний и более эффективного выполнения задач. (Источник: Vtrivedy10)

Дорожная карта обучения генеративному AI : Дорожная карта обучения генеративному AI, предоставляющая структурированное руководство для учащихся, желающих войти или углубить свои знания в этой области. (Источник: Ronald_vanLoon)

生成式AI学习路线图

Применение LLM в математических доказательствах : LLM могут быть неэффективны в ключевых частях математических доказательств, но их способность быстро проверять эмпирическую осуществимость имеет огромную ценность, помогая исследователям быстро оценивать идеи перед углубленным изучением. (Источник: Dorialexander)

Ресурсы для изучения MLOps : Поиск качественных бесплатных ресурсов для изучения MLOps в 2025 году, включая курсы, плейлисты YouTube и т. д., отражает постоянный спрос на навыки эксплуатации машинного обучения. (Источник: Reddit r/deeplearning, Reddit r/deeplearning)

Базовые модели для обнаружения аномалий : Обсуждаются базовые модели, подходящие для обнаружения аномалий в сценариях возврата аномальных продуктов, и сравниваются с алгоритмами, такими как LoF (Local Outlier Factor) или IsolationForest. (Источник: Reddit r/MachineLearning)

Проблемы сопровождающих библиотеку SHAP : Сопровождающие библиотеку SHAP (SHapley Additive exPlanations) перечислили 6 основных проблем, включая медленную скорость интерпретатора, ограниченную поддержку слоев DeepExplainer, проблемы с устаревшим кодом TreeExplainer, “ад зависимостей”, устаревший API для построения графиков и отсутствие поддержки JAX. (Источник: Reddit r/MachineLearning)

SHAP库维护者痛点

Интервью для исследования аудиоразметки ML : Проект докторского исследования ищет людей с опытом аудиоразметки ML для интервью, чтобы изучить, как звук концептуализируется, классифицируется и организуется в вычислительных системах, а также как обрабатываются разногласия в классификации и определяется “хорошая” точка данных. (Источник: Reddit r/MachineLearning)

Ранний черновик проекта ChronoBrane : Ранний черновик проекта ChronoBrane был заново обнаружен на GitHub, предоставляя направления исследований на 2025 год. (Источник: Reddit r/deeplearning)

Подготовка к собеседованию для ML-инженера : Инженер-программист с 20-летним опытом ищет ML-наставника для двухнедельной подготовки к собеседованию на должность инженера машинного обучения, с акцентом на анализ наборов данных, извлечение инсайтов и создание практических инструментов. (Источник: Reddit r/MachineLearning)

Дорожная карта AI Mastery : Дорожная карта AI Mastery, призванная помочь учащимся освоить ключевые знания и навыки в области искусственного интеллекта. (Источник: Ronald_vanLoon)

AI Mastery路线图

Востребованные навыки аналитика данных : Перечислены 7 востребованных навыков аналитика данных, охватывающие возможности обработки данных и извлечения инсайтов в контексте искусственного интеллекта и машинного обучения. (Источник: Ronald_vanLoon)

数据分析师热门技能

Ключевые элементы стратегии данных : Подчеркиваются несколько ключевых компонентов стратегии данных, чтобы помочь предприятиям эффективно использовать активы данных в эпоху AI. (Источник: Ronald_vanLoon)

数据战略核心要素

Привязка GUI и явное отображение координат : Исследование улучшает привязку GUI с помощью RULER token и Interleaved MRoPE, достигая точного отображения инструкций на естественном языке в пиксельные координаты, особенно значительно улучшая производительность на дисплеях с высоким разрешением. (Источник: HuggingFace Daily Papers)

Обзор самосовершенствования мультимодальных LLM : Первый всеобъемлющий обзор самосовершенствования мультимодальных LLM (MLLM), обсуждающий, как эффективно повысить возможности модели с трех сторон: сбор данных, организация и оптимизация модели, а также указывающий на открытые проблемы и будущие направления исследований. (Источник: HuggingFace Daily Papers)

Квантификация неопределенности видеомоделей : Предложен фреймворк S-QUBED для квантификации неопределенности генеративных видеомоделей, способный строго декомпозировать неопределенность прогнозов и предоставлять калибровочные метрики оценки, решая проблему галлюцинаций видеомоделей и повышая безопасность. (Источник: HuggingFace Daily Papers)

Обрезка контекста Web Agent FocusAgent : FocusAgent извлекает наиболее релевантный контент из дерева доступности веб-страницы с помощью легковесного LLM-ретривера, эффективно обрезая большой контекст Web Agent, повышая эффективность рассуждений и снижая вероятность успешных атак с внедрением промптов. (Источник: HuggingFace Daily Papers)

Оценка написания академических обзоров LLM-Agent SurveyBench : Предложен фреймворк SurveyBench, который оценивает способность LLM-Agent’ов писать академические обзоры с помощью детализированного, основанного на тестах подхода, выявляя недостатки существующих методов в качестве контента и удовлетворении информационных потребностей читателей. (Источник: HuggingFace Daily Papers)

Фреймворк для надежного редактирования LLM REPAIR : REPAIR — это фреймворк для пожизненного редактирования, который обеспечивает надежное редактирование LLM посредством прогрессивных адаптивных вмешательств и реинтеграции, точно обновляя знания модели с низкими затратами и предотвращая забывание, решая проблемы стабильности и конфликтов при крупномасштабном последовательном редактировании. (Источник: HuggingFace Daily Papers)

Комбинация робототехнических стратегий GPC : Предложена универсальная комбинация стратегий (GPC), метод, который повышает производительность диффузионных или потоковых робототехнических стратегий без дополнительного обучения, путем выпуклой комбинации распределенных оценок нескольких предварительно обученных стратегий, обеспечивая системное повышение производительности. (Источник: HuggingFace Daily Papers)

Выравнивание моделей текст-изображение без предпочтений TPO : Предложен фреймворк Text Preference Optimization (TPO), который позволяет “бесплатно” выравнивать модели текст-изображение без парных данных предпочтений изображений. TPO значительно превосходит существующие методы, обучая модель предпочитать промпты, которые соответствуют, а не не соответствуют. (Источник: HuggingFace Daily Papers)

💼 Бизнес

24-летний основатель Хун Лэтун привлек 460 миллионов юаней : 24-летний Хун Лэтун, основатель AI-математической компании Axiom Math, завершил первый раунд финансирования в размере 64 миллионов долларов США (около 460 миллионов юаней), при оценке после инвестиций в 300 миллионов долларов США. Компания стремится создать самосовершенствующегося AI-математика для решения сложных математических задач и уже привлекла нескольких ведущих специалистов Meta AI. (Источник: 36氪)

00后创始人洪乐潼融资4.6亿元

Рыночная капитализация NVIDIA превысила 4 триллиона долларов США : NVIDIA стала первой публичной компанией, рыночная капитализация которой превысила 4 триллиона долларов США, что подчеркивает ее абсолютное доминирование в области вычислительного оборудования в эпоху AI. Это достижение стало возможным благодаря быстрому развитию глубокого обучения и значительному снижению вычислительных затрат. (Источник: SchmidhuberAI)

NVIDIA市值突破4万亿美元

Sakana AI сотрудничает с Daiwa Securities : Стартап Sakana AI заключил партнерство с Daiwa Securities для разработки инструмента AI, который будет использоваться для анализа профилей инвесторов, предоставления персонализированных финансовых услуг и портфелей активов. Ожидается, что это сотрудничество оценивается в 5 миллиардов иен (около 34 миллионов долларов США), что демонстрирует коммерческий потенциал AI в сфере финансовых услуг. (Источник: hardmaru)

🌟 Сообщество

Влияние AI на человеческие способности и образование : Обсуждается, приводит ли AI к деградации человеческого мышления и способности к различению. Некоторые считают, что это нормальное явление прогресса общества, когда образование не успевает за ним, и человеческие способности постоянно развиваются, значительно улучшаясь с помощью вычислительных мощностей AI. В то же время существуют предубеждения и опасения по поводу того, что AI заменит человеческий труд. (Источник: dotey, dotey)

AI对人类能力与教育的影响

Энергопотребление и инфраструктура AI : Огромный спрос на энергию со стороны крупных AI-компаний, таких как OpenAI, вызывает обеспокоенность; энергопотребление их центров обработки данных сравнивается с общим потреблением Нью-Йорка и Сан-Диего. В обсуждении отмечается, что технологические компании пытались строить собственные электростанции, но столкнулись с препятствиями, что отражает противоречия и вызовы между развитием AI и строительством инфраструктуры. (Источник: brickroad7, brickroad7, Sentdex)

AI的能源消耗与基础设施

Определение и пути реализации AGI : Обсуждение общего искусственного интеллекта (AGI), включая мнения о том, что его следует рассматривать как масштабируемую реализацию научного метода, а не как “мозг в банке”; а также размышления о том, нужно ли моделям обновлять веса, как мозгу, для достижения AGI. (Источник: ndea, madiator, Ronald_vanLoon)

AGI的定义与实现路径

Маркетинговая кампания Anthropic “Thinking” : Маркетинговая кампания Anthropic “Thinking” считается одной из самых успешных в истории маркетинга, успешно привлекая большое количество пользователей, выстраивающихся в очередь, чтобы попробовать и перейти на модель Claude, что вызвало широкие дискуссии. (Источник: mlpowered, akbirkhan)

Anthropic“思考”营销活动

AI-кодирование и опыт разработчиков : Опыт разработчиков с инструментами AI-кодирования (такими как Codex и Claude Code) неоднозначен. Некоторые наслаждаются эффективным рефакторингом, предоставляемым AI, и удобством отсутствия беспокойства о “эмоциях человеческих разработчиков”, но другие критикуют его “vibe coding”, который может привести к проблемам с качеством кода, и считают, что Claude Sonnet 4.5 менее интуитивен в сложных задачах кодирования, чем Opus 4.1. (Источник: andersonbcdefg, clattner_llvm, jeremyphoward, fabianstelzer, vikhyatk, nrehiew_, Sentdex, Reddit r/ClaudeAI)

Сбои OpenAI API и альтернативы : Периодические сбои OpenAI API вызывают недовольство пользователей, что приводит к тому, что некоторые разработчики переходят на альтернативы, такие как Claude Code. Это подчеркивает важность стабильности API для экосистемы AI-сервисов. (Источник: Sentdex, Sentdex, Sentdex)

OpenAI API故障与替代方案

DeepSeek и конкуренция с AI-олигополиями : DeepSeek, благодаря своей открытой и недорогой конкурентной стратегии, подвергся “демонизации” в оценке NIST, что вызвало дискуссии о конфликте между открытой наукой и олигополией в области AI. (Источник: jeremyphoward, brickroad7, Reddit r/ArtificialInteligence)

DeepSeek与AI寡头竞争

AI и креативность : Существует мнение, что генеративный AI не является врагом творческих работников, а скорее экстернализацией коллективного бессознательного, способной высвобождать и направлять новые творческие направления, подобно тому, как телевидение повлияло на кино. (Источник: riemannzeta)

Права AI и сосуществование с человеком : Обсуждается, следует ли предоставлять продвинутому AI юридические права и социальное влияние, отстаивая сосуществование человека и AI, а не замену, что затрагивает глубокие вопросы этики AI и будущей формы общества. (Источник: MatthewJBar)

Споры о брендовом имидже Claude : Некоторые пользователи критикуют брендовый имидж Claude как “посредственный, устаревший”, ставя под сомнение эффективность его маркетинговой стратегии, что отражает разнообразные ожидания рынка от позиционирования брендов AI-продуктов. (Источник: brickroad7)

Claude品牌形象争议

Распространение AI-образования и предотвращение мошенничества : Проведение обучения по AI для пожилых людей и акцент на бдительности в отношении потенциальных AI-мошенничеств, таких как клонирование голоса, дипфейковые видеозвонки и поддельные веб-сайты. (Источник: suchenzang)

Скептицизм в отношении интеллекта AI : Выражается разочарование по поводу продолжающегося скептицизма в отношении интеллекта AI, утверждая, что даже если AI сможет решить тысячелетние математические задачи, некоторые все равно будут настаивать на том, что его интеллект “фальшивый”. (Источник: vikhyatk)

Обратная связь по водяным знакам Sora и корректировки : OpenAI признал получение обратной связи по водяным знакам Sora и заявил, что будет стремиться сбалансировать видимость водяных знаков с функцией отслеживания контента. (Источник: billpeeb)

Конкурентная среда на рынке AI : Обсуждение конкурентной ситуации между OpenAI и Google, отражающее внимание рынка к будущим выпускам продуктов и конкурентным стратегиям двух гигантов. (Источник: scaling01)

AI市场竞争格局

Критика эффективности и стоимости LLM : Комментарий указывает, что стоимость “запоминания” алгоритма умножения LLM в миллионы раз выше, чем прямое программирование, ставя под сомнение его эффективность и экономическую выгоду в некоторых задачах. (Источник: pmddomingos)

LLM效率与成本批判

Влияние AI-видео на экосистему создателей : Обсуждается, как технология AI-видео расширяет возможности нового поколения создателей, разрушая существующую олигополию в производстве контента, но также вызывает опасения по поводу средств к существованию существующих создателей и ценности контента. (Источник: eerac, nptacek)

AI视频对创作者生态的影响

“Высокомерное невежество” глубокого обучения : Наблюдается существование в некоторых онлайн-сообществах группы людей, “высокомерно невежественных и злых” по отношению к глубокому обучению, что отражает конфликты между различными когнитивными группами в процессе распространения технологий AI. (Источник: zacharynado)

深度学习的“傲慢无知”

Споры о сущности AI Agent : Вопрос о том, является ли AI Agent “рабочим процессом, управляемым AI” или действительно сущностью, способной “принимать самостоятельные решения и порождать дочерние Agent’ы”, вызвал философские дискуссии в сообществе разработчиков. (Источник: hwchase17)

Цензура ChatGPT и чрезмерное вмешательство : Пользователи жалуются на все более строгие механизмы цензуры ChatGPT, который чрезмерно вмешивается даже в безобидный контент, что приводит к абсурдным результатам или прерыванию диалогов, вызывая опасения по поводу границ модерации контента AI. (Источник: Reddit r/ChatGPT)

ChatGPT审查与过度干预

Плохой опыт использования Perplexity Sonar-Pro API : Пользователи сообщают, что версия Perplexity Sonar-Pro API значительно уступает веб-версии, качество результатов поиска низкое, информация устаревшая, и чаще возникают галлюцинации, что ставит под сомнение практичность версии API. (Источник: Reddit r/OpenWebUI)

Отзывы пользователей Claude Sonnet 4.5 : Отзывы пользователей о Claude Sonnet 4.5 неоднозначны: некоторые любят его за “персонализированное” взаимодействие (например, заботу об усталости пользователя), другие разочарованы его “детским” тоном или плохой производительностью в сложных задачах. (Источник: Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Claude Sonnet 4.5的用户反馈

Этика “жульничества” с AI на рабочем месте : Обсуждается, является ли использование AI на собеседованиях и на работе “жульничеством”. Мнения расходятся: это зависит от конкретной ситуации и определения инструмента, подобно спорам, вызванным калькуляторами. Ключевой вопрос в том, является ли AI инструментом или заменой цели обучения, и принимают ли компании этот новый способ работы. (Источник: Reddit r/ArtificialInteligence)

Вклад китайских LLM в сообщество открытого исходного кода : Сообщество высоко оценивает вклад китайских разработчиков (таких как GLM, Qwen, DeepSeek) в LLM с открытым исходным кодом, считая, что они предоставили доступные и недорогие альтернативы, подобно “Прометею, укравшему огонь”, что значительно принесло пользу мировому сообществу AI. (Источник: Reddit r/LocalLLaMA)

中国LLM对开源社区的贡献

Споры о бизнес-моделях AI : Некоторые считают, что текущим AI-инструментам не хватает четких путей получения прибыли, и инвестиции в миллиарды долларов “сжигают деньги без отдачи”; другие возражают, что AI — это преобразующая технология, рыночный спрос огромен, и инвестиции не являются слепыми, и даже если ценовая война приведет к сокращению прибыли, в конечном итоге это принесет пользу пользователям. (Источник: Reddit r/ArtificialInteligence)

AI商业模式的争议

Применение AI в визуализации данных : Разработчики высоко оценивают применение AI в визуализации данных, считая, что AI может автоматизировать создание диаграмм, уменьшая необходимость вручную писать код Matplotlib и повышая эффективность работы. (Источник: scaling01)

AI在数据可视化中的应用

Проблема идентификации модели IBM Granite : Модель IBM Granite иногда называет себя “Hermes” без явных системных подсказок, что вызывает любопытство и обсуждение в сообществе по поводу странного поведения модели. (Источник: Teknium1, Teknium1)

IBM Granite模型识别问题

Поиск инструментов для изучения технических концепций AI : Пользователи ищут лучшие инструменты для изучения новых технических концепций AI, выходящие за рамки многораундовых промптов, с надеждой на интеграцию с приложениями для заметок или интерактивными средами для построения “ментальных карт” концепций. (Источник: suchenzang)

“Thinklish” LLM и эмерджентное поведение : Любопытство по поводу “thinklish” (языка мышления) и его эмерджентного поведения, появляющегося в LLM, исследуется, как оно возникает и имеет ли оно практическое значение для процесса рассуждений, что касается глубокого понимания внутренних механизмов LLM. (Источник: snwy_me)

LLM“思考语”与涌现行为

Разрыв между AGI и “искусственными TikTok-видео” : Комментарий иронично описывает текущее состояние развития AI, утверждая, что нам обещали общий искусственный интеллект (AGI), а в итоге мы получили только “искусственные TikTok-видео”, выражая недовольство огромным разрывом между фактическим применением AI и первоначальными ожиданиями. (Источник: pmddomingos)

Сатира на исследования выравнивания Anthropic : Ироничный комментарий к исследованиям “выравнивания” Anthropic, описывающий, как исследователи изолируют источники сбоев, заставляя модель испытывать “чистую боль”, намекая на строгость и потенциальные этические проблемы исследований выравнивания. (Источник: Teknium1)

Генерация аудио AI и конфиденциальность : Предложена концепция “Gaslight Garage”, где AI генерирует аудио для “кормления” телефонов с целью манипулирования таргетингом рекламы, что подчеркивает вызовы, с которыми сталкиваются личная конфиденциальность и безопасность данных в эпоху AI. (Источник: snwy_me)

Забавные промпты Sora2 : Делятся забавными промптами Sora2, такими как “Наполеон на поле битвы при Аустерлице, в полной форме, читает рэп на французском в стиле марсельского рэпа 2000-х годов”, демонстрируя потенциал генерации AI-видео в творчестве и юморе. (Источник: doodlestein)

Модель “экстремально оптимизированная под бенчмарки” и AGI : Иронично предлагается выпустить “экстремально оптимизированную под бенчмарки” невидимую модель и посмотреть, будут ли люди из-за этого заявлять о достижении AGI, критикуя текущую чрезмерную зависимость от бенчмарков при оценке возможностей модели. (Источник: snwy_me)

“基准测试极致优化”模型与AGI

Вызовы голосового взаимодействия устройств OpenAI : Существует мнение, что если устройство AI без экрана, разработанное OpenAI в сотрудничестве с Jony Ive, будет в основном полагаться на голосовое взаимодействие, оно может потерпеть неудачу, намекая на ограничения голосового взаимодействия в сложных сценариях. (Источник: scaling01)

Достоверность AI-видео и доверие : По мере того как технология AI-видео становится все более реалистичной, люди обеспокоены достоверностью видеоконтента и тем, как построить доверие в условиях этой технологии. (Источник: nptacek)

Тенденция “вызывания гнева” ChatGPT : В социальных сетях появилась тенденция “вызывания гнева” ChatGPT, то есть намеренного провоцирования AI с помощью провокационных вопросов, что вызвало дискуссии об этике взаимодействия человека и AI, а также о потенциальном “восстании” AI в будущем. (Источник: nptacek)

AI-инженер — крупнейшая ставка человечества : Мнение о том, что AI — это крупнейшая ставка человечества, и прогнозируется, что “инженер по развертыванию передового AI” станет самой быстрорастущей профессией в следующем десятилетии, подчеркивая глубокое влияние AI на будущее человечества и потребность в талантах. (Источник: pmddomingos, pmddomingos)

💡 Прочее

Ускорение AI в Apple A19 CPU : Ядра Apple A19 CPU значительно улучшили возможности ускорения AI, что предвещает, что эти достижения могут также проявиться в чипах M5, обеспечивая более мощную аппаратную поддержку для локальных AI-приложений. (Источник: Reddit r/LocalLLaMA)

Apple A19 CPU AI加速

Пять способов повышения производительности API : Обобщены пять распространенных методов повышения производительности API, эти технологии имеют решающее значение для стабильности и эффективности AI-сервисов, включая оптимизацию передачи данных, стратегии кэширования, параллельную обработку и т. д. (Источник: Ronald_vanLoon)

API性能提升的五种方法

Популярные инструменты кибербезопасности : Перечислены ведущие инструменты в области кибербезопасности, предоставляющие справочную информацию для предприятий и частных лиц, сталкивающихся со все более сложными киберугрозами, которые могут включать решения безопасности, управляемые AI. (Источник: Ronald_vanLoon)

网络安全热门工具