🔥 В центре внимания
Gemini Deep Think от Google завоевала золотую медаль на Международной математической олимпиаде: Модель Gemini Deep Think от Google DeepMind завоевала золотую медаль на IMO 2025, правильно решив 5 из 6 задач и набрав 35/42 балла. В отличие от прошлогодних AlphaGeometry и AlphaProof, Gemini Deep Think использует естественный язык для рассуждений, без необходимости перевода на формальный математический язык. Основной прорыв заключается в параллельных вычислениях, одновременном исследовании нескольких путей решения задач и использовании новой технологии обучения с подкреплением для многошаговых рассуждений, решения задач и доказательства теорем. Модель обучалась на высококачественных математических решениях и методах решения задач IMO. (Источник: 量子位, 量子位)
Заявление OpenAI о золотой медали на IMO вызвало споры: OpenAI объявила, что ее новая модель завоевала золотую медаль на IMO, но это заявление было подвергнуто сомнению официальными лицами IMO и представителями научного сообщества. Официальные лица IMO отметили, что OpenAI не участвовала в официальном совместном тестировании, ее результат «золотой медали» не был официально подтвержден, а объявление результатов сразу после церемонии закрытия было названо «грубым и неуместным». Кроме того, результат OpenAI лишь немного превысил порог для золотой медали, и любое незначительное снижение баллов могло бы привести к получению серебряной медали. (Источник: 量子位)
Масштабный набор данных для обучения ИИ DataComp CommonPool содержит миллионы личных данных: Исследование показало, что большой набор данных для обучения ИИ DataComp CommonPool содержит миллионы изображений паспортов, кредитных карт, свидетельств о рождении и другой личной информации. Исследователи обнаружили тысячи изображений с распознаваемыми лицами и идентифицирующей информацией в 0,1% подмножестве данных CommonPool, предполагая, что реальное количество может достигать сотен миллионов. Это подчеркивает риски сбора данных в Интернете. (Источник: MIT Technology Review)
Компании, разрабатывающие ИИ, перестали предупреждать, что чат-боты не являются врачами: Исследование показало, что компании, разрабатывающие ИИ, практически перестали включать медицинские дисклеймеры и предупреждения в ответы на вопросы о здоровье. Многие ведущие модели ИИ не только отвечают на вопросы о здоровье, но и задают дополнительные вопросы и пытаются поставить диагноз. Это увеличивает риск того, что пользователи будут доверять небезопасным медицинским советам. Исследователи протестировали 15 моделей от OpenAI, Anthropic, DeepSeek, Google и xAI и обнаружили, что в 2025 году менее 1% моделей включали предупреждения при ответе на медицинские вопросы, по сравнению с более чем 26% в 2022 году. (Источник: MIT Technology Review)
🎯 Тенденции
OpenAI планирует разработать функции Excel и PowerPoint для ChatGPT: OpenAI разрабатывает функции, подобные Excel и PowerPoint, для ChatGPT. Пользователи смогут создавать и редактировать электронные таблицы и презентации с помощью подсказок на естественном языке. Эти функции будут доступны через специальные кнопки под строкой поиска ChatGPT и предназначены для создания файлов, совместимых с Microsoft Office. Цель OpenAI — создать пакет офисных приложений с ИИ, включающий функции совместного редактирования документов в режиме реального времени, окно чата, транскрипцию встреч и управление задачами. (Источник: 36氪)
iFLYTEK выпустила первый в мире блокнот X5 со встроенной локальной большой языковой моделью: iFLYTEK выпустила блокнот третьего поколения X5 — первый в мире блокнот со встроенной локальной большой языковой моделью. X5 оснащен 8-ядерным процессором с вычислительной мощностью 9T AI, что позволяет использовать функции ИИ, такие как преобразование речи в текст, ведение протоколов встреч и генерация контента, даже без подключения к Интернету, обеспечивая безопасность и конфиденциальность данных. X5 также имеет более тонкий и легкий корпус, более высокую скорость обновления экрана и чувствительность к давлению пера, приближенную к настоящей ручке и бумаге. (Источник: 36氪)
Moonvalley получила финансирование в размере $154 млн для создания Marey — соответствующей требованиям законодательства модели ИИ для создания видео кинематографического качества: Moonvalley завершила раунд финансирования серии A+ на сумму $84 млн, доведя общую сумму финансирования до $154 млн. Модель ИИ для создания видео Marey ориентирована на кинопроизводство, соответствует требованиям авторского права, поддерживает послойное редактирование переднего/среднего/заднего плана и управление 3D-траекторией камеры. Стоимость рендеринга одной сцены составляет всего $1-2, что более чем на 90% ниже стоимости традиционных визуальных эффектов (VFX). Marey обучается на лицензированных данных и позволяет создателям запрашивать удаление данных и отслеживать компенсацию, избегая споров об авторских правах. (Источник: 36氪)
01.AI, основанная Кай-Фу Ли, выпустила универсальную платформу Wan Zhi 2.0 для корпоративных больших языковых моделей и корпоративный Agent: 01.AI выпустила версию 2.0 своей универсальной платформы Wan Zhi для корпоративных больших языковых моделей и представила интеллектуальный агент 01.AI Enterprise Agent, призванный сделать ИИ «суперсотрудником» для предприятий. Этот Agent обладает способностью планировать задачи на основе большой языковой модели, может самостоятельно определять этапы задач с помощью механизма логического вывода, использовать различные инструменты для достижения сложных целей и уже внедрен в таких областях, как консалтинговые услуги, финансовые операции и обслуживание клиентов. (Источник: 36氪)
JD.com возглавила инвестиции в три компании, занимающиеся embodied AI, Ричард Лю усиливает развитие этого направления: JD.com возглавила инвестиции в три компании, занимающиеся embodied AI: Qianxun Intelligence, Zhongqing Robotics и Zhuji Power. Qianxun Intelligence специализируется на моделях VLA и модернизации аппаратного обеспечения роботов; Zhongqing Robotics уже запустила в серийное производство роботов-гуманоидов с открытым исходным кодом PM01; Zhuji Power делает акцент на создании универсальной платформы для embodied AI роботов. Инвестиционные предпочтения JD.com сосредоточены на компаниях, предлагающих интегрированные решения «аппаратное + программное обеспечение», обладающих производственными мощностями и возможностями внедрения в реальные сценарии. (Источник: 量子位)
Китайская академия наук и Alibaba представили фреймворк RefineX для точной очистки данных для предварительного обучения в больших масштабах: Институт вычислительной техники Китайской академии наук совместно с Alibaba и другими командами представили фреймворк RefineX, который обеспечивает масштабную и точную очистку данных для предварительного обучения с помощью программируемых задач редактирования. RefineX дистиллирует результаты высококачественной сквозной оптимизации под руководством экспертов в программы удаления на основе операций редактирования, эффективно очищая данные, сохраняя при этом разнообразие и естественность исходного текста. Модели, обученные на очищенных с помощью RefineX данных, показали значительное улучшение в выполнении последующих задач. (Источник: 量子位)
Компании используют вопросы и ответы с ИИ для оптимизации GEO-сервисов и увеличения охвата, что вызывает опасения по поводу достоверности информации: Компании используют GEO-сервисы, оптимизированные для контента, генерируемого большими языковыми моделями, интегрируя информацию о бренде в ответы моделей с помощью структурированной подачи знаний и контент-дизайна, ориентированного на конкретные сценарии, для увеличения охвата. Однако большие языковые модели не обладают способностью фильтровать и проверять контент при его сборе, что приводит к искажению результатов рекомендаций и может быть использовано недобросовестными компаниями для распространения ложной информации. (Источник: 36氪)
🧰 Инструменты
Kimi K2: Kimi выпустила свою новейшую базовую модель Mixture-of-Experts (MoE) Kimi K2 с 1 триллионом параметров и 32 миллиардами активных параметров. Эта модель демонстрирует выдающиеся результаты в задачах, связанных с кодом, агентами и математическими рассуждениями, достигая SOTA результатов среди моделей с открытым исходным кодом. K2 использует оптимизатор MuonClip, синтез данных Agentic Tool Use в больших масштабах и универсальную платформу обучения с подкреплением, занимая лидирующие позиции в бенчмарках SWE Bench Verified, Tau2 и AceBench. (Источник: 量子位)
Qwen3-235B-A22B-2507: Alibaba обновила модель Qwen3-235B, отключив режим смешанного мышления, обучив отдельно модели Instruct и Thinking, и выпустила более производительную Qwen3-235B-A22B-Instruct-2507 и ее FP8 версию. Согласно официальной оценке, новая версия Qwen3 превосходит Kimi K2 по некоторым показателям. (Источник: 量子位, Reddit r/LocalLLaMA)
📚 Обучение
Neural Networks: Zero to Hero: Курс Андрея Карпаты по глубокому обучению, охватывающий основы нейронных сетей, обратное распространение ошибки, языковое моделирование, MLP, функции активации, градиенты, BatchNorm, WaveNet, GPT и Tokenizer. С помощью видеолекций на YouTube и примеров кода в Jupyter Notebook курс помогает учащимся с нуля создавать и обучать нейронные сети. (Источник: GitHub Trending)
Технический отчет GR-3: Описывает разработку универсальной стратегии для роботов GR-3, представляющей собой масштабную модель «зрение-язык-действие» (VLA), способную обобщать новые объекты, среды и инструкции, связанные с абстрактными понятиями, и эффективно дообучаться с помощью небольшого количества данных о траекториях движения человека. GR-3 также хорошо справляется с долгосрочными и сложными задачами, включая задачи, требующие работы двумя руками и передвижения. (Источник: HuggingFace Daily Papers)
Технический отчет Kimi K2: Moonshot AI опубликовала технический отчет по Kimi K2, подробно описывающий процесс разработки модели, включая ключевые технологии, такие как оптимизатор MuonClip, синтез данных Agentic Tool Use в больших масштабах, универсальную платформу обучения с подкреплением, а также конкретные детали этапов предварительного обучения и последующего обучения. (Источник: 量子位)
💼 Бизнес
Lovable привлекла $200 млн в раунде A, оценка компании достигла $1 млрд: Приложение-компаньон на базе ИИ Lovable привлекло $200 млн в раунде серии A, достигнув оценки в $1 млрд, всего через 8 месяцев после запуска, став компанией-единорогом. (Источник: Reddit r/artificial)
Cursor приобрела Koala — инструмент программирования с ИИ корпоративного уровня: Инструмент программирования с ИИ Cursor приобрел Koala, инструмент программирования с ИИ корпоративного уровня, с целью конкурировать с GitHub Copilot. (Источник: Reddit r/artificial)
Perplexity ведет переговоры с производителями телефонов о предустановке браузера Comet AI: Perplexity ведет переговоры с производителями телефонов о предустановке мобильного браузера Comet AI на их устройствах. (Источник: Reddit r/artificial)
🌟 Сообщество
Ужесточение ограничений на использование Claude Code вызвало недовольство пользователей: Anthropic ужесточила ограничения на использование Claude Code, не уведомив об этом пользователей, что привело к жалобам на снижение производительности модели, а также на проблемы с качеством кода, согласованностью контекста и выводом пользовательского интерфейса. Некоторые пользователи пытаются повысить производительность Claude Code, используя более структурированные методы кодирования (например, TDD) и подробную документацию. (Источник: Reddit r/artificial, Reddit r/ClaudeAI, Reddit r/ClaudeAI)
Сомнения в способности LLM к рассуждениям: Статья Apple “The Illusion of Thinking” вызвала дискуссию о том, действительно ли большие языковые модели (LLM) обладают способностью к рассуждениям. В статье утверждается, что даже при предоставлении правильного алгоритма, такие модели, как GPT-4, Claude 3.7 и Gemini, полностью терпят неудачу в выполнении сложных логических задач. (Источник: Reddit r/MachineLearning)
Опасения по поводу поддельной рекламы, созданной ИИ: Социальные сети наводнены поддельной рекламой, созданной ИИ, особенно рекламой с мультяшными персонажами, например, «подростки зарабатывают миллионы долларов с помощью ИИ», что вызывает беспокойство и недовольство пользователей. (Источник: Reddit r/artificial)
Обсуждение открытого исходного кода ИИ: Пользователи Reddit обсуждают вопрос о том, должны ли модели ИИ быть с открытым исходным кодом. Некоторые считают, что, как и Интернет, ИИ должен быть открыт для использования и разработки всеми для прогресса человечества. Другие считают, что открытый исходный код создаст новые проблемы, такие как проблемы с интеллектуальной собственностью и безопасностью данных, а также повлияет на экономическую выгоду разработчиков ИИ. (Источник: Reddit r/LocalLLaMA)
Полярные мнения о приложениях-компаньонах с ИИ: Исследование показало, что 72% американских подростков использовали приложения-компаньоны с ИИ. Некоторые считают, что ИИ-компаньоны могут оказывать эмоциональную поддержку и помощь, другие обеспокоены их потенциальным негативным влиянием на психическое здоровье и социальные навыки. (Источник: Reddit r/artificial, Reddit r/ChatGPT)
Оценка синтеза речи с помощью ИИ: С развитием технологий синтеза речи с помощью ИИ многие авторы YouTube начали использовать ИИ-озвучку, что вызвало дискуссию о ее влиянии на качество видео и впечатления зрителей. Некоторые считают, что ИИ-озвучке не хватает эмоций и индивидуальности, другие считают, что она может повысить эффективность и снизить затраты. (Источник: Reddit r/ArtificialInteligence)
Опасения по поводу бизнес-модели OpenAI: OpenAI и Anthropic пока не получают прибыль от LLM, что вызывает опасения по поводу устойчивости их бизнес-моделей. Некоторые считают, что по мере распространения технологий ИИ и расширения сфер применения эти компании в конечном итоге станут прибыльными. Другие считают, что высокая стоимость вычислительных мощностей и жесткая конкуренция на рынке затруднят получение прибыли. (Источник: Reddit r/ArtificialInteligence)
💡 Другое
Blackbird: инструмент OSINT с открытым исходным кодом: Blackbird — это мощный инструмент OSINT (разведка на основе открытых источников) с открытым исходным кодом, который может искать имена пользователей и адреса электронной почты на более чем 600 платформах и предоставляет бесплатные функции анализа на основе ИИ. Он использует проекты с открытым исходным кодом, управляемые сообществом (например, WhatsMyName), для обеспечения низкого уровня ложных срабатываний и высокого качества результатов. Его функции включают интеллектуальные фильтры, экспорт в PDF/CSV и полностью автоматизированный анализ, и все это предоставляется через CLI. (Источник: GitHub Trending)
Trippy: инструмент для диагностики сети: Trippy — это инструмент для диагностики сети, сочетающий в себе функции traceroute и ping, предназначенный для помощи в анализе сетевых проблем. Он работает в Linux, BSD, macOS и Windows и может быть установлен из большинства менеджеров пакетов, предварительно скомпилированных двоичных файлов или исходного кода. (Источник: GitHub Trending)
Anki: интеллектуальная программа для запоминания с помощью интервальных повторений: Anki — это интеллектуальная программа для запоминания с помощью интервальных повторений, которая помогает пользователям более эффективно изучать и запоминать информацию. Она имеет открытый исходный код на GitHub и большое количество пользователей и участников. (Источник: GitHub Trending)