Ключевые слова:Google DeepMind, Genie 3, Модель мира, Среда обучения ИИ, Разработка игр, Воплощённый ИИ общего назначения (AGI), Многоагентные системы, Генерация интерактивных 3D-сред в реальном времени, Разрешение 720p при 24 кадрах в секунду, Совместная работа двух агентов: решателя и верификатора, Решение задач ИМО с помощью ИИ, Открытая многоагентная система для ИМО

🔥 В центре внимания

Google DeepMind выпустила модель мира Genie 3: Google DeepMind представила Genie 3, прорывную модель мира, способную генерировать интерактивные 3D-среды в реальном времени по текстовым подсказкам, поддерживая разрешение 720p и частоту кадров 24fps. Модель обладает визуальной памятью и возможностями управления действиями на протяжении нескольких минут, рассматривается как будущий игровой движок 2.0 и, как ожидается, произведет революцию в средах обучения AI и разработке игр, предоставляя ключевую недостающую часть для воплощенного AGI. (Источник: Google DeepMind)

Ant Group воспроизвела результаты золотой медали IMO с помощью мультиагентной системы и открыла исходный код: Команда проекта AWorld Ant Group всего за 6 часов воспроизвела результаты решения 5 из 6 задач DeepMind на математическом конкурсе IMO 2025 и открыла исходный код мультиагентной системы IMO. Эта система, благодаря сотрудничеству двух агентов — “решателя” и “верификатора”, — демонстрирует потенциал, превосходящий интеллектуальный предел одной модели, и используется для обучения моделей следующего поколения, что, как ожидается, будет способствовать развитию общего искусственного интеллекта (AGI). (Источник: 量子位)

蚂蚁多智能体新进展已开源

AI обнаружил новые физические законы: Исследователи из Университета Эмори обучили AI обнаруживать новые физические законы на основе экспериментальных данных пылевой плазмы, выявив ранее неизвестные силы. Это исследование показывает, что AI может использоваться не только для прогнозирования результатов или очистки данных, но и для открытия фундаментальных физических законов, а также исправило давние предположения в физике плазмы, открыв новые пути для изучения сложных многочастичных систем. (Источник: interestingengineering)

AI发现新物理定律

🎯 Тенденции

OpenAI и Anthropic демонстрируют быстрый рост доходов, рыночная структура под вниманием: В 2025 году OpenAI и Anthropic показали впечатляющий рост доходов: годовой регулярный доход OpenAI удвоился до 12 миллиардов долларов, а Anthropic вырос в 5 раз до 5 миллиардов долларов. Anthropic демонстрирует сильные результаты на рынке API для программирования, в то время как число пользователей ChatGPT продолжает быстро расти. Рынок ожидает, изменит ли запуск GPT-5 текущую рыночную структуру, особенно доминирующее положение Anthropic в области программирования. (Источники: dotey, nickaturley, xikun_zhang_)

OpenAI与Anthropic收入高速增长

Kaggle запустила платформу для соревнований AI в настольных играх: Kaggle объявила о запуске Game Arena, открытой соревновательной платформы, предназначенной для объективной оценки производительности передовых моделей AI путем их прямых поединков (в настоящее время в основном в шахматах). Первый чемпионат AI по шахматам уже начался, и к комментированию приглашены гроссмейстеры, что вызвало интерес сообщества к производительности таких моделей, как Kimi K2. (Источники: algo_diver, teortaxesTex, sirbayes, Reddit r/LocalLLaMA)

Kaggle推出AI棋类竞技平台

Раскрыты детали обучения OpenAI GPT-5: Сообщается, что OpenAI использует от 170 до 180 тысяч GPU H100 для обучения GPT-5. Мультимодальные возможности этой модели значительно улучшены, возможно, уже интегрирован видеоввод, и планируется создать “момент Гибли”, что намекает на амбиции в области генерации креативного контента. (Источник: teortaxesTex)

OpenAI GPT-5训练细节曝光

GLM 4.5 вошел в пятерку лучших LM Arena: Модель GLM 4.5 от Zai.org показала отличные результаты в голосовании сообщества LM Arena, набрав более 4000 голосов и успешно войдя в пятерку лучших в общем рейтинге, наряду с DeepSeek-R1 и Kimi-K2 как топовые открытые модели, что демонстрирует ее конкурентоспособность в области больших языковых моделей (LLM). (Источники: teortaxesTex, NandoDF)

GLM 4.5进入LM Arena前五

Yunpeng Technology выпустила новые продукты AI+Health: Yunpeng Technology в сотрудничестве с Shuaikang и Skyworth представила умный холодильник с большой моделью AI Health и “Лабораторию цифрового будущего кухни”. Большая модель AI Health через “помощника по здоровью Xiaoyun” предоставляет персонализированное управление здоровьем, оптимизирует дизайн и эксплуатацию кухни, что знаменует глубокое применение AI в повседневном управлении здоровьем и бытовых технологиях, и, как ожидается, улучшит качество жизни населения. (Источник: 36氪)

云澎科技发布AI+健康新品

Представлена новая структура безопасности систем AI: MITSloan предложил новую структуру, призванную помочь предприятиям создавать более безопасные системы AI. Эта структура сосредоточена на практиках безопасности в области искусственного интеллекта и машинного обучения, предоставляя важные рекомендации по обеспечению безопасности для все более сложных приложений AI. (Источник: Ronald_vanLoon)

AI系统安全新框架发布

Прогресс в применении AI в кибербезопасности: Фреймворк Cyber-Zero позволяет обучать агентов LLM для кибербезопасности без среды выполнения, генерируя высококачественные траектории путем обратного инжиниринга отчетов о решении CTF. Обученная на нем модель Cyber-Zero-32B достигла производительности SOTA в тестах CTF, будучи более экономически эффективной, чем проприетарные системы. В то же время Corridor Secure создает платформу безопасности продуктов, изначально разработанную с использованием AI, с целью внедрения AI в область безопасности разработки программного обеспечения. (Источники: HuggingFace Daily Papers, saranormous)

Прогностические модели на основе AI раскрывают ценность в операционной деятельности: Прогностические модели на основе AI демонстрируют огромную ценность в операционной деятельности, предоставляя более точные возможности прогнозирования, открывая множество источников ценности, способствуя цифровой трансформации и повышая роль машинного обучения в принятии бизнес-решений. (Источник: Ronald_vanLoon)

AI驱动的预测模型在运营中释放价值

Первое в мире строительство автомагистрали с AI-механической поддержкой и автономным вождением: Первый в мире проект строительства автомагистрали длиной 158 км с автономным вождением, полностью выполненный AI-механизмами при поддержке сети 5G. Это знаменует собой крупный прорыв в области искусственного интеллекта, RPA и новых технологий в инфраструктурном строительстве, предвещая высокую степень автоматизации будущих инженерных проектов. (Источник: Ronald_vanLoon)

Обсуждение LLM как оценщика/универсального валидатора: В социальных сетях активно обсуждается возможное появление “универсального валидатора” от OpenAI. Некоторые сомневаются, не является ли это по сути той же концепцией “LLM как оценщика”, в то время как другие ожидают, что GPT-5 сможет достичь почти нулевых галлюцинаций с помощью этой технологии, что приведет к беспрецедентной точности и надежности. (Источники: Teknium1, Dorialexander, Vtrivedy10)

LLM作为评判者/通用验证器引发讨论

Meta AI выпустила крупнейший открытый набор данных для улавливания углерода: Meta FAIR, Georgia Institute of Technology и cusp_ai совместно выпустили набор данных Open Direct Air Capture 2025, который является крупнейшим открытым набором данных для обнаружения передовых материалов для прямого улавливания углекислого газа. Этот набор данных призван ускорить климатические решения с помощью AI и способствовать развитию науки об экологически чистых материалах. (Источник: ylecun)

Meta AI发布最大开放碳捕获数据集

🧰 Инструменты

Выпущена модель с открытым исходным кодом Qwen-Image: Alibaba выпустила Qwen-Image, модель генерации текста в изображение 20B MMDiT, которая теперь доступна с открытым исходным кодом (лицензия Apache 2.0). Модель отлично справляется с рендерингом текста, особенно хорошо генерирует графические плакаты с нативным текстом, поддерживает двуязычность, различные шрифты и сложные макеты. Она также может генерировать изображения в различных стилях, от реалистичного до аниме, и может работать локально на устройствах с низким VRAM благодаря квантованию, а также интегрирована в ComfyUI. (Источники: teortaxesTex, huggingface, NandoDF, Reddit r/LocalLLaMA)

Qwen-Image开源模型发布

Улучшены возможности редактирования видео Runway Aleph: Runway Aleph, как инструмент для редактирования видео, теперь способен точно контролировать определенные части видео, включая манипулирование окружающей средой, атмосферой и направленными источниками света, и даже может заменить конвейер рендеринга Blender. Это значительно повышает гибкость и эффективность производства видео, предоставляя создателям более мощные инструменты. (Источники: op7418, c_valenzuelab)

Runway Aleph视频编辑能力增强

Kitten TTS: сверхмалая модель преобразования текста в речь: Kitten ML выпустила предварительную версию модели Kitten TTS, которая является сверхмалой моделью преобразования текста в речь SOTA, размером менее 25 МБ (около 15 млн параметров), предлагающей восемь выразительных английских голосов. Модель может работать на устройствах с низкой вычислительной мощностью, таких как Raspberry Pi и мобильные телефоны, и планируется поддержка нескольких языков и работа на CPU в будущем, что предоставляет решение для синтеза речи в условиях ограниченных ресурсов. (Источник: Reddit r/LocalLLaMA)

Kitten TTS:超小型文本到语音模型

Piper TTS: быстрый локальный движок преобразования текста в речь с открытым исходным кодом: Piper — это быстрый, локально работающий движок преобразования текста в речь с открытым исходным кодом, поддерживающий более 20 языков и множество голосов, с размером модели от 25 МБ до 65 МБ, а также поддерживающий обучение новых голосов. Его основное преимущество заключается в возможности использования для встроенных приложений C/C++, обеспечивая эффективный синтез речи для различных платформ. (Источник: Reddit r/LocalLLaMA)

Piper TTS:快速本地开源文本到语音引擎

Выпущена коллекция субагентов Claude Code: VoltAgent выпустил готовую к производству коллекцию субагентов Claude Code, содержащую более 100 специализированных агентов, охватывающих задачи разработки, такие как frontend, backend, DevOps, AI/ML, ревью кода и отладка. Эти субагенты следуют лучшим практикам и поддерживаются сообществом открытых фреймворков, что призвано повысить эффективность и качество рабочего процесса разработки. (Источник: Reddit r/ClaudeAI)

Claude Code子代理集合发布

Vibe: инструмент для офлайн-транскрипции аудио/видео: Vibe — это инструмент для офлайн-транскрипции аудио/видео с открытым исходным кодом, использующий технологию OpenAI Whisper, поддерживающий транскрипцию практически на всех языках. Он предлагает удобный дизайн, предварительный просмотр в реальном времени, пакетную транскрипцию, AI-резюмирование, локальный анализ Ollama и поддержку различных форматов экспорта, а также оптимизирован для GPU, обеспечивая конфиденциальность пользователя. (Источник: GitHub Trending)

Vibe:离线音频/视频转录工具

DevBrand Studio: инструмент для брендинга разработчиков на основе AI: DevBrand Studio — это инструмент AI, разработанный для помощи разработчикам в легком создании профессиональных профилей GitHub. Он автоматически генерирует краткие биографии, добавляет личные/рабочие проекты и их влияние, а также предоставляет ссылки для обмена, решая проблемы разработчиков в самопродвижении, особенно полезен для поиска работы и фрилансеров. (Источник: Reddit r/MachineLearning)

Оптимизация выгрузки LLaMA.cpp MoE: В LLaMA.cpp добавлена опция --n-cpu-moe, значительно упрощающая процесс послойной выгрузки моделей MoE. Пользователи могут легко регулировать количество слоев MoE, работающих на CPU, тем самым оптимизируя производительность и использование памяти больших моделей на GPU и CPU, что особенно актуально для таких моделей, как GLM4.5-Air. (Источник: Reddit r/LocalLLaMA)

LLaMA.cpp MoE卸载优化

ReaGAN: фреймворк для обучения графов, сочетающий возможности агентов и извлечение информации: Retrieval-augmented Graph Agentic Network (ReaGAN) — это инновационный фреймворк для обучения графов, сочетающий возможности агентов и извлечение информации. В этом фреймворке узлы спроектированы как агенты, способные планировать, действовать и рассуждать, предоставляя разработчикам AI новые идеи для объединения сложных функций агентов с обучением графов. (Источник: omarsar0)

ReaGAN:结合代理能力和检索的图学习框架

OpenArm: человекоподобная механическая рука с открытым исходным кодом: Enactic AI выпустила OpenArm, человекоподобную механическую руку с открытым исходным кодом, разработанную специально для применения физического AI в средах с богатым взаимодействием. Проект направлен на содействие развитию робототехники и искусственного интеллекта в реальном мире, предоставляя исследователям и разработчикам гибкую аппаратную платформу. (Источник: Ronald_vanLoon)

Kling ELEMENTS: генерация AI-видео голливудского уровня: Технология Kling ELEMENTS направлена на генерацию AI-видео с голливудским уровнем реализма, отличаясь безупречными лицами, динамичной одеждой и отсутствием артефактов. Их работа “Loading” набрала 197 миллионов просмотров по всему миру и получила четыре крупные отраслевые награды, демонстрируя мощный потенциал AI в создании видеоконтента. (Источники: Kling_ai, Kling_ai)

Kling ELEMENTS:好莱坞级别AI视频生成

Выпущен Hugging Face Text Embeddings Inference (TEI) v1.8.0: Hugging Face выпустил версию Text Embeddings Inference (TEI) v1.8.0, которая принесла множество новых функций и улучшений, включая поддержку новейших моделей. Это обновление направлено на повышение эффективности и производительности вывода текстовых эмбеддингов, предоставляя разработчикам более мощные инструменты. (Источник: narsilou)

Hugging Face Text Embeddings Inference (TEI) v1.8.0发布

Tencent Hunyuan выпустила компактные модели LLM: Tencent Hunyuan выпустила четыре компактные модели LLM (0.5B, 1.8B, 4B, 7B), предназначенные для сценариев с низким энергопотреблением, таких как потребительские GPU, умные автомобили, умные домашние устройства, мобильные телефоны и ПК. Эти модели поддерживают экономически эффективную тонкую настройку, расширяя экосистему LLM с открытым исходным кодом Hunyuan. (Источник: awnihannun)

腾讯混元发布紧凑型LLM模型

Инструмент для генерации AI-видео Topviewofficial: Topviewofficial представил инструмент для генерации AI-видео, который, как утверждается, может создавать вирусные видео за считанные минуты. Этот инструмент призван упростить процесс создания контента, используя технологии генеративного AI для быстрого создания креативных видеороликов. (Источник: Ronald_vanLoon)

Браузер Comet AI повышает эффективность: Браузер Comet пользователи хвалят как образец AI-браузинга, его потребление памяти почти в три раза меньше, чем у Chrome, и он работает более эффективно при том же количестве вкладок. Пользователи отмечают, что Comet стал браузером по умолчанию, поскольку он демонстрирует, как должен работать AI-браузер, и считают его IDE для не-разработчиков. (Источник: AravSrinivas)

Comet AI浏览器提升效率

📚 Обучение

Учебный лагерь New Turing Institute GStar: New Turing Institute запустил учебный лагерь GStar — 12-недельную глобальную программу для талантов, направленную на развитие навыков участников в передовых технологиях LLM, исследованиях и лидерстве. Программа разработана ведущими экспертами в области AI и включает в себя руководство известных ученых. (Источник: YiTayML)

New Turing Institute GStar训练营

Руководство по изучению AI-агентов: В социальных сетях было опубликовано руководство о том, как начать изучение AI-агентов, предоставляющее ресурсы и путь обучения для начинающих, интересующихся агентами искусственного интеллекта, помогая им понять и применить разработку AI-агентов. (Источник: Ronald_vanLoon)

AI代理学习指南

Рекомендации по выбору области докторских исследований в машинном обучении/глубоких нейронных сетях: Для магистрантов, желающих заниматься теоретическими/фундаментальными исследованиями в лабораториях AI, сообщество предоставило рекомендации по областям докторских исследований в теоретических основах машинного обучения/глубоких нейронных сетей, включая теорию статистического обучения и оптимизацию, а также обсудило популярные методы и математические фреймворки. (Источники: Reddit r/deeplearning, Reddit r/MachineLearning)

Анонс мероприятия Denis Rothman AMA: Сообщество Reddit анонсировало мероприятие AMA (Ask Me Anything) с Денисом Ротманом, лидером в области AI и создателем систем, предоставляя учащимся и практикам возможность пообщаться с экспертом и получить опыт. (Источник: Reddit r/deeplearning)

Запрос ресурсов по курсу компьютерного зрения: Пользователь в сообществе Reddit запросил помощь и ресурсы по заданиям курса “Глубокое обучение и компьютерное зрение” Мичиганского университета, что указывает на потребность в соответствующих учебных материалах и поддержке сообщества. (Источник: Reddit r/deeplearning)

Поиск доступа к набору данных MIMIC-IV: Независимый исследователь в сообществе Reddit ищет ссылку для доступа к набору данных MIMIC-IV для своего некоммерческого проекта по машинному обучению и NLP, направленного на изучение применения клинических заметок для выявления и прогнозирования предотвратимых медицинских ошибок. (Источник: Reddit r/MachineLearning)

Обсуждение выбора книг по глубокому обучению: Сообщество обсудило взаимодополняемость книг Гудфеллоу “Глубокое обучение” и серии Кевина Мерфи “Вероятностное машинное обучение”, предложив читателям выбирать в зависимости от различных методов обучения и стилей для получения более полной системы знаний. (Источник: Reddit r/MachineLearning)

Применение фреймворка DSPy в построении конвейеров LLM: Фреймворк DSPy демонстрирует потенциал в построении компонуемых конвейеров LLM и интеграции с графовыми базами данных, подчеркивая важность четких инструкций на естественном языке, последующих данных/оценки/обучения с подкреплением, а также структуры/каркаса, считая эти три элемента необходимыми для точного определения и автоматизации систем AI. (Источник: lateinteraction)

Прогресс в исследованиях AI: мультимодальные модели и воплощенные агенты: Недавние исследования AI достигли прогресса в расширении мультимодальных моделей (фреймворк VeOmni для эффективного 3D-параллелизма), обучении воплощенных систем на протяжении всей жизни (фреймворк RoboMemory, вдохновленный мозгом, для мультипамятных агентов) и контекстно-ориентированном плотном извлечении (модель SitEmb-v1.5, улучшающая производительность RAG для длинных документов), направленных на решение проблем эффективности и возможностей AI в сложных сценариях. (Источники: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

Прогресс в исследованиях AI: стратегии агентов и оптимизация моделей: Новейшие исследования изучают стратегии оптимизации вычислений агентов LLM во время тестирования (AgentTTS), использование достижения целей для исследовательского поведения в мета-обучении с подкреплением, а также улучшение способности моделей рассуждений следовать инструкциям с помощью самоконтролируемого обучения с подкреплением. Кроме того, рассматриваются динамическое отсечение визуальных токенов в больших визуально-языковых моделях и генерация маскированного движения с улучшенным извлечением (ReMoMask). (Источники: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

Прогресс в исследованиях AI: языковые модели, квантовые вычисления и искусство: Новые исследования охватывают бенчмаркинг базовых моделей речи в диалектном моделировании (Voxlect), применение квантово-классических SVM с эмбеддингами Vision Transformer в квантовом машинном обучении, а также ограничения AI в атрибуции произведений искусства и обнаружении изображений, сгенерированных AI. Кроме того, предложен метод неопределенности для автоматизированного построения данных вознаграждения процесса в математическом рассуждении и исследовано мультимодальное слияние спутниковых изображений и текста LLM для картирования бедности. (Источники: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

💼 Бизнес

AI меняет ландшафт рекламного рынка: AI глубоко меняет потоки рекламных расходов, что приводит к масштабной перестановке на рекламном рынке. Поисковая реклама сокращается из-за AI-резюме и диалогов, уменьшающих клики, в то время как розничные медиа (например, Amazon Rufus, Walmart Sparky) и брендовая медийная реклама (новостные ленты, короткие видео, CTV) возвращаются, поскольку они могут обеспечить более тесный коммерческий цикл и высокую конверсию. Бюджеты рекламодателей будут направляться на платформы, способные обеспечить стабильную отдачу и высокую эффективность. (Источник: 36氪)

AI重塑广告市场格局

EliseAI привлекла 2 миллиарда долларов финансирования: Andreessen Horowitz возглавил инвестиции в EliseAI, компанию, предоставляющую AI-голосовых агентов для управления недвижимостью и здравоохранения, оценив ее в 2 миллиарда долларов. Эти инвестиции подчеркивают огромный коммерческий потенциал AI-голосовых агентов в конкретных вертикальных отраслях. (Источник: steph_palazzolo)

OpenAI, Google, Anthropic одобрены в качестве поставщиков AI для правительства США: Правительство США включило OpenAI, Google и Anthropic в список утвержденных поставщиков AI, что означает, что технологии искусственного интеллекта этих компаний будут использоваться для поддержки критически важных государственных задач. Этот шаг направлен на внедрение конфиденциальности, безопасности и инноваций в федеральные агентства, повышая технологические возможности государственных ведомств. (Источник: kevinweil)

🌟 Сообщество

Обсуждение возможностей и ограничений LLM: В социальных сетях активно обсуждается проблема “книжности” и отсутствия “уличной смекалки” у больших языковых моделей (LLM), то есть их неспособность справляться со сложными, нестандартными ситуациями. Некоторые считают LLM “одноразовым интеллектом”, а понимание их внутренней работы сравнивают с “деконструкцией омлета”, что представляет собой огромные трудности. (Источники: Yuchenj_UW, pmddomingos, far__el)

Влияние AI на производство информации и доверие: В социальных дискуссиях отмечается, что эпоха генеративного AI может привести к “золотому веку” журналистики, поскольку в условиях изобилия AI-генерируемого контента единственным надежным источником станет контент, криптографически подписанный авторитетными человеческими журналистами. В то же время Cloudflare обвинила Perplexity в использовании скрытых краулеров для обхода инструкций сайта, что вызвало дискуссии о нормах поведения AI-агентов, конфиденциальности данных и интересах поставщиков рекламного контента. (Источники: aidan_mclau, francoisfleuret, wightmanr, Reddit r/artificial)

AI对信息生产与信任的影响

Проблема стиля ответов ChatGPT: Пользователи жалуются на “корпоративный, бодрый” стиль ответов ChatGPT, который они считают разочаровывающим, слишком позитивным и расплывчатым. Сообщество поделилось пользовательскими подсказками, направленными на то, чтобы ответы ChatGPT были более “неэмоционально ясными, принципиально честными и прагматично добрыми”, а также избегали бессмысленных заключительных фраз, чтобы улучшить качество диалога. (Источник: Reddit r/ChatGPT)

ChatGPT回复风格问题

Прогресс и вызовы в генерации реалистичных людей с помощью AI: Сообщество обсудило последние достижения AI в генерации реалистичных людей (включая лица, анимацию и видео), а также потенциал их применения в контенте создателей. Несмотря на растущую зрелость инструментов, все еще существуют проблемы, такие как неточный контроль движений, этические соображения и удобство использования, особенно в достижении голливудского уровня реализма. (Источник: Reddit r/artificial)

Ценность и споры вокруг открытого исходного кода AI: Генеральный директор Anthropic Дарио Амодей считает открытый исходный код AI “дымовой завесой”, аргументируя это высокой стоимостью обучения и хостинга больших моделей, а также тем, что текущие модели с открытым исходным кодом не достигают прорывов путем кумулятивных улучшений. Однако сообщество в целом подчеркивает огромный вклад проектов с открытым исходным кодом в глобальную технологическую экосистему и надеется на дальнейшее развитие LLM с открытыми весами, считая, что это способствует инновациям и демократизации технологий AI. (Источники: hardmaru, Reddit r/LocalLLaMA)

开源AI的价值与争议

Вызовы в исследованиях и разработке AI: Исследователи AI жалуются на низкую эффективность работы Meta AI, а также на злоупотребление LLM определенными паттернами, такими как try-except, в кодировании, что приводит к проблемам с качеством кода. Кроме того, сообщество обсудило степень автоматизации оценки моделей AI и обоснованность стратегий ценообразования в моделях стоимости вывода LLM, указывая, что текущая модель оплаты за токены не различает сложность вывода. (Источники: teortaxesTex, scaling01, fabianstelzer, HamelHusain)

AI研究与开发挑战

Сравнение производительности LLM для программирования: Проведено сравнительное тестирование производительности Alibaba Qwen3-Coder, Kimi K2 и Claude Sonnet 4 в реальных задачах программирования. Результаты показали, что Claude Sonnet 4 является наиболее надежным и быстрым, Qwen3-Coder демонстрирует стабильную производительность и превосходит Kimi K2 по скорости, в то время как Kimi K2 медленно работает в кодировании и иногда неполнофункционален, что вызвало дискуссии в сообществе о преимуществах и недостатках различных моделей в практическом применении. (Источник: Reddit r/LocalLLaMA)

编程LLM性能对比

💡 Прочее

Meta AI выпустила крупнейший открытый набор данных для улавливания углерода: Meta FAIR, Georgia Institute of Technology и cusp_ai совместно выпустили набор данных Open Direct Air Capture 2025, который является крупнейшим открытым набором данных для обнаружения передовых материалов для прямого улавливания углекислого газа. Этот набор данных призван ускорить климатические решения с помощью AI и способствовать развитию науки об экологически чистых материалах. (Источник: ylecun)

Meta AI发布最大开放碳捕获数据集

Обсуждение рабочей жизни и зарплат AI-инженеров: Сообщество обсудило рабочую жизнь AI-инженеров, включая вызовы для сотрудников стартапов, а также различия в структуре зарплат в отрасли, например, вопросы премии по акциям для старших инженеров и недавних выпускников по сравнению с рыночными ценами. (Источник: TheEthanDing)

AI工程师工作生活与薪资讨论

Инженерные вызовы в обучении моделей AI: Обсуждаются инженерные вызовы в обучении моделей AI, особенно важность GPU-инжиниринга. В блоге представлена “модель Roofline”, помогающая разработчикам анализировать вычислительные узкие места (вычислительно-интенсивные или память-интенсивные) и оптимизировать производительность оборудования для решения растущей сложности систем AI. (Источник: TheZachMueller)

AI模型训练的工程挑战

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *