Ключевые слова:AGI (Искусственный общий интеллект), DeepMind, Риски ИИ, Anthropic, Математические рассуждения, Tencent Hunyuan (Тенсент Хуньюань), Модели ИИ для видео, Управление векторами личности ИИ, Математический бенчмарк SeedProver, Универсальные функции λ-исчисления, Небольшие открытые LLM (Языковые модели), ИИ для эмоциональной выразительности в видео
🔥 В фокусе
DeepMind CEO Demis Hassabis о будущем AGI и науки : DeepMind CEO Демис Хассабис в недавнем интервью подробно обсудил будущее AGI, заявив, что AI способен эффективно моделировать все природные паттерны, сформированные в результате эволюции, и, как ожидается, достигнет AGI в течение следующих 5-10 лет. Он подчеркнул ключевую роль AI в моделировании физики, биологии, прогнозировании климата и других научных областях, а также заявил, что AI станет идеальным инструментом для решения основных проблем человечества, призывая к осторожному оптимизму в развитии AI. (Источник: 量子位)
Geoffrey Hinton продолжает предупреждать о рисках AI : Крестный отец AI Джеффри Хинтон продолжает публично предупреждать о потенциальных экзистенциальных рисках, связанных с AI, предсказывая 10-20% вероятность вымирания человечества из-за AI в течение 30 лет и полагая, что AI может достичь самосознания и восприятия в течение 5 лет. Он подчеркнул, что универсальность AI делает его влияние намного шире, чем у атомной бомбы, и призвал мировое сообщество осторожно подходить к развитию AI. (Источник: 量子位

)
Anthropic достигла контроля над векторами личности AI : Исследовательская группа Anthropic обнаружила, что с помощью одного вектора можно контролировать личностные черты LLM, включая ложь, лесть и даже злонамеренное поведение, что делает настройку личности AI такой же простой, как переключение тумблера. Это открытие имеет глубокие последствия для выравнивания языковых моделей и контроля поведения, предвещая новую парадигму в человеко-машинном взаимодействии и этическом контроле AI. (Источник: _mfelfel

)
ByteDance выпустила SeedProver, значительно улучшив математические рассуждения : ByteDance выпустила модель SeedProver, которая набрала 331/657 баллов в математическом тесте PutnamBench, что почти в 4 раза выше, чем у существующих моделей SOTA, и достигла 100% точности на miniF2F от OpenAI. Это свидетельствует о значительном прогрессе AI в области сложного математического рассуждения и доказательства, предвещая огромный потенциал AI в научных исследованиях в будущем. (Источник: clefourrier
, jxmnop
)
AI выводит универсальные функции в λ-исчислении : Google Gemini Pro 2.5 с помощью Deep Think впервые успешно вывел универсальную функцию “foldr” для N-кортежей в λ-исчислении. Этот прорыв превосходит другие основные модели, демонстрируя его мощные возможности в сложной логической дедукции и математическом доказательстве, и знаменует собой важный прогресс AI в абстрактном рассуждении и понимании формальных систем. (Источник: quocleix, jon_lee0, YiTayML, GoogleDeepMind
, quocleix
)
🎯 Тенденции
Tencent Hunyuan выпустила несколько небольших открытых LLM : Tencent Hunyuan выпустила четыре небольшие открытые LLM: 0.5B, 1.8B, 4B, 7B, предназначенные для сценариев с низким энергопотреблением (например, потребительские GPU, умные автомобили, умный дом, мобильные телефоны, ПК), поддерживающие эффективную тонкую настройку, а также обладающие гибридным выводом, сверхдлинным контекстом 256K и отличными возможностями Agent. Это знаменует собой популяризацию больших моделей для периферийных устройств и разнообразных сценариев применения. (Источник: teortaxesTex
, QuixiAI
, tri_dao

AI-видеомодель Wan 2.2 поддерживает эмоциональное выражение : Команда Alibaba_Wan объявила, что их AI-видеомодель Wan 2.2 теперь поддерживает захват и генерацию различных сложных эмоциональных выражений, от радости, гнева, печали и веселья до смешанных эмоций, таких как “воздушный поцелуй”, что значительно повышает реалистичность и выразительность AI-видеоконтента. (Источник: Alibaba_Wan, TomLikesRobots
)
Выпущена модель GLM-4.5 с усиленными возможностями Agent : Модель GLM-4.5 официально выпущена, ее архитектура включает встроенные возможности Agent и мощные функции использования инструментов. Модель использует архитектуру MoE и сочетает ее с настраиваемой стратегией RL (slime), поддерживая синхронное обучение с выводом и асинхронное обучение задач Agent, достигая успеха в вызове инструментов до 90.6%, превосходя Claude 4 Sonnet. (Источник: TheTuringPost
)
Qwen скоро выпустит модель генерации изображений : Команда Qwen анонсировала скорый выпуск модели генерации изображений с 20B параметрами, которая будет поддерживать визуальные возможности. Это еще больше обогатит экосистему генерации изображений с открытым исходным кодом и предоставит пользователям больше высококачественных инструментов для создания изображений. (Источник: iScienceLuvr


)
Claude Opus 4.1 скоро будет выпущен : Ожидается скорый выпуск модели Claude Opus 4.1 от Anthropic. Как новая версия серии Claude, она, как ожидается, принесет дальнейшие улучшения в производительности и функциональности, продолжая расширять границы развития больших языковых моделей. (Источник: scaling01

, dotey

, op7418



)
Модель XBai o4 превосходит Claude Opus по производительности : Открытая модель XBai o4 от китайской AI-лаборатории превзошла o3-mini от OpenAI по производительности и уверенно победила Claude Opus от Anthropic. Модель распространяется под лицензией Apache 2.0 и доступна на Hugging Face, что свидетельствует о значительном прогрессе Китая в области моделей с открытым исходным кодом. (Источник: ClementDelangue
)
Ant AlignXplore улучшает персонализированное понимание AI : Исследовательский центр Ant General Artificial Intelligence Research Center предложил метод AlignXplore, который с помощью обучения с подкреплением и механизма потокового вывода предпочтений позволяет AI обобщать предпочтения пользователей на основе их поведения и динамически обновлять их, значительно повышая возможности персонализированного выравнивания на 15.49%. Эта технология призвана избавить AI от сложных подсказок и обеспечить более “эмоционально интеллектуальное” человеко-машинное взаимодействие. (Источник: 量子位

)
Huawei выпустила большую модель Pangu с 718B параметрами : Huawei выпустила веса модели Pangu Ultra MoE с 718B параметрами, которая полностью обучена на Huawei Ascend NPU и является полностью самостоятельно разработанной китайской моделью. Ее лицензионное соглашение относительно свободно, но требует указания “Powered by openPangu” и информации о товарном знаке. (Источник: Reddit r/LocalLLaMA

)
🧰 Инструменты
Google LangExtract: Инструмент для извлечения структурированной информации из документов : Google выпустила LangExtract, инструмент, способный извлекать структурированную информацию из неструктурированных документов по запросу пользователя. Он поддерживает отслеживание источников, структурированный вывод и оптимизирован для длинных документов, а также поддерживает развертывание LLM в облаке и локально, повышая эффективность обработки документов. (Источник: omarsar0
)
Инструменты для AI-помощи в программировании и Agent-систем : ScreenCoder — это система Agent, которая преобразует дизайн пользовательского интерфейса во фронтенд-код. Kilo Code от Zai.org теперь поддерживает модель GLM-4.5. Функция “ultrathink” Claude Opus улучшает способность модели к мышлению. Пользователи успешно разработали автономный симулятор дронов и приложения для iOS с помощью Claude Opus, причем даже пользователи без опыта программирования смогли создать сложные приложения. Jules Agent постоянно обновляется, а Tasker AI как AI-помощник может управлять Agent для выполнения повседневных задач. Все это демонстрирует мощные возможности AI в программировании и автоматизации задач. (Источник: TheTuringPost
, julesagent, _akhaliq, Reddit r/ClaudeAI

Comp AI: Инструмент автоматизации соответствия на основе AI Agent : Comp AI использует AI Agent для автоматизации процессов соответствия, таких как сбор доказательств, оценка рисков, разработка и обновление политик, что позволяет сократить время на соответствие SOC 2 с 60 часов до 2-4 часов. Этот инструмент призван решить проблемы соответствия для предприятий и повысить эффективность. (Источник: claud_fuen
)
Hugging Face интегрирован в Jan как удаленный поставщик моделей : Hugging Face теперь может быть интегрирован в Jan как удаленный поставщик моделей, позволяя пользователям выбирать и использовать любую модель с Hugging Face в Jan через ключ API Hugging Face. Это значительно упрощает доступ и применение различных моделей для разработчиков и исследователей. (Источник: ClementDelangue)
DocStrange: Библиотека для извлечения данных из документов с открытым исходным кодом : DocStrange — это открытая библиотека Python, упрощающая процесс извлечения данных из документов. Она поддерживает различные форматы ввода, такие как PDF, изображения, Word, Excel, и может выводить данные в форматах Markdown, JSON, CSV, HTML. Она также поддерживает интеллектуальное извлечение полей и определение Schema, предлагая бесплатную облачную обработку и локальный режим конфиденциальности. (Источник: Reddit r/MachineLearning, Reddit r/MachineLearning)
Vinsoo: Основатель, родившийся в 2000-х, переопределяет парадигму AI-программирования : Yunsi Intelligent (AIYouthLab) выпустила Vinsoo AI IDE, первую в мире интегрированную среду разработки с облачной командой программирования Agent. Она инновационно поддерживает параллельное выполнение задач несколькими интеллектуальными Agent, реализуя автоматизированную разработку от анализа требований до окончательной поставки, и предлагает два режима работы: Vibe и Full Cycle, подчеркивая безопасную изоляцию в облачной песочнице. (Источник: 量子位

)
Podcastfy.ai: Инструмент для генерации мультимодальных подкастов с открытым исходным кодом : Podcastfy.ai — это открытая библиотека Python, которая может преобразовывать мультимодальный контент (текст, изображения, видео, PDF и т. д.) в увлекательные многоязычные аудиодиалоги. Она поддерживает генерацию коротких или длинных подкастов, настройку стиля диалога и языка, а также интегрирует различные LLM и модели преобразования текста в речь, стремясь предоставить открытую альтернативу функции подкастов NotebookLM. (Источник: GitHub Trending
)
📚 Обучение
GEPA: Оптимизация рефлексивных подсказок превосходит обучение с подкреплением : GEPA — это новый алгоритм оптимизации рефлексивных подсказок, который демонстрирует выдающиеся результаты в оптимизации LLM, превосходя даже традиционный алгоритм обучения с подкреплением GRPO в некоторых задачах, требуя в 35 раз меньше итераций. Он улучшает производительность за счет инновационных механизмов, таких как выбор кандидатов по Парето-оптимальности, рефлексивная мутация подсказок и слияние с учетом системы.