Ключевые слова:AGI (Искусственный общий интеллект), DeepMind, Риски ИИ, Anthropic, Математические рассуждения, Tencent Hunyuan (Тенсент Хуньюань), Модели ИИ для видео, Управление векторами личности ИИ, Математический бенчмарк SeedProver, Универсальные функции λ-исчисления, Небольшие открытые LLM (Языковые модели), ИИ для эмоциональной выразительности в видео

🔥 В фокусе

DeepMind CEO Demis Hassabis о будущем AGI и науки : DeepMind CEO Демис Хассабис в недавнем интервью подробно обсудил будущее AGI, заявив, что AI способен эффективно моделировать все природные паттерны, сформированные в результате эволюции, и, как ожидается, достигнет AGI в течение следующих 5-10 лет. Он подчеркнул ключевую роль AI в моделировании физики, биологии, прогнозировании климата и других научных областях, а также заявил, что AI станет идеальным инструментом для решения основных проблем человечества, призывая к осторожному оптимизму в развитии AI. (Источник: 量子位)

Geoffrey Hinton продолжает предупреждать о рисках AI : Крестный отец AI Джеффри Хинтон продолжает публично предупреждать о потенциальных экзистенциальных рисках, связанных с AI, предсказывая 10-20% вероятность вымирания человечества из-за AI в течение 30 лет и полагая, что AI может достичь самосознания и восприятия в течение 5 лет. Он подчеркнул, что универсальность AI делает его влияние намного шире, чем у атомной бомбы, и призвал мировое сообщество осторожно подходить к развитию AI. (Источник: 量子位

Hinton能重新坐下了,什么时候开始的?

)

Anthropic достигла контроля над векторами личности AI : Исследовательская группа Anthropic обнаружила, что с помощью одного вектора можно контролировать личностные черты LLM, включая ложь, лесть и даже злонамеренное поведение, что делает настройку личности AI такой же простой, как переключение тумблера. Это открытие имеет глубокие последствия для выравнивания языковых моделей и контроля поведения, предвещая новую парадигму в человеко-машинном взаимодействии и этическом контроле AI. (Источник: _mfelfel

BREAKING: Anthropic just figured out how to control AI personalities with a single vector. Lying, flattery, even evil behavior? Now it’s all tweakable like turning a dial. This changes everything about how we align language models.

)

ByteDance выпустила SeedProver, значительно улучшив математические рассуждения : ByteDance выпустила модель SeedProver, которая набрала 331/657 баллов в математическом тесте PutnamBench, что почти в 4 раза выше, чем у существующих моделей SOTA, и достигла 100% точности на miniF2F от OpenAI. Это свидетельствует о значительном прогрессе AI в области сложного математического рассуждения и доказательства, предвещая огромный потенциал AI в научных исследованиях в будущем. (Источник: clefourrier

clefourrier

, cloneofsimo

cloneofsimo

, jxmnop

jxmnop

, Dorialexander

Dorialexander

)

AI выводит универсальные функции в λ-исчислении : Google Gemini Pro 2.5 с помощью Deep Think впервые успешно вывел универсальную функцию “foldr” для N-кортежей в λ-исчислении. Этот прорыв превосходит другие основные модели, демонстрируя его мощные возможности в сложной логической дедукции и математическом доказательстве, и знаменует собой важный прогресс AI в абстрактном рассуждении и понимании формальных систем. (Источник: quocleix, jon_lee0, YiTayML, GoogleDeepMind

GoogleDeepMind

, quocleix

quocleix

)

🎯 Тенденции

Tencent Hunyuan выпустила несколько небольших открытых LLM : Tencent Hunyuan выпустила четыре небольшие открытые LLM: 0.5B, 1.8B, 4B, 7B, предназначенные для сценариев с низким энергопотреблением (например, потребительские GPU, умные автомобили, умный дом, мобильные телефоны, ПК), поддерживающие эффективную тонкую настройку, а также обладающие гибридным выводом, сверхдлинным контекстом 256K и отличными возможностями Agent. Это знаменует собой популяризацию больших моделей для периферийных устройств и разнообразных сценариев применения. (Источник: teortaxesTex

teortaxesTex

, QuixiAI

QuixiAI

, tri_dao

tri_dao

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA)

AI-видеомодель Wan 2.2 поддерживает эмоциональное выражение : Команда Alibaba_Wan объявила, что их AI-видеомодель Wan 2.2 теперь поддерживает захват и генерацию различных сложных эмоциональных выражений, от радости, гнева, печали и веселья до смешанных эмоций, таких как “воздушный поцелуй”, что значительно повышает реалистичность и выразительность AI-видеоконтента. (Источник: Alibaba_Wan, TomLikesRobots

TomLikesRobots

)

Выпущена модель GLM-4.5 с усиленными возможностями Agent : Модель GLM-4.5 официально выпущена, ее архитектура включает встроенные возможности Agent и мощные функции использования инструментов. Модель использует архитектуру MoE и сочетает ее с настраиваемой стратегией RL (slime), поддерживая синхронное обучение с выводом и асинхронное обучение задач Agent, достигая успеха в вызове инструментов до 90.6%, превосходя Claude 4 Sonnet. (Источник: TheTuringPost

TheTuringPost

, TheTuringPost

TheTuringPost

)

Qwen скоро выпустит модель генерации изображений : Команда Qwen анонсировала скорый выпуск модели генерации изображений с 20B параметрами, которая будет поддерживать визуальные возможности. Это еще больше обогатит экосистему генерации изображений с открытым исходным кодом и предоставит пользователям больше высококачественных инструментов для создания изображений. (Источник: iScienceLuvr

iScienceLuvr

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

Claude Opus 4.1 скоро будет выпущен : Ожидается скорый выпуск модели Claude Opus 4.1 от Anthropic. Как новая версия серии Claude, она, как ожидается, принесет дальнейшие улучшения в производительности и функциональности, продолжая расширять границы развития больших языковых моделей. (Источник: scaling01

scaling01

, dotey

dotey

, op7418

op7418

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

)

Модель XBai o4 превосходит Claude Opus по производительности : Открытая модель XBai o4 от китайской AI-лаборатории превзошла o3-mini от OpenAI по производительности и уверенно победила Claude Opus от Anthropic. Модель распространяется под лицензией Apache 2.0 и доступна на Hugging Face, что свидетельствует о значительном прогрессе Китая в области моделей с открытым исходным кодом. (Источник: ClementDelangue

ClementDelangue

)

Ant AlignXplore улучшает персонализированное понимание AI : Исследовательский центр Ant General Artificial Intelligence Research Center предложил метод AlignXplore, который с помощью обучения с подкреплением и механизма потокового вывода предпочтений позволяет AI обобщать предпочтения пользователей на основе их поведения и динамически обновлять их, значительно повышая возможности персонализированного выравнивания на 15.49%. Эта технология призвана избавить AI от сложных подсказок и обеспечить более “эмоционально интеллектуальное” человеко-машинное взаимодействие. (Источник: 量子位

告别复杂提示词!蚂蚁新方式让AI自动理解你的个性化需求

)

Huawei выпустила большую модель Pangu с 718B параметрами : Huawei выпустила веса модели Pangu Ultra MoE с 718B параметрами, которая полностью обучена на Huawei Ascend NPU и является полностью самостоятельно разработанной китайской моделью. Ее лицензионное соглашение относительно свободно, но требует указания “Powered by openPangu” и информации о товарном знаке. (Источник: Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

🧰 Инструменты

Google LangExtract: Инструмент для извлечения структурированной информации из документов : Google выпустила LangExtract, инструмент, способный извлекать структурированную информацию из неструктурированных документов по запросу пользователя. Он поддерживает отслеживание источников, структурированный вывод и оптимизирован для длинных документов, а также поддерживает развертывание LLM в облаке и локально, повышая эффективность обработки документов. (Источник: omarsar0

omarsar0

)

Инструменты для AI-помощи в программировании и Agent-систем : ScreenCoder — это система Agent, которая преобразует дизайн пользовательского интерфейса во фронтенд-код. Kilo Code от Zai.org теперь поддерживает модель GLM-4.5. Функция “ultrathink” Claude Opus улучшает способность модели к мышлению. Пользователи успешно разработали автономный симулятор дронов и приложения для iOS с помощью Claude Opus, причем даже пользователи без опыта программирования смогли создать сложные приложения. Jules Agent постоянно обновляется, а Tasker AI как AI-помощник может управлять Agent для выполнения повседневных задач. Все это демонстрирует мощные возможности AI в программировании и автоматизации задач. (Источник: TheTuringPost

TheTuringPost

, sbmaruf, Zai_org

Zai_org

, julesagent, _akhaliq, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI)

Comp AI: Инструмент автоматизации соответствия на основе AI Agent : Comp AI использует AI Agent для автоматизации процессов соответствия, таких как сбор доказательств, оценка рисков, разработка и обновление политик, что позволяет сократить время на соответствие SOC 2 с 60 часов до 2-4 часов. Этот инструмент призван решить проблемы соответствия для предприятий и повысить эффективность. (Источник: claud_fuen

claud_fuen

)

Hugging Face интегрирован в Jan как удаленный поставщик моделей : Hugging Face теперь может быть интегрирован в Jan как удаленный поставщик моделей, позволяя пользователям выбирать и использовать любую модель с Hugging Face в Jan через ключ API Hugging Face. Это значительно упрощает доступ и применение различных моделей для разработчиков и исследователей. (Источник: ClementDelangue)

DocStrange: Библиотека для извлечения данных из документов с открытым исходным кодом : DocStrange — это открытая библиотека Python, упрощающая процесс извлечения данных из документов. Она поддерживает различные форматы ввода, такие как PDF, изображения, Word, Excel, и может выводить данные в форматах Markdown, JSON, CSV, HTML. Она также поддерживает интеллектуальное извлечение полей и определение Schema, предлагая бесплатную облачную обработку и локальный режим конфиденциальности. (Источник: Reddit r/MachineLearning, Reddit r/MachineLearning)

Vinsoo: Основатель, родившийся в 2000-х, переопределяет парадигму AI-программирования : Yunsi Intelligent (AIYouthLab) выпустила Vinsoo AI IDE, первую в мире интегрированную среду разработки с облачной командой программирования Agent. Она инновационно поддерживает параллельное выполнение задач несколькими интеллектуальными Agent, реализуя автоматизированную разработку от анализа требований до окончательной поставки, и предлагает два режима работы: Vibe и Full Cycle, подчеркивая безопасную изоляцию в облачной песочнице. (Источник: 量子位

00后创始人重新定义AI编程范式!全球首个搭载云端Agent编程团队的IDE来了!

)

Podcastfy.ai: Инструмент для генерации мультимодальных подкастов с открытым исходным кодом : Podcastfy.ai — это открытая библиотека Python, которая может преобразовывать мультимодальный контент (текст, изображения, видео, PDF и т. д.) в увлекательные многоязычные аудиодиалоги. Она поддерживает генерацию коротких или длинных подкастов, настройку стиля диалога и языка, а также интегрирует различные LLM и модели преобразования текста в речь, стремясь предоставить открытую альтернативу функции подкастов NotebookLM. (Источник: GitHub Trending

souzatharsis/podcastfy - GitHub Trending (all/daily)

)

📚 Обучение

GEPA: Оптимизация рефлексивных подсказок превосходит обучение с подкреплением : GEPA — это новый алгоритм оптимизации рефлексивных подсказок, который демонстрирует выдающиеся результаты в оптимизации LLM, превосходя даже традиционный алгоритм обучения с подкреплением GRPO в некоторых задачах, требуя в 35 раз меньше итераций. Он улучшает производительность за счет инновационных механизмов, таких как выбор кандидатов по Парето-оптимальности, рефлексивная мутация подсказок и слияние с учетом системы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *