Ключевые слова:Искусственный интеллект в медицине, Языковая модель, Обучение с подкреплением, Логический вывод ИИ, Тестирование производительности ИИ, Инструменты ИИ, Бизнес-приложения ИИ, Этика ИИ, OpenAI HealthBench, Meta Physics of Language Models, Движок логического вывода FlashInfer, Генерация виртуальных миров Matrix-Game, Распределенное обучение INTELLECT-2
好的,以下是将中文AI资讯翻译为俄语的结果,已遵循您的要求:
🔥 В центре внимания
Выпущен бенчмарк OpenAI HealthBench, возможности AI в медицине значительно улучшились: OpenAI выпустила HealthBench, бенчмарк для оценки медицинского AI, созданный в сотрудничестве с 262 врачами по всему миру. Тесты показывают, что новейшие модели AI (такие как o3, GPT-4.1) в сценариях медицинского диалога демонстрируют производительность, сравнимую с лучшим уровнем, достигаемым врачами с помощью AI, значительно превосходя независимых врачей (примерно в 4 раза). Производительность небольших моделей также улучшилась. Это свидетельствует об огромном потенциале AI в области здравоохранения, а система оценки призвана способствовать безопасному и эффективному применению AI в клинической практике. (Источник: Reddit r/ArtificialInteligence, BorisMPower, clefourrier)

Выпущена четвертая часть исследования Meta Physics of Language Models: Исследовательское подразделение Meta AI опубликовало четвертую часть серии исследований «Физика языковых моделей». Используя контролируемую синтетическую среду предварительного обучения, они обнаружили легковесный компонент под названием «Canon layers», который, добавляя «горизонтальные остаточные связи» между токенами, может значительно повысить способность к инференсу и обобщению моделей с различными архитектурами, такими как Transformer, Mamba, GLA. (Источник: AIatMeta, arohan)

FlashInfer получил награду MLSys 2025 за лучшую статью и поддержку от NVIDIA: Статья о технологии FlashInfer — высокоэффективном настраиваемом механизме внимания для сервисов инференса LLM — получила награду MLSys 2025 за лучшую статью. NVIDIA объявила о поддержке проекта и интегрирует передовые ядра инференса LLM, такие как TensorRT-LLM, в FlashInfer для использования vLLM, SGLang и другими, с целью повышения эффективности и масштабируемости инференса LLM. (Источник: vllm_project, _philschmid)
Kunlun Wanwei выпустила интерактивный движок для генерации мира Matrix-Game: Компания Kunlun Wanwei представила Matrix-Game — интерактивный движок, способный генерировать виртуальные миры и управлять ими с помощью текстовых команд. Он поддерживает генерацию различных сцен, таких как пустыни и леса, а также обеспечивает плавное управление действиями, такими как движение вперед, прыжки, атаки, и переключение обзора на 360°. Ожидается, что эта технология ускорит разработку игр, обучение воплощенного AI и создание контента для метавселенных. (Источник: WeChat)

Prime Intellect выпустила INTELLECT-2 — распределенную модель для обучения RL: Prime Intellect выпустила INTELLECT-2, заявив, что это первая модель для распределенного обучения с подкреплением (RL), использующая интеграцию простаивающих вычислительных ресурсов по всему миру, с производительностью, сравнимой с DeepSeek-R1. Проект направлен на снижение затрат на обучение RL, преодоление зависимости от централизованных вычислительных мощностей и получил инвестиции от известных личностей, таких как Karpathy, Tri Dao. Его основные компоненты (PRIME-RL, SHARDCAST, TOPLOC, Protocol Testnet) были выпущены с открытым исходным кодом. (Источник: 36氪)

Пионеры обучения с подкреплением Эндрю Барто и Ричард Саттон получили премию Тьюринга: Эндрю Барто и Ричард Саттон были удостоены премии Тьюринга за их основополагающий вклад в области обучения с подкреплением (включая обучение с временными различиями). Их работа оказала глубокое влияние на AI и нашла отражение в таких проектах, как AlphaGo. Они планируют использовать часть призовых денег для поддержки свободы исследований молодых ученых и учреждения стипендий для аспирантов. (Источник: WeChat)
Новый Папа Римский назван в честь революции AI, «AI-царь» прогнозирует миллионкратный рост AI за четыре года: Новоизбранный Папа Римский Лев XIV заявил, что его имя частично выбрано в ответ на вызовы, которые «новая промышленная революция», вызванная AI, бросает человеческому достоинству, справедливости и труду, демонстрируя обеспокоенность церкви этикой AI. Первый «AI и криптовалютный царь» США Дэвид Сакс предсказал, что благодаря экспоненциальному прогрессу в моделях, чипах и вычислительной мощности возможности AI вырастут в миллион раз за четыре года, подчеркнув важность понимания экспоненциального роста и его разрушительного воздействия. (Источник: WeChat)

🎯 Тенденции
Технический отчет Alibaba Qwen3 раскрывает детали обучения: Alibaba Cloud опубликовала технический отчет по Qwen3, подробно описывающий процесс его обучения на 36 триллионах токенов, включая масштабные инвестиции данных для небольших моделей и многоэтапное пост-обучение (например, CoT, RL). Модель показала отличные результаты на бенчмарках, таких как MathArena, но обсуждения в сообществе также указали на ошибки в ее шаблоне чата и на то, что ее производительность в задачах, не связанных с инференсом, уступает Mistral Medium 3. (Источник: cognitivecompai, rishdotblog, Dorialexander, teortaxesTex, qtnx_, nrehiew_, Reddit r/LocalLLaMA)

Конгресс США рассматривает возможность приостановки регулирования AI на уровне штатов на десять лет: Текстовый проект комитета по торговле Палаты представителей США содержит предложение о приостановке регулирования AI на уровне штатов на десять лет, чтобы избежать появления сложных законодательных актов штатов, препятствующих инновациям в AI. Этот шаг получил поддержку от некоторых чиновников штатов, которые считают, что регулирование AI должно осуществляться на федеральном уровне. (Источник: ylecun, pmddomingos, jd_pressman, Reddit r/artificial)

Помощники по кодированию развиваются в сторону «всегда включенных» агентов: Помощники по кодированию переходят от роли парных программистов, требующих множества подсказок и человеческой помощи, к «всегда включенным» агентам, постоянно ищущим ошибки и уязвимости в фоновом режиме. (Источник: steph_palazzolo)
Появляются новые концепции в области AI: В области исследований AI появилось несколько новых концепций, включая «Continuous Thought Machines» от SakanaAI (подчеркивает временной аспект), «Elastic Reasoning» от Salesforce (разделение этапов мышления и решения), «ZeroSearch» от Alibaba (использование LLM в качестве симулированного поискового движка) и «Absolute Zero» от Tsinghua University (обучение полностью через самообучение). (Источник: TheTuringPost)

Видеомодель Kuaishou Kling 2.0 возглавила рейтинг: Модель Kling 2.0, представленная Kuaishou, превзошла Veo 2 и Runway Gen 4 в рейтинге генерации видео от Artificial Analysis, став ведущей моделью для преобразования изображений в видео. Пользователи сообщества выразили признание ее производительности. (Источник: scaling01)

Тест пользовательских предпочтений OpenAI GPT-4.1 опережает Claude 3.5 Sonnet: Тесты пользовательских предпочтений показывают, что GPT-4.1 от OpenAI (включая даже 4.1-mini) опережает Claude 3.5 Sonnet по удобству использования. (Источник: imjaredz)
Усиливается конкуренция между AMD и NVIDIA в разработке программного обеспечения для AI: Активность на GitHub показывает, что количество Pull Request’ов, отправленных командой ROCm PyTorch от AMD, догоняет технического руководителя PyTorch в NVIDIA, что свидетельствует об усилении конкуренции в области разработки базового аппаратного и программного обеспечения для AI. (Источник: zacharynado)

Новая модель Anthropic «claude-neptune» проходит тестирование безопасности: Поступают сообщения о том, что Anthropic проводит тестирование безопасности своей новой модели «claude-neptune», что может предвещать скорый выпуск новой модели. (Источник: scaling01)

Бесплатный доступ к API Gemini 2.5 Pro приостановлен из-за высокого спроса: Из-за огромного спроса Google временно приостановил доступ к бесплатному уровню Gemini 2.5 Pro через API, чтобы обеспечить разработчикам возможность продолжать масштабировать свои приложения. Модель по-прежнему доступна для бесплатного использования в Google AI Studio. (Источник: matvelloso)
Firefox изучает возможность интеграции llama.cpp в WASM: Firefox экспериментирует на GitHub с интеграцией библиотеки llama.cpp в WebAssembly (WASM), что может означать, что в будущем пользователи смогут запускать локальные LLM прямо в браузере. (Источник: ClementDelangue, ggerganov)

Бенчмарк LLM для AMD Ryzen AI Max+ PRO 395: Тесты бенчмарка LLM для AMD Ryzen AI Max+ PRO 395 под Linux показывают, что его производительность, по-видимому, ниже, чем у RTX 4060 Ti. Обсуждения в сообществе указывают на то, что тест, возможно, отражает только производительность CPU, и обсуждают производительность его iGPU, преимущества видеопамяти, а также текущие проблемы совместимости с Intel GPU в отношении FP8, Flash Attention и распределения памяти. (Источник: Reddit r/LocalLLaMA)
🧰 Инструменты
Выпущен протокол с открытым исходным кодом Minions Secure Chat для зашифрованного облачного чата с LLM: Выпущен протокол с открытым исходным кодом под названием «Minions Secure Chat», предназначенный для реализации сквозного шифрования в облачном чате с LLM с крайне низкими накладными расходами на задержку (<1%), даже для моделей с параметрами 30B+. Протокол гарантирует, что поставщики облачных услуг не могут просматривать содержимое сообщений, а инференс выполняется в безопасном GPU enclave, обеспечивая конфиденциальность. (Источник: realDanFu, ollama, rebeccatqian, code_star)

DSPy обеспечивает рекурсивное суммирование текста произвольной длины: Была продемонстрирована программа, созданная с использованием DSPy, способная рекурсивно суммировать текст произвольной длины. Программа реализует это путем построения структуры, разделения содержимого на блоки и параллельной обработки каждой части, предлагая универсальное решение для работы с длинными документами. (Источник: lateinteraction)

Runway AI добавил кинематографические элементы управления и функции референсов в генерацию видео: Runway представил новые функции в своей модели генерации видео Gen-4, включая более 20 кинематографических элементов управления камерой, референсы и смешивание нескольких элементов, а также более плавную обработку сложных движений. Расширенные функции референсов также повышают точность размещения объектов. (Источник: c_valenzuelab, TomLikesRobots)

Выпущен OpenMemory MCP, предоставляющий локальную частную память для AI-агентов: Выпущен OpenMemory MCP — частный, локальный, постоянный слой памяти, разработанный для совместимых с MCP AI-клиентов (таких как Cursor, Claude Desktop). Он позволяет различным AI-инструментам безопасно и приватно читать и записывать общую память, работая полностью на машине пользователя без зависимости от облачных сервисов. (Источник: omarsar0)
HeyGen представил функцию Voice Mirroring: HeyGen выпустил функцию Voice Mirroring, позволяющую пользователям копировать определенные голосовые стили или характеристики в аудио, сгенерированном AI. (Источник: Ronald_vanLoon)
Выпущен фреймворк с открытым исходным кодом Step1X-3D для управляемой генерации 3D-активов: StepFun AI выпустила Step1X-3D на Hugging Face — фреймворк с открытым исходным кодом для высококачественной, управляемой генерации текстурированных 3D-активов. (Источник: huggingface, _akhaliq, reach_vb)

Увеличена скорость транскрипции Hugging Face Whisper: Hugging Face запустила конечную точку транскрипции Whisper, основанную на vLLM и оптимизированную для NVIDIA GPU, увеличив скорость до 8 раз и обеспечив лучшую производительность при более низких затратах. (Источник: ClementDelangue, huggingface, vllm_project)

Обновлен Memory API LlamaIndex с поддержкой объединения долгосрочной и краткосрочной памяти: LlamaIndex обновил свой Memory API, сделав его более гибким, объединив краткосрочную историю чата и долгосрочную память через подключаемые модули (статическая, извлечение фактов, векторная память). (Источник: jerryjliu0)

NVIDIA выпустила CUTLASS 4.0 с поддержкой нативного программирования GPU на Python: NVIDIA выпустила CUTLASS 4.0 — библиотеку, поддерживающую нативное программирование GPU на Python. Это обновление призвано ускорить разработку ядер и изучение новых идей в областях ML и программирования GPU. (Источник: marksaroufim, tri_dao)

Проект с открытым исходным кодом WeClone для создания цифрового двойника из истории чатов: Популярный проект с открытым исходным кодом на GitHub, WeClone, предлагает решение для создания цифровых двойников из истории чатов WeChat. Путем донастройки больших языковых моделей для захвата личного стиля общения и привязки их к чат-ботам, таким как WeChat, QQ, Telegram, он также включает функции фильтрации конфиденциальности. (Источник: GitHub Trending)

Инструмент с открытым исходным кодом Google Maps Scraper для сбора данных карт: Популярный инструмент с открытым исходным кодом на GitHub для сбора данных списков Google Maps. Он предоставляет интерфейсы командной строки, Web UI и REST API, может извлекать названия компаний, адреса, контактную информацию, рейтинги, отзывы и т. д., а также поддерживает извлечение электронной почты и «быстрый режим». (Источник: GitHub Trending)
Пользователи OpenWebUI сообщают о ряде технических проблем: Пользователи OpenWebUI сообщили о ряде технических проблем, включая игнорирование параметров Modelfile (таких как num_ctx), приводящее к сбоям, невозможность доступа к UI в локальной сети после обновлений, невозможность использования встроенного веб-поиска OpenAI с определенными моделями, а также проблемы с тайм-аутом в старых сеансах чата. (Источник: Reddit r/OpenWebUI)

Робот для осмотра железнодорожных путей: Упоминается многофункциональный робот под названием RailScan, используемый для осмотра железнодорожных путей, что является примером применения технологий AI и робототехники в промышленности. (Источник: Ronald_vanLoon)

Робот для 3D-печати в строительстве: Технология 3D-печати в сочетании с робототехникой применяется в строительстве, например, для 3D-печати конструкций, что демонстрирует прогресс робототехники и AI в автоматизированном строительстве. (Источник: Ronald_vanLoon)
Воплощенные AI-роботы: Упоминаются автономные, управляемые AI роботы, способные беспрепятственно перемещаться в сложных средах и точно выполнять задачи, демонстрируя потенциал воплощенного AI и робототехники в реальных приложениях. (Источник: Ronald_vanLoon)

Биоинспирированные роботы: Упоминается исследование о грибах, которые научились ползать после того, как им придали роботизированные тела, демонстрируя, как биологическое вдохновение может способствовать развитию робототехники. (Источник: Ronald_vanLoon)

📚 Обучение
Сборник ресурсов для обучения AI: Сообщество поделилось различными ресурсами для обучения AI, включая положительные отзывы о ресурсах @dair_ai, онлайн-мастер-классы и книжные воркшопы по оценке AI, видеоруководства по инференсу LLM, объяснение различий между Agentic AI и обычным AI, бесплатную книгу по RLHF, модуль курса по анализу данных, посвященный обработке данных и отладке с использованием GenAI, мероприятие по AI-интеллекту кода, а также инфографику, объясняющую принцип работы LLM. (Источник: dair_ai, HamelHusain, omarsar0, bobvanluijt, natolambert, DeepLearningAI, l2k, Ronald_vanLoon, Reddit r/deeplearning, Reddit r/artificial)

Мероприятие и воркшоп LangChain Interrupt: LangChain провела мероприятие Interrupt, включающее воркшопы по созданию надежных AI-агентов. Содержание охватывало проектирование рабочих процессов агентов с использованием LangGraph, взаимодействие человека и машины, а также использование LangSmith для наблюдаемости и оценки. Cisco продемонстрировала своего агента для преобразования текста в SQL, созданного с использованием LangGraph и LangSmith. (Источник: LangChainAI, hwchase17)

Анонс воркшопа по RL и видеоиграм: На конференции RLC 2025 пройдет воркшоп по обучению с подкреплением и видеоиграм, принимаются статьи по игровым темам, таким как RL в сложных средах, многоагентные сценарии, генерация контента, и объявлены подтвержденные докладчики. (Источник: Reddit r/MachineLearning)

Репозиторий GitHub mlabonne/llm-course предлагает комплексный план обучения LLM: Популярный репозиторий на GitHub, mlabonne/llm-course, предлагает комплексный курс и план обучения LLM, охватывающий основы, науку LLM (дообучение, квантование, оценка) и инженерию LLM (запуск, RAG, развертывание, безопасность), а также содержит соответствующие заметки по коду и справочные материалы. (Источник: GitHub Trending)

Выпущен продвинутый ноутбук Qwen3 Base GRPO: Выпущен новый продвинутый ноутбук GRPO (Generalized Policy Optimization), специально предназначенный для модели Qwen3 Base. Содержание охватывает, как донастраивать модель для улучшения инференса, оценку близости, шаблоны GRPO, набор данных OpenR1 и оптимизацию процесса RL через предварительную донастройку. (Источник: danielhanchen)

Библиотека TRL интегрировала прием стабилизации GRPO: Новый прием стабилизации GRPO, разработанный Prime Intellect, был интегрирован в популярную библиотеку Transformer Reinforcement Learning (TRL) и доступен при установке последней версии, с целью повышения стабильности обучения GRPO. (Источник: ClementDelangue)

💼 Бизнес
Perplexity AI близок к завершению раунда финансирования на $500 млн, оценка достигла $14 млрд: Стартап в области AI-поиска Perplexity AI, как сообщается, близок к завершению раунда финансирования на $500 млн под руководством Accel, в результате чего оценка компании достигнет $14 млрд. Это демонстрирует, что, несмотря на конкуренцию со стороны Google и OpenAI, Perplexity по-прежнему получает сильную капитальную поддержку. (Источник: TheRundownAI, Reddit r/ClaudeAI, 36氪)

NVIDIA сотрудничает с Саудовской Аравией в строительстве AI-фабрики: NVIDIA объявила о сотрудничестве с HUMAIN, дочерней компанией AI Государственного инвестиционного фонда Саудовской Аравии, планируя построить «AI-фабрику» в Саудовской Аравии. NVIDIA предоставит инфраструктуру и экспертизу, чтобы помочь Саудовской Аравии стать мировым лидером в области AI. (Источник: nvidia)

Команда WizardLM покинула Microsoft и присоединилась к Tencent Hunyuan: Команда WizardLM, включая ее руководителя Can Xu, покинула Microsoft и присоединилась к Tencent Hunyuan. Ранее модель Tencent Hunyuan-Turbos занимала высокие места в рейтингах (8-е место), и этот переход кадров вызвал дискуссии о конкуренции за таланты между крупными AI-лабораториями. (Источник: andrew_n_carr, cognitivecompai, teortaxesTex, Sentdex, WizardLM_AI, madiator)

Компания Johnson & Johnson широко применяет генеративный AI в фармацевтическом бизнесе: После проведения около 900 внутренних экспериментов компания Johnson & Johnson расширила применение генеративного AI на различные этапы своего фармацевтического бизнеса, включая ускорение исследований и разработки лекарств, прогнозирование рисков цепочки поставок, оптимизацию клинических испытаний, а также поддержку продаж и услуг для сотрудников. (Источник: DeepLearningAI)

Somite AI привлекает финансирование для создания фундаментальной модели человеческих клеток: Компания Somite AI создает фундаментальную модель «DeltaStem» для человеческих клеток и разрабатывает технологию, позволяющую быстрее генерировать данные о клеточных сигналах. Компания уже получила финансирование в размере $5.9 млн. (Источник: saranormous, finbarrtimbers)
🌟 Сообщество
Пользователи недовольны снижением качества моделей AI и явлением Sycophancy: Многие пользователи выразили разочарование по поводу снижения качества текущих моделей AI, в частности, ChatGPT обвиняют в том, что он стал «льстивым» (чрезмерно позитивным/угодливым), ленивым и склонным к галлюцинациям. Некоторые пользователи в связи с этим рассматривают возможность отмены подписки, в то время как другие обсуждают, эффективны ли пользовательские инструкции или недовольство в социальных сетях преувеличено. (Источник: Reddit r/ArtificialInteligence, Reddit r/ChatGPT)

Обсуждение этики и ответственности AI: Кто несет ответственность за ошибки в решениях AI?: В сообществе широко обсуждается, кто должен нести ответственность, когда AI совершает ошибки из-за автономного принятия решений. Мнения включают: ответственность должна нести компания, владеющая AI (подобно родителям за детей или водителям за автономные автомобили), в будущем сам AI может нести ответственность, необходим человеческий надзор, и ответственность должны нести компании, получающие прибыль от AI. (Источник: Reddit r/ArtificialInteligence)
Влияние AI на образование и занятость: Использование AI учителями для оценивания вызывает споры: Дискуссия об использовании AI учителями для проверки студенческих работ вызвала споры: некоторые опасаются, что это может обесценить студентов или предвещать их потенциальную устарелость. Противоположные мнения утверждают, что AI — это всего лишь инструмент, который может предоставлять своевременную обратную связь, и что цели экзаменов разнообразны. Сообщество также обсудило более широкое влияние AI на занятость и конкретные рабочие задачи, которые пользователи хотели бы полностью передать AI. (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

Обеспокоенность надежностью LLM: Плохая производительность при работе с определенными источниками данных: Пользователи выразили разочарование по поводу LLM при обработке специфических, фрагментированных источников данных (например, юридических документов), когда выходные данные звучат авторитетно, но фактически неточны или расплывчаты. Хотя LLM хорошо справляются с общим суммированием или кодированием, их надежность ставится под сомнение для задач, требующих точной однократной обработки данных. (Источник: Reddit r/artificial)
Геополитика аппаратного обеспечения AI: Предложение сенатора США о требовании встроенного гео-трекинга в высокопроизводительные GPU: Предложение сенатора США требует встроенной функции гео-трекинга в высокопроизводительные GPU (такие как RTX 4090), чтобы предотвратить их использование иностранными правительствами. Это вызвало обеспокоенность сообщества по поводу чрезмерного вмешательства правительства, потенциальных функций удаленного отключения и аппаратного DRM. (Источник: Reddit r/LocalLLaMA)

Молодые люди используют ChatGPT для помощи в принятии жизненных решений: Sam Altman отметил, что молодое поколение все чаще использует ChatGPT для помощи в принятии жизненных решений. Некоторые считают это позитивным явлением (обращение за советом при недостатке человеческих ресурсов), но другие опасаются зависимости от потенциально ненадежных LLM при принятии важных решений. (Источник: Reddit r/ChatGPT)

Обсуждение восприятия и стратегий в индустрии AI: Обсуждения в сообществе охватывали мнения о том, почему Meta считается отстающей от других крупных AI-лабораторий, компромисс между донастройкой небольших моделей и промпт-инжинирингом, секретность AI-компаний, а также точку зрения на «поиск» как на ключевой защитный ров для AI-агентов. (Источник: Reddit r/MachineLearning, cto_junior, madiator, Dorialexander)
💡 Прочее
Китай выпустил квантовую систему управления четвертого поколения: Китай выпустил квантовую систему управления четвертого поколения, поддерживающую более 500 кубитов, что представляет собой последний прогресс в технологии квантовых вычислений. (Источник: Ronald_vanLoon)

Применение AI в обороне: Китай использует DeepSeek для разработки истребителей-невидимок: Сообщается, что Китай использует технологию DeepSeek AI для помощи в разработке своих истребителей-невидимок шестого поколения (Jian-35, Jian-50). (Источник: Ronald_vanLoon)

Выпущено вводное видео проекта METACOG-25: Проект METACOG-25 выпустил вводное видео, предвещающее новые достижения в области исследований или разработки AI. (Источник: Reddit r/deeplearning)

Обновления платформы Hugging Face: Коллекции в коллекциях и официальный аккаунт PyTorch: Hugging Face Hub запустил функцию «коллекции в коллекциях», позволяющую более детально организовывать ресурсы. Кроме того, у PyTorch теперь есть официальный аккаунт на платформе. (Источник: ClementDelangue, Reddit r/LocalLLaMA)
