Ключевые слова:Модель ИИ, IMO 2025, Hugging Face, Четвероногий робот, Компьютерная графика, OpenAI API, xAI Grok 4, Mistral AI, Производительность Claude Sonnet 4, Transformers OpenAI совместимый API, Исследования робототехники ETH Zurich, NVIDIA SIGGRAPH 2025, Улучшения OpenAI API для генерации изображений
🔥 В центре внимания
Результаты конкурса IMO 2025: ИИ-модели показали низкие результаты: На Международной математической олимпиаде IMO 2025, проходившей в Австралии, приняли участие несколько ИИ-моделей, но их результаты оказались неудовлетворительными. Claude Sonnet 4, Gemini 2.5 Pro и ByteDance Seed 1.6 решили только 2 из 6 задач, причем Seed 1.6 и Gemini 2.5 Pro дали полное решение только для одной задачи. Примечательно, что Seed 1.6 использовал относительно устаревший метод рассуждений. Другие модели, такие как R1 и K2, не решили ни одной задачи. Это отражает текущие ограничения ИИ-моделей в решении сложных математических задач. (Источник: teortaxesTex)
Hugging Face интегрирует OpenAI-совместимый API в Transformers: Hugging Face объявила о встроенной поддержке HTTP-сервера, совместимого со спецификацией OpenAI, как для визуально-языковых моделей (VLM), так и для больших языковых моделей (LLM). Пользователи могут запустить сервер с помощью команды transformers serve
и подключиться к своим привычным приложениям. Это означает, что разработчики могут легче интегрировать модели Hugging Face в свои проекты и взаимодействовать с ними через OpenAI-совместимый API, что будет способствовать дальнейшему распространению и применению моделей ИИ с открытым исходным кодом. (Источник: ClementDelangue)
ETH Zurich исследует новые достижения в области четвероногих роботов: Исследование ETH Zurich посвящено последним достижениям в области четвероногих роботов, фокусируясь на таких областях, как #Robots #ArtificialIntelligence #MachineLearning #Robotics. Это исследование может оказать существенное влияние на развитие робототехники и продвинуть применение искусственного интеллекта в этой сфере. (Источник: Ronald_vanLoon)
Руководитель исследований NVIDIA AI обсуждает будущее компьютерной графики: Ming-Yu Liu и Sanja Fidler, руководители исследований NVIDIA AI, обсудили будущее компьютерной графики в эпоху ИИ на SIGGRAPH 2025. Они раскрыли следующие передовые области компьютерной графики и физического ИИ, охватывающие прорывные достижения от синтетических данных до более интеллектуального создания контента, которые переопределят такие области, как дизайн, робототехника и автомобилестроение. (Источник: nvidia)
🎯 Тенденции
OpenAI представляет улучшенный API для генерации изображений: OpenAI улучшила свой API для генерации изображений, который теперь позволяет редактировать изображения с более высокой точностью и лучше сохранять лица, логотипы и мелкие детали. Это упростит пользователям редактирование определенных объектов, создание маркетинговых материалов с логотипами, а также настройку выражения лица, позы и одежды персонажей. (Источник: stevenheidel)
xAI тратит огромные средства на обучение с подкреплением для Grok 4: Сообщается, что xAI потратила на обучение с подкреплением для Grok 4 в 10 раз больше ресурсов, чем для Grok 3. Это говорит о том, что xAI стремится улучшить производительность и возможности модели Grok с помощью обучения с подкреплением, что может привести к появлению более интеллектуальных и мощных ИИ-помощников. (Источник: steph_palazzolo)
Mistral AI выпускает модель распознавания речи с открытым исходным кодом: Mistral AI выпустила, как утверждается, лучшую в мире модель распознавания речи с открытым исходным кодом. Это будет способствовать развитию технологий распознавания речи и предоставит разработчикам более качественные инструменты с открытым исходным кодом. (Источник: dchaplot)
🧰 Инструменты
All Hands AI выпускает Kimi K2, конкурента Claude Sonnet: All Hands AI выпустила Kimi K2, мощную модель с открытым исходным кодом, которая считается серьезным конкурентом Claude Sonnet. В тесте OpenHands SWE-Bench Verified Kimi K2 набрал 65,4%, что всего на 2,6 процентных пункта ниже, чем у Claude Sonnet 4. При этом стоимость API Kimi K2 в 4 раза дешевле, чем у Claude Sonnet 4. Это предоставляет разработчикам более экономичный и высокопроизводительный вариант модели с открытым исходным кодом. (Источник: teortaxesTex, ClementDelangue, Kimi_Moonshot)
LangChain открывает исходный код Open Deep Research Agent: LangChain открыла исходный код Open Deep Research Agent, мощного агента, построенного на основе LangGraph, для глубоких исследований. Он использует контролируемую архитектуру для координации исследовательских субагентов, поддерживает пользовательские LLM, инструменты и MCP-серверы, а также способен генерировать высококачественные исследовательские отчеты. Это предоставит исследователям и разработчикам мощный инструмент для проведения углубленных исследований и анализа информации. (Источник: LangChainAI, hwchase17)
Perplexity представляет AI-браузер Comet: Perplexity представила AI-браузер Comet, который может предоставлять контекстные данные непосредственно на странице в ответ на запросы пользователей и вставлять их во вкладки, упрощая рабочий процесс. Это предоставляет пользователям новый способ поиска и взаимодействия с информацией и может изменить будущие модели поиска. (Источник: TheRundownAI, AravSrinivas, perplexity_ai)
📚 Обучение
DeepLearning.AI запускает курс по RAG: DeepLearning.AI и Together AI совместно запустили курс по Retrieval Augmented Generation (RAG), который ведут Zain Hasan и Andrew Ng. Курс подробно расскажет о построении RAG-систем, охватывая такие темы, как системы поиска, гибридный поиск, LLM, оценка, наблюдаемость, и предоставит практические примеры, помогая слушателям создавать высокопроизводительные RAG-системы, готовые к промышленному применению. (Источник: DeepLearningAI)
LlamaIndex делится опытом построения производственных RAG-систем: LlamaIndex поделился опытом построения производственных RAG-систем, включая стратегии извлечения текста, методы интеллектуального разбиения на блоки, технологии гибридного поиска и методы оптимизации производительности. Этот опыт основан на тестировании в реальных производственных средах и предоставляет примеры кода и фреймворки для оценки, что имеет практическую ценность для построения высокопроизводительных RAG-систем. (Источник: jerryjliu0)
🌟 Сообщество
Обсуждение кодирования с помощью ИИ: В социальных сетях развернулась оживленная дискуссия о кодировании с помощью ИИ. Одни считают, что инструменты кодирования на основе ИИ очень мощные и могут значительно повысить эффективность программирования; другие указывают на то, что сгенерированный ИИ код содержит много ошибок, качество кода низкое и даже хуже, чем написанный вручную. Это отражает сложное отношение разработчиков к инструментам кодирования на основе ИИ, а также разные взгляды на будущее развитие кодирования с помощью ИИ. (Источник: dotey)
Опасения по поводу размера моделей ИИ: В социальных сетях выражают обеспокоенность быстрым ростом размера моделей ИИ и отмечают, что некоторые призывали ограничить размер моделей ИИ, считая, что большие модели могут представлять угрозу для человечества. Однако реальность такова, что уже существует несколько моделей, превышающих эти ограничения, что вызывает дискуссии о безопасности и регулировании ИИ. (Источник: jeremyphoward)
Обсуждение текучести кадров в сфере ИИ: В социальных сетях обсуждается текучесть кадров в сфере ИИ между различными компаниями. Некоторые считают, что это может привести к утечке “секретного оружия” компаний и ослабить их конкурентные преимущества. (Источник: rao2z)
💼 Бизнес
Thinking Machines Lab завершила посевной раунд финансирования в размере $2 млрд с оценкой в $12 млрд: Thinking Machines Lab, основанная бывшим техническим директором OpenAI Мирой Мурати, завершила посевной раунд финансирования в размере $2 млрд, в результате чего оценка компании достигла $12 млрд. Компания планирует выпустить свой первый продукт в ближайшие месяцы и открыть исходный код некоторых компонентов. (Источник: yoheinakajima, TheTuringPost)
Anthropic приобретает двух ключевых участников Claude Code: Anthropic приобрела двух ключевых участников Claude Code, Бориса Черни и Кэт Ву, которые всего две недели назад присоединились к Cursor. Это подчеркивает ожесточенную конкуренцию за таланты в сфере ИИ, а также то значение, которое Anthropic придает продукту Claude Code. (Источник: HamelHusain)
Wix приобретает компанию по кодированию Base44: Израильский гигант облачных вычислений Wix приобрел компанию по кодированию Base44 за $80 млн. Base44 — это стартап, основанный всего полгода назад, с 6 сотрудниками, который еще не получил никакого финансирования, но уже вышел на прибыльность. Это отражает ажиотаж в области кодирования с помощью ИИ, а также интерес Wix к технологиям ИИ. (Источник: code_star)
💡 Другое
Проблемы с субтитрами в видеогенеративной модели Google Veo 3: Видеогенеративная модель Google Veo 3 столкнулась с проблемой субтитров: даже если в запросе явно указано не добавлять субтитры, сгенерированное видео часто содержит субтитры с искаженным текстом. Это отражает ограничения обучающих данных ИИ-моделей, а также сложность исправления проблем в ИИ-моделях. (Источник: MIT Technology Review)
Американский профсоюз учителей сотрудничает с гигантами ИИ, чтобы внедрить ИИ в классы K-12: Американский профсоюз учителей сотрудничает с OpenAI, Microsoft и Anthropic, чтобы внедрить ИИ в классы K-12. Проект направлен на обучение учителей использованию ИИ для преподавания, подготовки к урокам и написания отчетов, но также вызывает дискуссии о роли ИИ в образовании и этических проблемах. (Источник: MIT Technology Review)
Технология “машинного разучивания” может быть использована для предотвращения дипфейков речи: Новая технология под названием “машинное разучивание” может быть использована для обучения ИИ-моделей забывать определенные голоса, что может помочь предотвратить злоупотребление дипфейками речи. (Источник: MIT Technology Review)