Ключевые слова:OpenAI, Крупная языковая модель, Международная математическая олимпиада, ИИ-рассуждение, GPT-5, Команда суперинтеллекта Meta, Контекстная инженерия, Экспериментальная рассуждающая LLM OpenAI, ИИ уровня золотой медали IMO, План выпуска GPT-5, Состав команды суперинтеллекта Meta, Контекстная инженерия для ИИ-агентов
🔥 В центре внимания
Экспериментальная LLM от OpenAI достигла уровня золотой медали на Международной математической олимпиаде: Новейшая экспериментальная рассуждающая большая языковая модель (LLM) от OpenAI достигла уровня золотой медали на Международной математической олимпиаде (IMO) 2025 года. Модель выполнила задания в том же временном лимите, что и участники-люди, не используя никаких инструментов и записывая доказательства на естественном языке, что знаменует собой значительный прорыв в области математических рассуждений ИИ. Хотя модель является экспериментальной, и OpenAI заявила, что не будет сразу выпускать модели с такими же возможностями, это достижение предвещает огромный потенциал ИИ в решении сложных задач и продвижении научных исследований. (Источник: jonst0kes, jachiam0, jachiam0, saranormous, madiator, kevinweil, mckbrando, snsf, rbhar90, itsclivetime, LearnOpenCV, ShunyuYao12, kellerjordan0, polynoamial, dmdohan, jachiam0)
Раскрыт состав команды Meta Superintelligence: Команда Meta Superintelligence состоит из 44 человек, 50% из которых из Китая, 75% имеют докторскую степень, а 70% являются исследователями. Состав команды разнообразен: 40% сотрудников пришли из OpenAI, 20% из DeepMind и 15% из Scale AI. Сосредоточение таких высококвалифицированных специалистов демонстрирует огромные ресурсы и амбиции Meta в области ИИ, а также вызывает дискуссии о текучести кадров и конкуренции. (Источник: scaling01, dotey)
🎯 Тенденции
OpenAI готовится к выпуску GPT-5: OpenAI объявила о скором выпуске GPT-5, однако модель, использованная на IMO, является отдельной экспериментальной моделью, в которой применяются новые исследовательские технологии, которые появятся в будущих моделях. OpenAI заявила, что, хотя пользователям понравится GPT-5, модели с возможностями уровня золотой медали IMO не будут выпущены в течение нескольких месяцев. (Источник: jachiam0, multimodalart)
SmoLLM3 появился на Azure AI: SmoLLM3, самая современная модель с 3 миллиардами параметров, теперь доступна на платформе Azure AI. Это свидетельствует о том, что Microsoft продолжает развивать направление малых и эффективных моделей и тесно сотрудничает с такими компаниями, как Hugging Face. (Источник: _lewtun)
Hugging Face Inference Provider совместим с клиентом OpenAI: Hugging Face Inference Provider теперь может беспрепятственно работать с клиентом OpenAI. Пользователи могут использовать его, просто добавив имя провайдера в ID модели, например, “moonshotai/Kimi-K2-Instruct:groq”. (Источник: algo_diver)
Контекстная инженерия становится ключевой технологией для ИИ-агентов: Соучредитель Manus, Ji Yichao, опубликовал статью, в которой обсуждается контекстная инженерия для ИИ-агентов, подчеркивая важность контекстной инженерии, а не сквозной разработки больших моделей, и делится уроками, извлеченными при создании Manus, включая такие ключевые технологии, как коэффициент попадания в кэш KV, управление инструментами и файловая система в качестве бесконечного контекста. В статье отмечается, что контекстная инженерия — это новая экспериментальная наука, целью которой является формирование поведения и возможностей агента посредством контекста, а не просто соревнование в уровне интеллекта модели. (Источник: 36氪)
Выпущена модель генерации видео на основе ИИ MirageLSD: Израильский ИИ-стартап Decart представил первую модель диффузионного ИИ-видео для прямой трансляции MirageLSD, способную преобразовывать бесконечные видеопотоки в режиме реального времени с временем отклика менее 40 миллисекунд, что может изменить игры, прямые трансляции, видеозвонки и другие области. (Источник: 36氪)
Чип Tesla Dojo 2 скоро поступит в массовое производство: Чип Tesla Dojo второго поколения скоро поступит в массовое производство. Его производительность в 10 раз выше, чем у первого поколения, а вычислительная мощность приближается к чипу Nvidia Blackwell B200. Это ускорит обучение Tesla FSD и, возможно, позволит Tesla стать поставщиком вычислительных мощностей. (Источник: 量子位)
🧰 Инструменты
Cleanlab Trust Scoring: Система оценки доверия Cleanlab предотвращает галлюцинации ИИ в службе поддержки клиентов, легко интегрируется с LangGraph, обнаруживает и блокирует ответы на вопросы, прежде чем они дойдут до пользователя. (Источник: LangChainAI, hwchase17, Hacubu)
📚 Обучение
Руководство по началу работы с ИИ: TuringPost поделился 6 основными концепциями для освоения ИИ: вычисления и масштабирование во время тестирования, вывод ИИ, RLHF и его варианты (DPO, RRHF, RLAIF), метаобучение, причинно-следственный ИИ и защитный ИИ, а также предоставил соответствующие руководства по обучению. (Источник: TheTuringPost, TheTuringPost)
Книги по теории алгоритмов и основным алгоритмам машинного обучения: Три бесплатные книги от MIT Press, охватывающие оптимизацию, принятие решений и проверку алгоритмов, подходят для углубленного изучения теории алгоритмов и основных алгоритмов машинного обучения. (Источник: TheTuringPost)
Исследование контекстной инженерии: Исследование контекстной инженерии объемом более 160 страниц, охватывающее важнейшие исследования в области контекстной инженерии для LLM. (Источник: omarsar0)
🌟 Сообщество
Обсуждение достоверности и надежности диалогов с ИИ: В социальных сетях обсуждалась достоверность и надежность диалогов с ИИ, отмечая, что, несмотря на значительный прогресс ИИ в некоторых областях, таких как математические рассуждения, в других областях, таких как понимание вымышленных произведений или обработка сложных многоступенчатых задач, все еще существуют ограничения. (Источник: Различные источники)
Обсуждение потенциала ИИ-агентов: Ведется обсуждение потенциала ИИ-агентов. Некоторые считают, что ИИ-агенты коренным образом изменят способы работы и образ жизни, другие же выражают сомнения в надежности и практичности ИИ-агентов и считают, что текущая реклама содержит элемент чрезмерного ажиотажа. (Источник: Различные источники)
Обсуждение этических вопросов ИИ: Обсуждение этических вопросов ИИ, таких как риск психологической зависимости от ИИ-компаньонов, этические границы контента, генерируемого ИИ, и потенциальное негативное влияние применения ИИ в обществе. (Источник: Различные источники)
💡 Другое
Yunpeng Technology выпустила новые продукты в области ИИ+здоровье: Yunpeng Technology выпустила новые продукты в сотрудничестве с Shuaikang и Skyworth, включая «Цифровую лабораторию будущей кухни» и интеллектуальный холодильник с большой языковой моделью для здоровья на базе ИИ, что знаменует собой прорыв ИИ в области здравоохранения. (Источник: 36氪)
Компания xAI Илона Маска представила функцию ИИ-компаньона: Компания xAI Илона Маска представила новую функцию под названием «Режим компаньона», которая позволяет пользователям за 30 долларов в месяц взаимодействовать с виртуальным ИИ-персонажем, что вызвало обсуждение риска психологической зависимости от ИИ-компаньонов и этических границ. (Источник: 36氪)
Текущее состояние рынка обучающих устройств с ИИ: Рынок обучающих устройств с ИИ переживает бум, функции продуктов разных брендов становятся все более схожими, образовательные и технологические компании идут по разным путям развития, а родители становятся более рациональными, обращая внимание на практичность и долгосрочную ценность продуктов. (Источник: 36氪)