Ключевые слова:OpenAI, Международная математическая олимпиада, Большая языковая модель, AI Agent, GPT-5, Гуманоидный робот, Воплощенный интеллект, Споры о золотых медалях IMO, Ограничения поиска памяти LLM, Инструмент ChatGPT Agent, Заказы на гуманоидных роботов Ubtech, Конкуренция в воплощенном интеллекте между JD и Meituan
🔥 В центре внимания
Споры вокруг золотой медали OpenAI на IMO: Объявление OpenAI о том, что их модель ИИ достигла уровня золотой медали на Международной математической олимпиаде (IMO), вызвало широкие споры. Основное внимание уделяется тому, что OpenAI не соблюдала требования IMO относительно времени публикации результатов, объявив их до церемонии закрытия, что было расценено как попытка перехватить внимание у студентов и проявление неуважения. Кроме того, тестирование OpenAI не было организовано официально IMO, а оценка не проводилась официальными судьями, что ставит под сомнение ценность «золотой медали». Этот инцидент вызвал дискуссию о правилах соревнований ИИ, стандартах оценки и справедливости соревнований между ИИ и людьми. (Источник: 36氪, 36氪, 36氪, 36氪)
Ограничения поиска в памяти больших моделей: Исследование Университета Вирджинии и Нью-Йоркского университета выявило феномен «проактивного вмешательства» в поиске по памяти у больших языковых моделей (LLM), когда старая информация мешает вспоминанию новой, что приводит к снижению точности. Даже в простых задачах поиска точность модели значительно снижается с увеличением количества мешающих элементов, в конечном итоге приближаясь к нулю. Исследователи попытались использовать prompting engineering, но эффект был ограничен, что указывает на наличие у LLM узкого места, подобного рабочей памяти человека, и требует новых методов для повышения их устойчивости к помехам. (Источник: 36氪)
Проблема уверенности больших моделей: Исследование Google DeepMind и Лондонского университета показало, что LLM при столкновении с сомнениями склонны отказываться от правильных ответов, демонстрируя «неуверенность». Даже если возражения неверны, модель может изменить свой ответ из-за чрезмерной чувствительности. Исследование предполагает, что это связано с чрезмерным учетом внешних данных в процессе обучения с подкреплением, опорой на сопоставление с образцом, а не на логические рассуждения, а также с ограничениями механизма памяти, что может привести к отклонению модели от правильного вывода в многоэтапных диалогах. (Источник: 36氪)
🎯 Тенденции
OpenAI готовится к выпуску GPT-5: Многочисленные источники сообщают, что OpenAI выпустит GPT-5 в течение двух недель. Предположительно, это будет система, состоящая из нескольких моделей, включающая маршрутизатор для переключения между ними. Кроме того, возможно, уже началось обучение GPT-6. OpenAI планирует добавить более миллиона GPU к концу года для обеспечения вычислительной мощности новых моделей. (Источник: 36氪)
Быстрое развитие AI Agent: Gartner прогнозирует, что к 2028 году 33% корпоративного программного обеспечения будет включать AI Agent, а 15% повседневной работы будет выполняться агентами автономно. AI Agent переходят от начальной стадии к зрелости, и их быстрое развитие будет обусловлено улучшением мультимодальных рассуждений, генерации видео и способности выполнять сложные задачи. (Источник: 36氪, 36氪)
🧰 Инструменты
ChatGPT Agent: OpenAI выпустила ChatGPT Agent, который может автоматически планировать шаги выполнения в соответствии с инструкциями пользователя и использовать различные инструменты для выполнения сложных задач. Эта модель, обученная методом end-to-end, демонстрирует мощные возможности в планировании задач, вызове различных инструментов и генерации документов, но также имеет проблемы с неполным выполнением задач и низкой скоростью. (Источник: 36氪, 36氪)
💼 Бизнес
OpenAI сталкивается с коммерческими вызовами: JPMorgan опубликовал подробный отчет об OpenAI, в котором указывается, что конкурентное преимущество компании в области инноваций моделей становится уязвимым, а тенденция к коммодитизации моделей неизбежна. OpenAI делает ставку на стратегии, связанные с AI-агентами, аппаратным обеспечением и диверсификацией доходов, чтобы справиться с этими вызовами. (Источник: 36氪)
Рекордный объем заказов на человекоподобных роботов UBTECH: UBTECH выиграла тендер на поставку робототехнического оборудования компании MIYI Auto на сумму 90,51 млн юаней, что стало рекордом для мировой индустрии человекоподобных роботов по объему одной сделки. UBTECH планирует произвести около 1000 человекоподобных роботов в этом году и прогнозирует поставки в несколько тысяч единиц в 2026 году и десятки тысяч в 2027 году. (Источник: 36氪)
Meta вкладывает огромные средства в привлечение специалистов по ИИ: Meta тратит огромные средства на привлечение специалистов по ИИ, формируя «лабораторию сверхинтеллекта», 50% исследователей которой из Китая. Чтобы привлечь таланты, Meta предлагает высокие зарплаты и достаточные вычислительные ресурсы, стремясь к прорыву в области общего искусственного интеллекта (AGI). (Источник: 36氪, 36氪)
🌟 Сообщество
Влияние ИИ на работу: В социальных сетях продолжается активное обсуждение темы замещения рабочих мест искусственным интеллектом. Некоторые опасаются массовой безработицы из-за ИИ, другие считают, что ИИ создаст новые рабочие места и повысит производительность труда. Эксперты отмечают, что в настоящее время ИИ в основном заменяет повторяющийся труд, а человеческое творчество и способность к суждению по-прежнему важны. (Источник: Многочисленные обсуждения в социальных сетях)
Этические проблемы ИИ: Обсуждение этических проблем ИИ продолжает набирать обороты. Люди обеспокоены безопасностью ИИ, защитой конфиденциальности и потенциальными рисками злоупотребления. Эксперты призывают к усилению регулирования ИИ, чтобы гарантировать, что технологии ИИ принесут пользу человечеству. (Источник: Многочисленные обсуждения в социальных сетях)
Отношения между ИИ и людьми: У людей разные взгляды на будущее направление развития отношений между ИИ и людьми. Некоторые считают, что ИИ в конечном итоге превзойдет человеческий интеллект, другие считают, что ИИ — это всего лишь инструмент, и люди всегда будут иметь над ним контроль. (Источник: Многочисленные обсуждения в социальных сетях)
Применение инструментов программирования на основе ИИ: Сообщество разработчиков активно делится опытом и обсуждает применение инструментов программирования на основе ИИ. Некоторые разработчики считают, что инструменты программирования на основе ИИ значительно повышают эффективность разработки, но другие отмечают, что качество генерируемого ИИ кода все еще нуждается в улучшении. (Источник: Многочисленные обсуждения в социальных сетях)
💡 Другое
Рост рынка игрушек-компаньонов с ИИ: Рынок игрушек-компаньонов с ИИ быстро растет, но продукты очень похожи друг на друга, и нет настоящих хитов продаж. Будущее направление развития заключается в повышении дифференциации продуктов и улучшении эмоционального интерактивного опыта, а также в уделении внимания этическим проблемам, таким как эмоциональная замена. (Источник: 36氪)
JD.com и Meituan конкурируют в области embodied AI: JD.com и Meituan инвестируют в несколько компаний, занимающихся embodied AI, конкурируя в этой области. JD.com создала специальный отдел embodied AI и запустила платформу JoyInside, сотрудничая с производителями робототехнического оборудования для создания «мозга ИИ». Meituan инвестировала в такие компании, как XYZ Robotics, Star Atlas, Unitree Robotics и другие, развивая «воплощенный мозг» и самих роботов. (Источник: 36氪)
Midea создает интеллектуальный кампус: Midea потратила 7 млрд юаней на создание глобального инновационного кампуса в Шанхае. В кампусе используется платформа цифровизации iBUILDING, которая обеспечивает взаимодействие оборудования, оптимизацию энергоэффективности и интеллектуальное управление, демонстрируя интеграционные возможности Midea в области технологий для зданий. (Источник: 36氪)