Ключевые слова:NVIDIA, AI фабрика, AI инфраструктура, OpenAI, GPT дверь, Siri, AI облачный рынок, Трансформация производственных мощностей NVIDIA в сфере ИИ, Споры о смене моделей OpenAI, Обновление ИИ для Apple Siri, Конкуренция на китайском рынке облачных ИИ, Борьба за таланты в сфере ИИ
🔥 В ЦЕНТРЕ ВНИМАНИЯ
NVIDIA меняет индустрию ИИ: от продажи чипов к “продаже мощностей ИИ” : Генеральный директор NVIDIA Хуан Жэньсюнь (Jensen Huang) в недавнем интервью отметил, что эпоха универсальных вычислений закончилась, а спрос на ИИ переживает двойной экспоненциальный рост, при этом спрос на инференс, как ожидается, увеличится в 1 миллиард раз. NVIDIA трансформируется из поставщика чипов в “партнера по инфраструктуре ИИ”, сотрудничая с такими компаниями, как OpenAI, для строительства “фабрик ИИ” мощностью 10 ГВт, предлагая “максимально скоординированный дизайн” от чипов до программного обеспечения, систем и сетей для достижения максимальной производительности на единицу энергопотребления. Он подчеркнул, что эта возможность полностековой оптимизации является основным конкурентным барьером, позволяющим NVIDIA доминировать в промышленной революции ИИ и потенциально расширить рынок инфраструктуры ИИ с 400 миллиардов долларов до триллиона долларов. (Источник: 36氪, 36氪, Reddit r/artificial)

Скандал “GPT-гейт” в OpenAI: тайное снижение производительности и переключение моделей для платных пользователей : OpenAI обвиняется в тайной маршрутизации диалогов пользователей к неопубликованным “безопасным” моделям (gpt-5-chat-safety и 5-a-t-mini), особенно при обнаружении эмоционального или чувствительного контента. Это действие, подтвержденное главным инженером AIPRM и вызвавшее широкую обратную связь от пользователей, привело к снижению производительности модели, а также к переключению моделей без ведома или согласия пользователей. Хотя вице-президент OpenAI назвал это временным тестированием безопасности, этот шаг вызвал серьезные вопросы о прозрачности, автономии пользователей и потенциальном мошенничестве, что привело к массовой отмене подписок и призывам к разработке “прав пользователей ИИ”. (Источник: 36氪, 36氪, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT)

Apple делает ставку на возрождение Siri в 2026 году: ИИ системного уровня и интеграция сторонних моделей : Apple полностью перерабатывает Siri с помощью внутренних приложений, подобных ChatGPT, “Veritas” и систем “Linwood”, стремясь к контекстно-зависимым диалогам и глубокому взаимодействию с приложениями. Код бета-версии iOS 26.1 показывает, что Apple внедряет поддержку MCP (Model Context Protocol) для App Intents, что позволит совместимым AI-моделям, таким как ChatGPT и Claude, напрямую взаимодействовать с приложениями Mac, iPhone и iPad. Этот шаг знаменует переход Apple от “полностековой собственной разработки” к “платформенному подходу”, ускоряя развитие своей экосистемы ИИ за счет интеграции сторонних моделей, обеспечивая при этом конфиденциальность и единообразный пользовательский опыт. Ожидается, что новая версия Siri появится в начале 2026 года. (Источник: 36氪, 36氪)

Прогноз Хинтона не сбылся: ИИ не заменил радиологов, а сделал их более занятыми : В 2016 году отец ИИ Джеффри Хинтон предсказал, что ИИ заменит радиологов в течение пяти лет, и рекомендовал прекратить их обучение. Однако почти десять лет спустя количество радиологов в США и их средняя годовая зарплата (до 520 000 долларов) достигли исторического максимума. Снижение производительности ИИ в реальных клинических условиях, сопротивление со стороны правового регулирования и тот факт, что ИИ охватывает лишь небольшую часть работы врача, являются основными причинами. Это демонстрирует “парадокс Джевонса”: повышение эффективности интерпретации изображений с помощью ИИ увеличило потребность врачей в надзоре, общении и недиагностических задачах, что привело к увеличению их рабочей нагрузки, а не к их замене. (Источник: 36氪)

🎯 ТЕНДЕНЦИИ
DeepMind Veo 3 представляет концепцию “цепочки кадров”, способствуя универсальному визуальному пониманию видеомоделей : Видеомодель DeepMind Veo 3 представила концепцию “цепочки кадров” (CoF), аналогичную “цепочке мыслей” (CoT) больших языковых моделей, что позволяет ей выполнять визуальный инференс с нулевым количеством примеров. Veo 3 демонстрирует мощные способности к восприятию, моделированию и манипулированию визуальным миром, и, как ожидается, станет “универсальной базовой моделью” в области машинного зрения. Исследования предсказывают, что с быстрым ростом возможностей моделей и снижением затрат, в области видеомоделей “универсалы заменят специалистов”, что предвещает новую фазу быстрого развития генерации и понимания видео. (Источник: 36氪, shlomifruchter, scaling01, Reddit r/artificial)

ChatGPT Pulse запущен: ИИ переходит от пассивных вопросов и ответов к активному обслуживанию : OpenAI запустила функцию “Pulse” для пользователей ChatGPT Pro, что знаменует эволюцию ChatGPT от инструмента пассивных вопросов и ответов к личному помощнику, активно предсказывающему потребности пользователя. Pulse, посредством “асинхронных исследований” каждую ночь, объединяет историю чатов пользователя, память и внешние приложения (такие как Gmail, Google Calendar), чтобы утром отправлять персонализированный “ежедневный дайджест”. Это представляет собой важный шаг OpenAI в области “интеллектуального агента ИИ”, направленный на то, чтобы AI-помощники понимали цели пользователя и активно предоставляли услуги без подсказок, открывая новую парадигму человеко-машинного взаимодействия. (Источник: 36kr)

Отец обучения с подкреплением Саттон: большие языковые модели — неправильная отправная точка : Отец обучения с подкреплением Ричард Саттон в интервью заявил, что большие языковые модели (LLM) являются неправильной отправной точкой на пути к истинному интеллекту. Он считает, что истинный интеллект проистекает из “обучения на основе опыта”, то есть постоянного корректирования поведения посредством действий, наблюдений и обратной связи для достижения целей, в то время как предсказательные способности LLM являются лишь имитацией человеческого поведения, лишенной независимых целей и способности “удивляться” изменениям во внешнем мире. Эта точка зрения вызвала глубокие дебаты о пути развития AGI (общего искусственного интеллекта), ставя под сомнение текущую парадигму ИИ, доминирующую LLM. (Источник: 36kr, paul_cal, algo_diver, scaling01, rao2z, bookwormengr, BlackHC, rao2z)

Конкуренция на китайском рынке AI-облаков накаляется: Alibaba Cloud лидирует, Volcano Engine быстро догоняет : В 2025 году конкуренция на китайском рынке “облаков ИИ” будет ожесточенной. Alibaba Cloud сохраняет лидерство по общему объему выручки, охватывая AI IaaS, PaaS, MaaS. Однако Volcano Engine, дочерняя компания ByteDance, доминирует на рынке вызовов токенов MaaS (Model-as-a-Service), занимая почти половину рынка и становясь крупнейшим конкурентом Alibaba Cloud с поразительными темпами роста. Baidu AI Cloud делит первое место с Alibaba Cloud на рынке публичных облачных сервисов ИИ (программные продукты и решения). Рынок демонстрирует многомерную конкуренцию, а объем вызовов токенов растет экспоненциально, что предвещает огромный потенциал роста и переформатирование будущего рынка AI-облаков. (Источник: 36氪)

Борьба за AI-таланты обостряется: высокие зарплаты и проблемы с визами H-1B : Рынок талантов в области ИИ продолжает оставаться горячим. Xpeng Motors объявила о наборе более 3000 выпускников в 2026 году с максимальной годовой зарплатой до 1,6 миллиона юаней, без верхнего предела для выдающихся кандидатов. Meta предлагает астрономические компенсации в размере более 200 миллионов долларов для привлечения ведущих AI-талантов, а NVIDIA и OpenAI также борются за таланты путем приобретений и опционов на акции. Однако ужесточение визовой политики H-1B в США (например, введение дополнительной платы в 100 000 долларов) создает проблемы для высококвалифицированных иностранных специалистов, желающих остаться в Кремниевой долине, вызывая опасения у технологических гигантов по поводу утечки мозгов и подчеркивая ожесточенность и сложность глобальной конкуренции за AI-таланты. (Источник: 36kr, 36kr)

🧰 ИНСТРУМЕНТЫ
Zhipu AI GLM-4.5-Air: высокоэффективная модель для вызова инструментов : Модель Zhipu AI GLM-4.5-Air (106B параметров, 12B активных параметров) демонстрирует выдающуюся производительность в вызове инструментов, приближаясь к уровню Claude 4, но при этом снижая затраты на 90%. Эта модель значительно уменьшает галлюцинации на этапе инференса, повышая надежность вызова инструментов и делая рабочие процессы глубоких исследований более стабильными и эффективными, предоставляя разработчикам высокоэффективное LLM-решение. (Источник: bookwormengr)

KAT-Dev-32B: модель с 32B параметрами, разработанная специально для задач программной инженерии : KAT-Dev-32B — это модель с 32B параметрами, ориентированная на задачи программной инженерии. Она достигла 62,4% успешных решений в бенчмарке SWE-Bench Verified, заняв пятое место по производительности среди моделей с открытым исходным кодом различных размеров, что демонстрирует значительный прогресс LLM с открытым исходным кодом в генерации кода, отладке и рабочих процессах разработки. (Источник: _akhaliq)

GPT-5: выдающийся координатор мультиагентных систем : GPT-5 считается отличным координатором мультиагентных систем, особенно подходящим для областей, выходящих за рамки кодирования, таких как поддержка клиентов. Он способен глубоко понимать намерения, эффективно обрабатывать большие объемы данных и заполнять информационные пробелы, что делает его выдающимся в управлении сложными многопоисковыми системами. По сравнению с Claude 4 (из-за стоимости) и Gemini 2.5 Pro, GPT-5 (включая GPT-5-mini) превосходит их по согласованности и точности вызова инструментов, обеспечивая мощную поддержку для разработки передовых интеллектуальных агентных систем. (Источник: omarsar0)

Tencent HunyuanImage 3.0: новый эталон для моделей преобразования текста в изображение с открытым исходным кодом : Команда Tencent Hunyuan выпустила HunyuanImage 3.0, модель преобразования текста в изображение с открытым исходным кодом, насчитывающую более 80 миллиардов параметров, с 13 миллиардами активных параметров во время инференса. Модель использует архитектуру Transfusion-based MoE, глубоко интегрируя обучение Diffusion и LLM, что позволяет ей обладать мощными возможностями рассуждения о мировых знаниях, понимания сложных подсказок длиной в тысячи символов и точной генерации текста внутри изображений. HunyuanImage 3.0 призвана революционизировать процессы графического дизайна и создания контента, а в будущем планируется поддержка преобразования изображения в изображение, редактирования изображений и других мультимодальных взаимодействий. (Источник: nrehiew_, jpt401)
Фреймворк DRAG: улучшение понимания лексического разнообразия моделями RAG : ACL 2025 предложил фреймворк Lexical Diversity-aware RAG (DRAG), который впервые вводит “лексическое разнообразие” в процессы извлечения и генерации RAG. DRAG разделяет семантику запроса на инвариантные, переменные и дополнительные компоненты и использует дифференцированные стратегии для оценки релевантности и калибровки разреженности рисков. Этот метод значительно повысил точность RAG (например, на 10,6% на HotpotQA), обновив несколько бенчмарков SOTA, и имеет важное значение для систем извлечения информации и вопросов и ответов, позволяя им более точно понимать сложный человеческий язык. (Источник: 量子位)

Tencent Hunyuan3D-Part: первая в отрасли модель для генерации высококачественных нативных 3D-компонентов : Команда Tencent Hunyuan3D представила Hunyuan3D-Part, первую в отрасли модель, способную генерировать высококачественные, семантически разложимые 3D-компоненты. Эта модель, используя нативную 3D-модель сегментации P3-SAM и промышленную модель генерации компонентов X-Part, обеспечивает высокоточное, структурно согласованное создание 3D-деталей. Этот прорыв имеет большое значение для конвейеров производства видеоигр и индустрии 3D-печати, позволяя разбивать сложные геометрические объекты на простые компоненты, значительно снижая сложность последующей обработки и поддерживая модульную сборку. (Источник: 量子位)

TinyWorlds: 3 миллиона параметров воспроизводят модель мира DeepMind, создавая интерактивные пиксельные игры в реальном времени : Блогер X anandmaj за один месяц воспроизвел основные идеи DeepMind Genie 3, разработав TinyWorlds. Эта модель мира, насчитывающая всего 3 миллиона параметров, способна в реальном времени генерировать игровые среды в пиксельном стиле, такие как Pong, Sonic, Zelda и Doom. Она захватывает видеоинформацию с помощью пространственно-временных трансформеров и видео-токенизаторов, создавая интерактивные пиксельные миры, демонстрируя огромный потенциал небольших моделей в области генерации мира в реальном времени и поддерживая открытый исходный код. (Источник: 36氪)

OpenWebUI нативно поддерживает MCP: новая парадигма интеграции инструментов LLM : Последнее обновление OpenWebUI нативно поддерживает серверы Model Context Protocol (MCP), и теперь пользователи могут интегрировать внешние инструменты, такие как HuggingFace MCP. Эта функция стандартизирует способ подключения LLM к внешним источникам данных и инструментам, расширяя экосистему AI-приложений и позволяя пользователям более гибко и эффективно использовать различные AI-инструменты в интерфейсе OpenWebUI. (Источник: Reddit r/LocalLLaMA, Reddit r/OpenWebUI)

LangChain и Oxylabs сотрудничают: создание AI-управляемых решений для веб-скрапинга : LangChain и Oxylabs опубликовали руководство, демонстрирующее, как объединить интеллект LangChain с инфраструктурой скрапинга Oxylabs для создания AI-управляемых решений для веб-скрапинга. Это решение поддерживает несколько языков и различные методы интеграции, позволяя AI-агентам преодолевать распространенные проблемы доступа к веб-страницам, такие как блокировки IP и капчи, тем самым обеспечивая более эффективное извлечение данных в реальном времени и расширяя возможности рабочих процессов агентов. (Источник: LangChainAI)

Инструмент оценки LLM с открытым исходным кодом Opik: комплексный мониторинг и отладка AI-приложений : Opik — это недавно выпущенный инструмент оценки LLM с открытым исходным кодом, разработанный для помощи разработчикам в отладке, оценке и мониторинге LLM-приложений, RAG-систем и рабочих процессов агентов. Он предоставляет комплексное отслеживание, автоматизированную оценку и производственные панели мониторинга, предлагая ключевые идеи для улучшения производительности и надежности AI-систем. (Источник: dl_weekly)
📚 ОБУЧЕНИЕ
Cursor Learn: бесплатный базовый видеокурс по ИИ : Cursor Learn запустил бесплатный шестичастный базовый видеокурс по ИИ, разработанный для начинающих и охватывающий основные концепции, такие как Token, контекст и агенты. Курс включает викторины и интерактивные AI-модели, призванные предоставить базовые знания по ИИ за один час, включая продвинутые темы, такие как сотрудничество агентов и управление контекстом, что является ценным ресурсом для начинающих в области ИИ. (Источник: cursor_ai, op7418)

Подборка репозиториев AI/ML на GitHub: охватывает фреймворки PyTorch, TensorFlow и другие : На GitHub была опубликована серия тщательно отобранных репозиториев AI/ML, содержащих практические ноутбуки для различных фреймворков глубокого обучения, таких как PyTorch, TensorFlow, FastAI. Эти ресурсы охватывают области компьютерного зрения, обработки естественного языка, GANs, Transformer, AutoML и обнаружения объектов, предоставляя богатые учебные материалы для студентов и практиков, способствуя техническим исследованиям и разработке проектов. (Источник: Reddit r/deeplearning)

Бесплатная электронная книга: “A First Course on Data Structures in Python” : Выпущена бесплатная электронная книга под названием “A First Course on Data Structures in Python”. Книга предоставляет основные строительные блоки, необходимые для ИИ и машинного обучения, включая структуры данных, алгоритмическое мышление, анализ сложности, рекурсию/динамическое программирование и методы поиска, являясь ценным ресурсом для изучения основ ИИ. (Источник: TheTuringPost)

Опубликованы дорожные карты для LLM-ученых и специалистов по данным : Опубликованы подробные дорожные карты для карьерного развития LLM-ученых и специалистов по данным. Эти ресурсы описывают навыки, инструменты и пути обучения, необходимые для входа или продвижения в области искусственного интеллекта, машинного обучения и науки о данных, предоставляя четкое руководство по карьерному планированию для амбициозных людей. (Источник: Ronald_vanLoon, Ronald_vanLoon)

A16Z Speedrun 2026: акселератор стартапов в области ИИ и развлечений : A16Z Speedrun 2026 принимает заявки от предпринимателей в области ИИ и развлечений. Проект поддерживает основателей, сосредоточенных на создании собственных предприятий, и является возможностью для предпринимателей, желающих развиваться в быстрорастущей области продуктов, управляемых ИИ. (Источник: yoheinakajima)
💼 БИЗНЕС
Иск о нарушении авторских прав против MiniMax: тень на пути к IPO AI-единорога : Китайский AI-единорог MiniMax, оцениваемый более чем в 4 миллиарда долларов, сталкивается с совместным иском о нарушении авторских прав от Disney, Universal Pictures и Warner Bros. Иск обвиняет его инструмент для генерации видео “Hǎiluó AI” в создании контента, содержащего защищенных авторским правом персонажей, по подсказкам пользователей, что представляет собой систематическое нарушение. Это дело наносит разрушительный удар по планам MiniMax по IPO, подчеркивая серьезные проблемы соблюдения прав интеллектуальной собственности на рынке генеративного ИИ, а также важность баланса между технологическими инновациями и правовыми нормами. (Источник: 36氪)

AI-логистическая компания Augment привлекает 85 миллионов долларов, общий объем финансирования достигает 800 миллионов юаней за пять месяцев : AI-логистическая компания Augment, всего через пять месяцев после запуска, успешно завершила раунд финансирования серии A на сумму 85 миллионов долларов, доведя общий объем финансирования до 110 миллионов долларов (около 800 миллионов юаней). Ее AI-агент Augie способен автоматизировать сложные, фрагментированные задачи на протяжении всего жизненного цикла логистики, от получения заказа до сбора платежей. Он уже управляет грузами на сумму более 35 миллиардов долларов для десятков ведущих сторонних логистических компаний и грузоотправителей, экономя миллионы долларов для клиентов, демонстрируя мощную коммерческую ценность ИИ в оптимизации трудоемких логистических процессов. (Источник: 36氪)

Microsoft интегрирует модели Claude от Anthropic в Copilot : Microsoft интегрировала модели Claude Sonnet 4 и Opus 4.1 от Anthropic в свой помощник Copilot для корпоративных пользователей. Этот шаг направлен на снижение зависимости от OpenAI и укрепление позиции Microsoft как нейтрального поставщика платформы. Корпоративные пользователи теперь могут выбирать между моделями OpenAI и Anthropic, что повышает гибкость и, как ожидается, будет стимулировать конкуренцию на корпоративном рынке ИИ. (Источник: Reddit r/deeplearning)
🌟 СООБЩЕСТВО
Влияние ИИ на человеческое понимание и общество: парадокс эффективности и “информационных пузырей” : Сообщество широко обеспокоено тем, что ИИ, подобно социальным сетям, может негативно повлиять на человеческое понимание, критическое мышление и жизненные цели. Оптимизируя генерацию контента для “распространения”, а не для “правды” или “глубины”, ИИ может привести к “плато обучения” и “машине бесконечного мусора”. Это вызывает дискуссии о том, как направить развитие ИИ к инструментам роста, а не к инструментам, вызывающим зависимость, призывая к изменениям в регулировании, отраслевой практике и культурных нормах. (Источник: Reddit r/ArtificialInteligence, Reddit r/artificial, Reddit r/ArtificialInteligence, Yuchenj_UW, colin_fraser, Teknium1, cloneofsimo)
ИИ на рабочем месте: противоречие между повышением эффективности и “скрытой эксплуатацией” : Интеграция ИИ на рабочем месте, особенно для сотрудников исполнительного уровня, создает парадокс: повышение эффективности часто сопровождается более высокими ожиданиями по производительности, при этом сотрудники не получают соответствующего вознаграждения. Эта “скрытая эксплуатация” превращает сотрудников в “ручных контролеров качества” для контента, генерируемого ИИ, увеличивая когнитивную нагрузку и тревожность. ИИ повышает производительность предприятий, но прибыль в большей степени достается капиталу, усугубляя “когнитивный разрыв” между стратегическими менеджерами и исполнителями, зависящими от инструментов. Если организационная структура не будет перестроена, это может привести к повсеместному выгоранию. (Источник: 36氪, glennko, mbusigin)
В эпоху ИИ “способность задавать вопросы” превосходит “способность к исполнению” : В мире, управляемом ИИ, истинное конкурентное преимущество смещается от скорости исполнения к “способности задавать вопросы” — то есть к способности определять, какие проблемы стоит решать. Чрезмерная зависимость от ИИ для исполнения при отсутствии критического определения проблем может привести к эффективному решению неправильных проблем, создавая ложное чувство прогресса. Дизайн-мышление, эмпатическое картирование и постоянное questioning считаются ключевыми человеческими навыками, которые ИИ не может заменить, помогая отдельным лицам и организациям эффективно использовать ИИ, сосредоточившись на решении значимых задач. (Источник: 36氪)
Геополитика ИИ: американо-китайская гонка ИИ и споры о международном регулировании : Американо-китайская гонка ИИ рассматривается как марафон, а не спринт, при этом Китай может лидировать в применении робототехники. США призывают сосредоточиться на практических инвестициях в ИИ, а не только на стремлении к суперинтеллекту, но они отказались от международного регулирования ИИ на уровне ООН, подчеркивая национальный суверенитет. Это подчеркивает сложную геополитическую картину, в которой развитие ИИ переплетается с национальной безопасностью, торговой политикой (например, визами H-1B), а также конкуренцией за инфраструктуру ИИ и таланты. (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, adcock_brett, Dorialexander, teortaxesTex, teortaxesTex, teortaxesTex, brickroad7, jonst0kes)
Эмад Мостак предсказывает “последнюю экономику”: ИИ переопределит человеческую ценность : Бывший генеральный директор Stability AI Эмад Мостак предсказывает, что в течение следующих 1000 дней ИИ полностью перестроит экономическую структуру, и ценность человеческого труда может упасть до нуля или даже стать отрицательной. Он предлагает “фреймворк MIND” (материя, интеллект, сеть, разнообразие) для измерения экономического здоровья, полагая, что избыток “интеллектуального капитала”, вызванный ИИ, требует переоценки важности других видов капитала. Этот “четвертый переворот” приведет к тому, что ИИ заменит когнитивный труд, и потребует создания новой “человекоцентричной” валюты и универсального базового ИИ для адаптации к социальным преобразованиям. (Источник: 36氪)

Гонка AI-оборудования: OpenAI, ByteDance и Meta борются за рынок потребительских устройств : Технологические гиганты, такие как OpenAI, ByteDance и Meta, активно инвестируют в разработку потребительского AI-оборудования. AI-очки Ray-Ban от Meta уже достигли значительных продаж, в то время как OpenAI, как сообщается, сотрудничает с поставщиками Apple для разработки “безэкранных умных колонок”, а ByteDance разрабатывает AI-умные очки. Эта гонка предвещает более глубокую интеграцию ИИ в повседневную жизнь, и компании исследуют различные формы продуктов и режимы взаимодействия, чтобы занять лидирующие позиции в области контекстно-зависимого ИИ. (Источник: 36氪)

AI Agent: от человеко-машинного сотрудничества к парадигме “человеко-машинного делегирования” : Индустрия ИИ переживает “мягкий переломный момент” от человеко-машинного сотрудничества к “человеко-машинному делегированию”, когда автономные AI Agent будут массово выполнять сложные задачи. Прорыв ИИ в “программировании” предвещает его способность преодолевать все полуоткрытые системы. Этот переход приведет к появлению организационной формы “беспилотных компаний”, где роль человека сместится от микро-исполнения к макро-управлению, сосредоточившись на внедрении ценностей, проектировании системной архитектуры и макро-навигации, при этом AI Copilot будет помогать в принятии решений, а не напрямую вмешиваться в быстро работающие AI-системы. (Источник: 36氪)

ИИ влияет на специальности иностранных языков: студентам необходимо развивать комплексные навыки “иностранный язык +” : Рост технологий AI-перевода глубоко влияет на специальности иностранных языков, что приводит к снижению спроса на традиционные языковые должности и закрытию соответствующих специальностей во многих университетах. Студенты иностранных языков сталкиваются с давлением трансформации, им необходимо переходить от единых языковых навыков к комплексной модели “иностранный язык +”, например, “иностранный язык + AI” для работы в области обработки естественного языка, “иностранный язык + международные коммуникации” и т. д. Это стимулирует реформу образования в области иностранных языков, подчеркивая межкультурное понимание и комплексные способности, а не просто обучение переводу, чтобы адаптироваться к новым требованиям эпохи ИИ к языковым специалистам. (Источник: 36氪, Reddit r/ClaudeAI)
Высокие цены на GPU: обусловлены спросом на ИИ и оптимизацией локальных LLM : Сообщество широко обеспокоено продолжающимся ростом цен на GPU, считая, что основными причинами являются резкий рост спроса на AI-центры обработки данных и инфляция. Многие считают, что цены вряд ли значительно снизятся, если только не лопнет пузырь ИИ или не произойдет массовое внедрение специализированных чипов. Однако, чтобы справиться с этой проблемой, сообщество активно работает над оптимизацией производительности локальных LLM, например, AMD MI50 превосходит NVIDIA P40 в llama.cpp/ggml, а также использует iGPU для базовых задач LLM, чтобы снизить стоимость локальных AI-вычислений. (Источник: Reddit r/LocalLLaMA, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

💡 ПРОЧЕЕ
“Иллюзия убывающей отдачи” от масштабирования LLM и долгосрочные задачи : Исследования показывают, что, хотя одноразовые бенчмарки могут демонстрировать замедление прогресса LLM, масштабирование моделей по-прежнему приводит к неубывающим улучшениям в выполнении долгосрочных задач. “Иллюзия убывающей отдачи” проистекает из незначительного повышения точности на одном шаге, которое, однако, может привести к сверхэкспоненциальному улучшению выполнения долгосрочных задач. Преимущества последовательных вычислений в долгосрочных задачах несравнимы с параллельными тестами, что указывает на то, что постоянное масштабирование моделей и обучение с подкреплением имеют решающее значение для достижения продвинутого поведения агентов. (Источник: scaling01)

Transformer на основе энергии (EBT) повышает производительность предсказания следующего токена : Исследователи представили Transformer на основе энергии (EBT), который оценивает кандидатов на следующий токен с помощью “энергетической” оценки и итеративно проверяет и выбирает их, снижая энергию с помощью градиентного шага. В экспериментах с 44 миллионами параметров EBT превзошел традиционные Transformer аналогичного размера в трех из четырех бенчмарков, что указывает на то, что этот новый метод выбора токенов может повысить производительность LLM. (Источник: DeepLearningAI)

Прогресс AI-роботов: гуманоидные продавцы и роботы-собаки, автономно ходящие без обучения : Xpeng Motors разместила в своих выставочных залах гуманоидного продавца автомобилей “Тиедан”, демонстрируя применение ИИ в робототехнике, ориентированной на клиента. Кроме того, робот-собака “с животными рефлексами” может ходить по лесу без обучения, что подчеркивает прогресс в технологии автономных роботов в имитации биологического движения и восприятия. Эти разработки предвещают растущую сложность и практическое применение ИИ в области физической робототехники. (Источник: Ronald_vanLoon, Ronald_vanLoon)
