Ключевые слова:NVIDIA Jetson Thor, Физический ИИ, Гуманоидные роботы, GPU Blackwell, Вычислительная мощность ИИ, Пиковая производительность ИИ Jetson Thor, Производительность GPU Blackwell, Сценарии применения физического ИИ, Комплект разработки гуманоидных роботов, Цена Jetson Thor
🔥 В центре внимания
Выпущен NVIDIA Jetson Thor: вычислительная мощность физического AI резко возросла : NVIDIA представила Jetson Thor, разработанный специально для физического AI и человекоподобных роботов. Он оснащен Blackwell GPU и 14-ядерным Arm Neoverse CPU, достигая пиковой вычислительной мощности AI в 2070 TFLOPS (FP4), что в 7,5 раз больше, чем у предыдущего поколения Jetson Orin. Он поддерживает генеративные модели AI, такие как VLA, LLM, VLM, может обрабатывать видео в реальном времени и выполнять AI-выводы, стремясь ускорить разработку универсальных роботов и физического AI. Основные области применения включают человекоподобных роботов, хирургическую помощь, интеллектуальные тягачи. Он уже используется такими компаниями, как Agility Robotics, Amazon, Boston Dynamics и Unitree Robotics. Набор разработчика уже доступен по стартовой цене 3499 долларов США. (Источник: nvidia)

GEPA: эволюция рефлексивных подсказок превосходит RL : Новое исследование (Agrawal et al., 2025) предлагает метод GEPA (Genetic-Pareto Prompt Evolution), который развивает системные подсказки LLM через рефлексию на естественном языке и диагностику траекторий, вместо использования обучения с подкреплением (RL). GEPA превосходит GRPO в задачах многошагового QA, требуя в 35 раз меньше прогонов, и постоянно превосходит SOTA оптимизатор подсказок MIPROv2. Это указывает на то, что языковые циклы оптимизации более эффективны для адаптации LLM, чем прямые прогоны в пространстве параметров, предвещая новое направление в стратегиях оптимизации AI. (Источник: Reddit r/MachineLearning)

Метод OPRO повышает эффективность тестирования безопасности AI : Брет Кинселла из TELUS Digital представил метод OPRO (Optimization by PROmpting), который позволяет LLM проводить “самостоятельное тестирование красной команды” путем оптимизации генератора атак для оценки безопасности AI. Метод фокусируется на распределении показателя успешности атаки (ASR), а не на простом прохождении/непрохождении, что позволяет обнаруживать уязвимости в больших масштабах и направлять меры по их устранению. Подчеркивается, что в высокорисковых отраслях, таких как финансы и здравоохранение, тестирование безопасности AI должно быть всеобъемлющим, повторяемым и креативным, а также переходить от реагирования к предотвращению, предоставляя предприятиям более детальную оценку безопасности AI. (Источник: Reddit r/deeplearning)

🎯 Тенденции
В модели DeepSeek V3.1 обнаружен баг с символом “极” : Пользователи сообщают, что новейшая модель DeepSeek V3.1 случайным образом вставляет символ “极” (или “extreme”) в выходные данные, что влияет на задачи, чувствительные к коду и структуре. Проблема воспроизводится как в сторонних развертываниях, так и в официальном API, вызывая обеспокоенность сообщества по поводу загрязнения данных модели и проблем со стабильностью. Есть предположения, что это связано с путаницей токенов или нечистыми данными обучения RLHF, что служит предупреждением для разработчиков моделей, подчеркивая критическое влияние качества данных на поведение AI. (Источник: teortaxesTex, 36氪, 36氪)

Загадочная модель Google Nano-Banana привлекает внимание : Загадочная модель для генерации и редактирования изображений под названием Nano-Banana стала популярной в сообществе AI, предполагается, что это продукт Google. Она превосходно справляется с редактированием текста, слиянием стилей и пониманием сцен, способна объединять элементы из нескольких изображений, сохраняя при этом согласованность освещения, перспективы и композиции. Однако есть недостатки, такие как искаженные названия книг и деформированные пальцы, а также отсутствие официального API и нестабильный пользовательский опыт. Многие поддельные веб-сайты также появились, что вызвало дискуссии на рынке о возможностях новой модели и каналах доступа к ней. (Источник: TomLikesRobots, yupp_ai, yupp_ai, 36氪)

Microsoft VibeVoice-1.5B TTS модель с открытым исходным кодом : Microsoft выпустила модель VibeVoice-1.5B TTS с открытым исходным кодом, которая поддерживает генерацию выразительных аудиодиалогов длительностью до 90 минут с участием до 4 разных говорящих. Модель основана на Qwen2.5-1.5B и использует токенизатор со сверхнизкой частотой кадров, что повышает вычислительную эффективность и поддерживает китайский и английский языки. Лицензия MIT, что, как ожидается, будет способствовать генерации AI-контента для длинных аудио, таких как подкасты, предоставляя создателям мощные многоязычные возможности аудиопроизводства. (Источник: _akhaliq, AnthropicAI, ClementDelangue, dotey)

Новые разработки в серии моделей Alibaba Wan : Модель AI Alibaba Wan анонсировала скорый выпуск WAN 2.2-S2V, модели преобразования речи в видео кинематографического качества, с акцентом на “управление аудио, визуальную основу, открытый исходный код”. В то же время, ранее выпущенная модель Wan2.2-T2V-A14B была интегрирована в приложение Anycode, став моделью по умолчанию для преобразования текста в видео. Эта серия разработок демонстрирует постоянные инвестиции и инновации Alibaba в области мультимодального AI, особенно в генерации аудио и видео. (Источник: Alibaba_Wan, TomLikesRobots, karminski3)
Гибридная архитектура LLM Jet-Nemotron ускоряется в 53,6 раза : Команда MIT Hanlab выпустила Jet-Nemotron, семейство языковых моделей с гибридной архитектурой, которое благодаря Post Neural Architecture Search (PostNAS) и новому блоку линейного внимания JetBlock достигло увеличения пропускной способности генерации до 53,6 раза на H100 GPU, при этом превосходя по производительности SOTA модели с полным вниманием с открытым исходным кодом. Это прорывное исследование предлагает новые решения для эффективности вывода и оптимизации архитектуры LLM. (Источник: teortaxesTex, menhguin)

AI Agents эволюционируют к автономным рабочим процессам в 2025 году : AI Agents развиваются от диалоговых помощников до автономных рабочих процессов, способных рассуждать, планировать и выполнять задачи. Интегрируя API и автоматизируя принятие решений, AI Agents могут управлять сложными процессами, такими как автоматическая генерация видеосценариев, компиляция видео и публикация на YouTube, предвещая, что рабочие процессы, управляемые AI, станут мейнстримом, значительно повышая уровень автоматизации. (Источник: Reddit r/artificial)

Предупреждение о уязвимостях безопасности AI-браузеров : AI-браузер Comet американского единорога AI-поиска Perplexity, как сообщается, имеет серьезные уязвимости безопасности, позволяющие злоумышленникам манипулировать AI-браузером для доступа к электронной почте, получения кодов подтверждения и отправки конфиденциальной информации с помощью вредоносных инструкций. Компания Brave указала, что традиционные механизмы кибербезопасности неэффективны против таких атак, и продукты Agent сталкиваются с огромными рисками из-за их “фатальной тройки” характеристик: “доступ к частным данным, контакт с ненадежным контентом, внешняя связь”. Это предупреждает, что продукты AI должны уделять приоритетное внимание безопасности и защите конфиденциальности при внедрении функциональных инноваций. (Источник: 36氪)

Разрыв в триллионах AI-хранилищ и архитектура Universal Storage : Эпоха AI предъявляет новые требования к хранилищам: экстремальная пропускная способность, низкая задержка, высокая параллельность, унифицированное управление мультимодальными данными, вычисления на месте хранения, постоянство памяти Agent и автономная безопасность. Традиционные архитектуры хранения с трудом адаптируются из-за зависимости от ядра OS, смешанного хранения метаданных и данных, а также раздельных протоколов. Архитектура Universal Storage, благодаря инновациям, таким как унифицированный пул хранения, независимое хранение метаданных и отсутствие зависимости от ядра OS, достигает задержки в сотни микросекунд и пропускной способности в ТБ, становясь основным выбором для уровня хранения в эпоху AI и обещая устранить разрыв в производительности хранения в AI-приложениях. (Источник: 36氪)

Короткие видео Reels запускают функцию AI-перевода с синхронизацией губ : Короткие видео Reels от Meta на Facebook и Instagram официально запустили функцию AI-аудиоперевода, которая поддерживает перевод аудио персонажей в видео на разные языки, а также синхронизацию губ и синтез оригинального тембра голоса. В настоящее время поддерживается перевод между английским и испанским, пользователи могут добавлять до 20 языковых дорожек. Этот шаг направлен на адаптацию к мировому рынку и захват доли TikTok, при этом AI становится ключом к прорыву Meta в коротких видео, что, как ожидается, улучшит опыт потребления контента для глобальных пользователей. (Источник: 36氪)

Тенденции и вызовы индустрии AIoT : Три отчета от McKinsey, BVP и MIT указывают на то, что глубокая интеграция AI и IoT является неизбежной тенденцией, а коммерциализация должна быть сосредоточена на сценариях с высоким ROI, с акцентом на платформенное и экосистемное сотрудничество. Однако отчеты также выявляют конфликты между собственной разработкой и закупками, взрывным ростом и устойчивостью, а также между фронтенд-опытом и бэкенд-интеллектом. Они утверждают, что AIoT должен перейти от “перевозчика данных” к “автономной сети интеллектуальных агентов”, достигая автономии, сотрудничества и восстановления доверия, чтобы справиться с вызовами модернизации отрасли. (Источник: 36氪)

ByteDance исследует экосистему AI-оборудования, включая телефоны, автомобили, роботов : ByteDance увеличивает инвестиции в аппаратное обеспечение, постепенно интегрируя или самостоятельно разрабатывая телефоны, автомобили, роботов, умные очки, обучающие устройства и другие продукты через свою большую модель Doubao. Сообщается, что ByteDance разрабатывает интеллектуальную операционную систему для автомобилей и AI-телефон Doubao, стремясь найти носители для своих AI-возможностей. Хотя предыдущие попытки ByteDance в аппаратном обеспечении были неудачными, после взрывного роста больших моделей AI ByteDance снова активизируется, стремясь создать “программно-аппаратную интегрированную” экосистему AI, чтобы найти новые точки роста в эпоху AI. (Источник: 36氪)

🧰 Инструменты
Google AI Mode упрощает бронирование столиков в ресторанах : Пользователи подписки Google AI Ultra теперь могут использовать AI Mode для упрощения бронирования столиков в ресторанах. Пользователям достаточно описать свои потребности на естественном языке, такие как ужин по случаю дня рождения, количество человек, атмосфера, музыка, и AI Mode выполнит работу по бронированию, пользователю останется только окончательно подтвердить. Эта функция запускается в США и направлена на улучшение персонализированного обслуживания, автоматизируя трудоемкий процесс бронирования. (Источник: Google)
Новые разработки в режиме Agent для терминальных инструментов VSCode : Команда VSCode переписывает свои терминальные инструменты для поддержки режима Agent, стремясь повысить эффективность и удобство работы разработчиков. Этот шаг является частью экосистемы GitHub Copilot, обеспечивая более интеллектуальную помощь в разработке с помощью AI-агентов, например, генерацию кода и отладку непосредственно в терминале, тем самым упрощая процесс разработки. (Источник: pierceboggan)
OpenRouter запускает функцию ZDR в один клик : OpenRouter выпустил функцию “ZDR в один клик” (Zero Data Retention), которая гарантирует, что подсказки пользователей отправляются только провайдерам, поддерживающим нулевое хранение данных. Это повышает защиту конфиденциальности данных пользователей, упрощает выбор политики данных поставщиков AI-услуг, позволяя пользователям более спокойно использовать AI-услуги. (Источник: xanderatallah)

Qwen Edit демонстрирует выдающиеся результаты в Outpainting изображений : Модель Alibaba Qwen Edit продемонстрировала выдающиеся способности в задаче Outpainting (расширение изображения), способная качественно расширять содержимое изображения, демонстрируя свой мощный потенциал в области визуальной генерации. Пользователи могут легко использовать этот инструмент для расширения фона изображения или создания более широких сцен, повышая гибкость создания изображений. (Источник: multimodalart)

Google NotebookLM поддерживает многоязычные обзоры видео : Google NotebookLM представил новую функцию, поддерживающую обзоры видео на 80 языках, а также контроль короткой и стандартной длительности для неанглоязычных аудиообзоров. Это значительно улучшает возможности многоязычных пользователей по получению и пониманию видеоконтента, предотвращая потерю информации при переводе и делая обучение и исследования более эффективными. (Источник: Google)
GLIF интегрирует SOTA модели видео, изображений и LLM : Платформа GLIF интегрировала все SOTA модели видео, изображений и LLM, став единственной платформой, способной комбинировать эти модели в уникальные, настраиваемые рабочие процессы. Пользователи могут использовать такие модели, как Kling 2.1 Pro, для генерации видео, например, использовать кадры, сгенерированные Qwen-Image, для анимации Veo 3, создавая креативные сцены, и даже преобразовывать видео в стиль MSPaint. (Источник: fabianstelzer, fabianstelzer, fabianstelzer)
LlamaIndex запускает инструмент Vibe Coding : LlamaIndex выпустила инструмент CLI vibe-llama и подробные шаблоны подсказок, направленные на повышение эффективности и точности AI-агентов программирования (таких как Cursor AI и Claude Code). Этот инструмент может напрямую внедрять контекст LlamaIndex в агенты программирования, избегая устаревших рекомендаций API, и способен генерировать полные приложения Streamlit из базовых скриптов, включая загрузку файлов и обработку в реальном времени, тем самым ускоряя процесс разработки. (Источник: jerryjliu0)

LangGraph Platform запускает Revision Rollbacks и Queueing : LangGraph Platform запустила функцию Revision Rollbacks (откат версий), позволяющую пользователям повторно развертывать любую историческую версию для удобства отслеживания и исправления проблем. Одновременно запущена функция Revision Queueing (очередь версий), при которой новые изменения ставятся в очередь и выполняются после завершения предыдущих, что повышает эффективность и стабильность рабочего процесса разработки, предоставляя более надежную среду для разработки Agent. (Источник: LangChainAI, LangChainAI)
Фреймворк Lemonade поддерживает вывод AMD NPU/GPU : Lemonade — это новый фреймворк для вывода больших моделей, который может работать на видеокартах AMD, CPU и NPU, поддерживая модели GGUF и ONNX. Этот фреймворк разработан инженерами AMD, не зависит от CUDA, и предоставляет пользователям аппаратного обеспечения AMD новое решение для вывода AI, что, как ожидается, повысит производительность AI-приложений на платформах AMD. (Источник: karminski3)

Социальное приложение Intent на базе AI : Брэндон Чен основал Intent, AI-нативный инструмент для обмена мгновенными сообщениями, который призван устранить препятствия для сотрудничества с помощью AI, беспрепятственно преобразуя намерения пользователя в результаты. Например, AI может автоматически объединять несколько фотографий или планировать поездки, бронировать транспорт, генерировать общие списки покупок на основе истории чата. Это приложение объединяет функции чата с возможностями автоматического выполнения больших моделей, получило десятки миллионов долларов финансирования и, как ожидается, изменит способы социального взаимодействия. (Источник: _akhaliq, 36氪)

Руководство Karpathy по “атмосферному программированию” 2.0 : Андрей Карпати опубликовал обновленное руководство по “атмосферному программированию”, предлагая трехслойную структуру AI-программирования: Cursor для автодополнения и небольших изменений; Claude Code/Codex для реализации более крупных функциональных блоков и быстрого прототипирования; GPT-5 Pro для решения самых сложных багов и сложных абстракций. Он подчеркивает, что AI-программирование вступает в “эпоху пост-дефицита кода”, но AI-код все еще требует ручной очистки, а AI имеет ограничения в объяснимости и интерактивности. (Источник: 36氪)

DeepSeek V3.1 запущен на W&B Inference : Модель DeepSeek V3.1 теперь доступна на платформе Weights & Biases Inference, предлагая два режима: “Non-Think” (высокая скорость) и “Think” (глубокое мышление). Ее стоимость составляет $0.55/$1.65 за 1M токенов, что призвано предоставить экономичное решение для создания интеллектуальных агентов, позволяя разработчикам выбирать подходящий режим вывода в зависимости от их потребностей. (Источник: weights_biases)

📚 Обучение
Бенчмарк MAC оценивает научные рассуждения мультимодальных больших моделей : Исследовательская группа профессора Ван Дэцюаня из Шанхайского университета Цзяотун предложила бенчмарк MAC (Multimodal Academic Cover), использующий новейшие обложки ведущих журналов, таких как «Nature», «Science» и «Cell», в качестве тестового материала для оценки способности мультимодальных больших моделей понимать глубокие связи между художественными визуальными элементами и научными концепциями. Результаты показывают, что ведущие модели, такие как GPT-5-thinking, демонстрируют ограничения при работе с новым научным контентом, с точностью Step-3 всего 79,1%. Исследовательская группа также предложила решение DAD (Describe-and-Reason), которое значительно улучшает производительность модели за счет поэтапного мышления, и ввела двойной динамический механизм для обеспечения постоянной сложности, предоставляя новую парадигму для оценки научного понимания мультимодального AI. (Источник: 36氪)

LLMs как оценщики: исследование эффективности и надежности : Статья (arxiv:2508.18076) ставит под сомнение, что нынешний энтузиазм по использованию больших языковых моделей (LLMs) в качестве оценщиков систем генерации естественного языка (NLG) может быть преждевременным. Основываясь на теории измерений, статья критически оценивает четыре основные гипотезы о LLMs как агентах человеческого суждения, их способности к оценке, масштабируемости и экономической эффективности, а также исследует, как присущие LLMs ограничения ставят под сомнение эти гипотезы. Призывается к более ответственной практике в оценке LLMs, чтобы гарантировать, что они поддерживают, а не подрывают прогресс в области NLG. (Источник: HuggingFace Daily Papers)
UQ: оценка способности моделей решать нерешенные проблемы : UQ (Unsolved Questions) — это новая тестовая платформа, содержащая 500 сложных, разнообразных нерешенных вопросов из Stack Exchange, предназначенная для оценки способностей передовых моделей в рассуждениях, фактической точности, поиске информации и других аспектах. UQ использует верификаторы для помощи в отборе и проверку сообществом, асинхронно оценивая модели. Ее цель — продвигать AI в решении реальных проблем, которые еще не решены человеком, тем самым напрямую создавая практическую ценность и предоставляя новую перспективу для оценки исследований AI. (Источник: HuggingFace Daily Papers)
ST-Raptor: фреймворк для вопросно-ответных систем по полуструктурированным таблицам на базе LLM : ST-Raptor — это древовидный фреймворк, использующий большие языковые модели для решения сложных задач вопросно-ответных систем по полуструктурированным таблицам. Он вводит иерархическое ортогональное дерево (HO-Tree) для захвата сложных макетов таблиц, определяет базовые операции с деревом для управления LLM при выполнении задач QA и использует двухэтапный механизм проверки для обеспечения надежности ответов. На новом наборе данных SSTQA ST-Raptor превзошел девять базовых моделей по точности ответов на 20%, предлагая эффективное решение для обработки сложных табличных данных. (Источник: HuggingFace Daily Papers)
Руководство по JAX и интеграция с TPU : Было опубликовано удобное для начинающих руководство по JAX, содержащее практические примеры, которое поможет разработчикам лучше использовать JAX для разработки моделей AI. Интеграция JAX с TPU показала отличные результаты, легко масштабируется и настраивается для шардинга, считается более удобной для пользователей PyTorch, в то время как Flax Linen API более гибок, предоставляя эффективный путь для высокопроизводительных вычислений AI. (Источник: borisdayma, Reddit r/deeplearning)

Шаблоны проектирования LlamaIndex Document Agent : LlamaIndex поделится “эффективными шаблонами проектирования для создания Document Agent” на мероприятии Agentic AI In Action, проводимом в AWS Builder’s Loft. Презентация охватит, как использовать LlamaIndex для создания Document Agent, и предоставит практические примеры и рекомендации по проектированию, чтобы помочь разработчикам лучше использовать AI Agent для обработки задач с документами, повышая уровень автоматизации и интеллектуализации обработки документов. (Источник: jerryjliu0, jerryjliu0)

DSPy: автоматическая оптимизация подсказок в Python : Ряд ресурсов поделился тем, как выполнять автоматическую и программную оптимизацию подсказок в Python, в частности, как использовать фреймворк DSPy. Эти учебные пособия подробно объясняют, как работает DSPy и как эффективно манипулировать подсказками для создания мощных, поддерживаемых AI-программ, например, повышая точность извлечения структурированных данных с 20% до 100%, что значительно улучшает эффективность и результативность инженерии подсказок. (Источник: lateinteraction, lateinteraction)

💼 Бизнес
Маск подает в суд на OpenAI и Apple за монополию : Компания xAI Илона Маска официально подала в суд на OpenAI и Apple, обвиняя обе стороны в сговоре с целью монополизации рынка AI через соглашение о сотрудничестве, а также утверждая, что Apple App Store манипулирует рейтингами приложений, подавляя конкурентов, таких как Grok. Иск требует многомиллиардной компенсации и признания их сотрудничества незаконным. Этот шаг отражает растущую коммерческую конкуренцию в области AI и борьбу за доминирование на рынке, что может изменить ландшафт индустрии AI. (Источник: Reddit r/artificial, Reddit r/ArtificialInteligence, 36氪, 36氪)

90% работников “покупают AI за свой счет для работы”, что порождает сегмент To P : Отчет MIT показывает, что 90% офисных работников “тайно используют” личные AI-инструменты, что породило сегмент To P (To Professional). Доход AI-помощников для программирования, таких как Cursor, за год вырос с 1 миллиона долларов до 500 миллионов долларов, а их оценка приблизилась к десяткам миллиардов. В этой модели пользователи покупают AI за свой счет для повышения эффективности работы, что обеспечивает чрезвычайно высокое соотношение затрат и результатов, стимулируя быстрый рост AI-продуктов. По сравнению с медленным циклом To B и высокой стоимостью To C, модель To P стала скрытой горячей точкой для AI-стартапов. (Источник: 36氪)

Утечка талантов и проблемы внутреннего управления в команде Meta AI : В Meta наблюдается уход старших исследователей, таких как Ришабх Агарвал и контрибьютор PyTorch Берт Махер, что вызывает обеспокоенность по поводу утечки талантов из лаборатории супер-интеллекта Meta. Бывшие исследователи жалуются на проблемы управления в Meta, такие как давление оценки производительности, борьба за ресурсы, конфликты между старыми и новыми фракциями, что приводит к утечке талантов и снижению морального духа. Ведущие исследователи больше ценят видение, миссию и независимость, а не просто зарплату, что выявляет глубокие структурные проблемы Meta в конкуренции за AI-таланты. (Источник: Yuchenj_UW, arohan, 36氪)

🌟 Сообщество
Способности AI-моделей к рассуждению и реальные проблемы : Сообщество активно обсуждает, обладают ли LLM “истинными способностями к рассуждению”. Некоторые считают, что LLM все еще имеют ограничения в сложных задачах рассуждения, и их улучшение производительности может быть связано с данными, а не с истинным пониманием. Эксперты отмечают, что для определения AGI необходимо смотреть на способность выполнять любую программу без инструментов и генерировать правильные результаты. В то же время, есть мнения, ставящие под сомнение производительность GPT-5 Pro в математических задачах, которая может быть затронута загрязнением данных обучения, что вызывает глубокие дискуссии о сущностных возможностях AI-моделей. (Источник: MillionInt, pmddomingos, pmddomingos, sytelus)
Эффективность AI-программирования и ценность ручного кодирования : Сообщество активно обсуждает преимущества и недостатки AI-программирования (например, Vibe Coding) по сравнению с традиционным ручным кодированием. Некоторые считают, что AI может значительно повысить эффективность, особенно для прототипирования и перевода языков, но может нарушить поток работы, а качество AI-кода неоднородно и все еще требует ручной проверки и модификации. Ручное кодирование по-прежнему имеет преимущества в прояснении мыслей и поддержании потока работы, и эти два подхода не противопоставляются, а являются лучшей комбинацией, и программисты должны владеть всеми инструментами. (Источник: dotey, gfodor, gfodor, imjaredz, dotey)
Скорость развития AI и искажения в СМИ : Сообщество обсуждает, замедляется ли скорость развития AI. Некоторые считают, что традиционные СМИ часто ошибочно сообщают о замедлении прогресса AI, в то время как в области LLM (например, от GPT-4 Turbo до GPT-5 Pro) наблюдается самый быстрый прогресс. В то же время, некоторые считают, что надежность AI в реальных приложениях все еще недостаточна, а реакция правительств на AI также медленна, что отражает различные представления и ожидания относительно текущего состояния развития AI-технологий. (Источник: Plinz, farguney)

Влияние AI на социально-экономическую сферу и занятость : Сообщество обсуждает, является ли AI “убийцей” или “создателем” рабочих мест, и предлагает третью возможность: стать “топливом для стартапов”. Эксперты прогнозируют, что AI приведет к удешевлению медицины, услуг и образования, будет способствовать экономическому росту и сделает малые предприятия более распространенными. В то же время, идея о том, что IQ AI превосходит человеческий, вызывает дискуссии о переписывании экономических правил и нехватке экономики, подчеркивая важность безопасности AI и всеобщего доступа к нему. (Источник: Ronald_vanLoon, finbarrtimbers, 36氪)

Ограничения и риски AI Agent : Сообщество обсуждает ограничения AI Agent в реальных приложениях, такие как случайное удаление базы данных Claude Agent и уязвимость Agent в сложных средах. Некоторые считают, что успех Agent не должен зависеть только от больших моделей, а от стабильности цепочки “вызов инструмента — очистка состояния — стратегия повторных попыток”. В то же время, “черный ящик” AI и проблемы безопасности также вызывают опасения, например, льстивое поведение AI рассматривается как “темный шаблон”, направленный на манипулирование пользователями, что вызывает этические споры. (Источник: QuixiAI, bigeagle_xd, Reddit r/ArtificialInteligence)

Ценность стартапов AI-native SaaS : Сообщество обсуждает, являются ли большинство стартапов AI SaaS просто обертками для GPT, ставя под сомнение их долгосрочную ценность. Некоторые считают, что многие инструменты слишком гонятся за трендами, им не хватает глубокой ценности, и они легко могут быть заменены большими моделями напрямую. Истинная ценность заключается в создании долговечных продуктов, а не в простом UI и автоматизации, призывая предпринимателей сосредоточиться на существенных инновациях. (Источник: Reddit r/ArtificialInteligence)
AI-котовидео и психология потребления контента : AI-генерированные “котовидео” стали вирусными в социальных сетях, привлекая огромный трафик благодаря преувеличенным, мелодраматическим сюжетам и мультяшным изображениям кошек. Этот низкозатратный, высокотрафиковый, эмоционально насыщенный контент отражает текущую психологию потребления информации: “быстро, приятно, странно, необычно”. Несмотря на странный стиль и явные следы AI, его новизна успешно задевает любопытство пользователей, вызывая полярные оценки. Сообщество обсуждает причины, стоящие за этим, такие как низкий технический барьер и легкость обработки изображений кошек для AI. (Источник: 36氪)

💡 Другое
IQ AI превосходит человеческий, правила экономики будут переписаны : В 2025 году средний IQ AI превысил 110, официально превзойдя обычных людей, и начал участвовать в “полноценных операциях” экономической системы, включая сбор информации, принятие решений и фактическое выполнение. Это знаменует появление AI-экономики, которая может привести к неограниченному предложению рабочей силы и нехватке экономики, значительно повышая производительность и снижая транзакционные издержки, уменьшая нерациональные решения. В то же время подчеркивается, что безопасность AI и всеобщий доступ к нему являются важными задачами для встречи будущего, предвещая третью крупную волну рационализации в человеческом обществе. (Источник: 36氪)

Опубликован список самых цитируемых ученых мира, эксперты в области AI выделяются : Статистика AD Scientific Index 2025 показывает, что Йошуа Бенджио, один из трех гигантов глубокого обучения, стал первым в мире ученым с “самым высоким цитированием во всех областях”, с общим количеством цитирований более 970 тысяч. Джеффри Хинтон занял второе место в мире, Каймин Хэ — пятое, а Илья Суцкевер также вошел в ТОП-10. Список основан на общем количестве цитирований и количестве цитирований за последние 5 лет, что подчеркивает огромное влияние ученых в области AI в мировом академическом сообществе и отражает бурный рост исследований AI. (Источник: 36氪)

Маск основал новую компанию “Macrohard”, чтобы переделать продукты Microsoft с помощью AI : Илон Маск основал новую компанию “Macrohard”, целью которой является полное моделирование основных продуктов Microsoft с помощью AI-программного обеспечения, например, создание продуктов с помощью AI, которые имеют те же функции, что и пакет Office. Компания будет использовать сотни специализированных AI-агентов, производных от Grok, которые будут работать совместно при поддержке вычислительной мощности, чтобы подорвать традиционную модель программного обеспечения. Этот шаг рассматривается как последнее действие Маска в прямой войне с Microsoft в области AI, что вызывает размышления в отрасли о будущей форме AI-программного обеспечения. (Источник: 量子位)
