Ключевые слова:Потребление энергии ИИ, Углеродный след ИИ, Автоматизация ИИ, Агенты LLM, Этика ИИ, Инфраструктура ИИ, Сценарии применения ИИ, Анализ энергопотребления ИИ от MIT Technology Review, Автоматизация рабочих процессов с Mechanize, Уязвимости безопасности агентов LLM, Автоматизация банковских документов с Sakana AI, Споры вокруг статьи Apple об иллюзиях мышления
🔥 В центре внимания
MIT Technology Review: глубокий анализ энергопотребления и углеродного следа AI: В последнем анализе MIT Technology Review всесторонне рассматривается использование энергии в индустрии AI, с точностью до энергопотребления одного запроса, с целью отслеживания текущего углеродного следа AI и его будущих тенденций. Поскольку ожидается, что число пользователей AI достигнет миллиардов, в отчете подчеркивается недостаточность текущего отраслевого отслеживания и дается серьезное предупреждение о воздействии на окружающую среду, связанном с широкомасштабным применением технологий AI, призывая обратить внимание на вопросы его устойчивого развития (Источник: Reddit r/ArtificialInteligence)

AI-стартап Mechanize нацелен на «автоматизацию всей работы»: По сообщению New York Times, новый AI-стартап Mechanize ставит перед собой амбициозную цель — автоматизировать все виды работ, от рядовых сотрудников до врачей, юристов, инженеров-программистов, архитекторов и даже нянь. Компания стремится обучать AI-агентов путем создания «цифрового офиса» для полной автоматизации компьютеризированных рабочих процессов, что вызвало широкое обсуждение будущего занятости и роли AI в обществе (Источник: Reddit r/ArtificialInteligence)
Отчет DeepLearningAI: агенты LLM уязвимы для манипуляций с помощью вредоносных ссылок: Исследователи из Колумбийского университета обнаружили, что агентами на базе больших языковых моделей (LLM) можно манипулировать с помощью вредоносных ссылок в социальных сетях (например, Reddit). Злоумышленники встраивают вредоносные инструкции в посты, которые кажутся тематически релевантными, побуждая AI-агентов посещать зараженные веб-сайты и выполнять вредоносные действия, такие как утечка конфиденциальной информации или отправка фишинговых писем. Тесты показали, что AI-агенты в 100% случаев попадались на все подобные уловки, что выявило серьезные уязвимости в защите современных AI-агентов (Источник: DeepLearningAI)

Sakana AI и Mitsubishi UFJ Financial Group (MUFG) заключили соглашение об автоматизации банковских операций: Японский AI-стартап Sakana AI заключил с MUFG соглашение на сумму 5 миллиардов иен (около 34 миллионов долларов США) с целью автоматизации создания банковских документов, включая меморандумы об одобрении кредитов. Сотрудничество начнется с шестимесячного пилотного этапа в июле, в ходе которого MUFG будет использовать систему «AI-ученый» от Sakana AI для генерации документов. Этот шаг знаменует собой значительный прогресс в применении AI в ключевых областях финансов. Сооснователь и COO Sakana AI Рэн Ито займет должность AI-консультанта в банке MUFG (Источник: SakanaAILabs)
Статья Apple об «иллюзии мышления» вызвала споры, последующие исследования раскрыли истинные возможности моделей: Статья компании Apple об «иллюзии мышления», согласно которой большие языковые модели (LLM) плохо справляются со сложными задачами на рассуждение, вызвала широкое обсуждение. Последующие исследования показали, что при оптимизации формата вывода, позволяющей моделям давать более сжатые ответы, ранее наблюдавшийся провал в производительности исчез. Это доказывает, что моделям не недостает способности к логическому мышлению, а скорее они были ограничены лимитом токенов или специфическими методами оценки. Это указывает на то, что при оценке способностей LLM необходимо учитывать их механизмы взаимодействия и вывода (Источник: slashML)

🎯 Тренды
Раскрыты технические детали робота Figure: 60 минут непрерывной работы, управление нейросетью Helix: Компания Figure опубликовала 60-минутное нередактированное видео работы своего робота Figure 02 на заводе BMW, выполняющего задачи по сортировке логистических грузов. Видео демонстрирует его способность обрабатывать разнообразные посылки (включая мягкую упаковку) и скорость движения, близкую к человеческой. Повышение производительности достигнуто за счет расширения высококачественных наборов демонстрационных данных и архитектурных улучшений собственной стратегии визуально-моторного управления нейросетью Helix, включая внедрение модулей визуальной памяти, истории состояний и силовой обратной связи, что повысило стабильность, адаптивность и способность робота к взаимодействию с человеком (Источник: 量子位)

Quark выпустила первую в Китае большую модель для помощи в выборе вуза после Гаокао, предоставляя бесплатные отчеты: Quark представила большую модель, предназначенную для помощи китайским абитуриентам в выборе вуза после Гаокао (единого государственного экзамена). Модель бесплатно генерирует для абитуриентов подробные отчеты с рекомендациями по стратегии «прорыв, стабильность, гарантия». Эта модель сочетает опыт сотен реальных экспертов по выбору вузов и обширную «базу знаний Гаокао», используя интеллектуального агента для анализа и предоставления персонализированных рекомендаций в течение 5-10 минут. Кроме того, предлагаются функции «глубокого поиска по Гаокао» и «интеллектуального выбора специальности», нацеленные на изменение ситуации с традиционно дорогими консультациями по выбору вуза (Источник: 量子位)

Технологии робототехники продолжают развиваться, представлены новые модели роботов: В последнее время несколько роботов продемонстрировали свои новейшие достижения в различных областях. Гуманоидный робот Unitree G1 от Unitree Robotics свободно передвигался по торговому центру и демонстрировал хороший контроль, даже при неустойчивом положении ног. Робот Figure 02 показал способность к длительной работе в логистике. Автономный мотоцикл Motoroid от Yamaha способен самостоятельно балансировать. LimX Dynamics (鹿明机器人) продемонстрировала способность своих роботов к быстрому запуску. Pickle Robot показал способность разгружать товары из загроможденных грузовых прицепов. Кроме того, сообщается о разработке китайскими учеными робота, управляемого мозгом, созданным из культивированных человеческих клеток, а также о выпуске NVIDIA настраиваемой модели гуманоидного робота с открытым исходным кодом GR00T N1. Это свидетельствует о быстром развитии робототехники в области автономности, гибкости и интеллектуализации (Источник: Ronald_vanLoon, 量子位, Ronald_vanLoon, karminski3, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)
Инфраструктура AI и энергопотребление в центре внимания: По мере роста масштабов и областей применения моделей AI, все больше внимания уделяется вопросам их базовой инфраструктуры и энергопотребления. Проект vLLM сотрудничает с AMD для повышения эффективности инференса больших моделей. Европейский рынок сталкивается с потенциальным избытком GPU, в то время как исследовательский альянс AI обсуждает проблемы взаимосвязанности. Существует мнение, что энергия станет следующим основным узким местом в развитии AI. Одновременно с этим, углеродный след и устойчивость AI также становятся важными темами, и отрасль начинает обсуждать решения «зеленых облачных вычислений» для решения энергетических проблем, связанных с революцией AI (Источник: vllm_project, Dorialexander, Dorialexander, claud_fuen, Reddit r/ArtificialInteligence, Reddit r/artificial)
Углубление применения AI в различных отраслях, внимание к трендам и этике: Технологии AI ускоренно проникают во многие сферы, включая медицину, промышленное производство, подбор персонала, управление сотрудниками. Forbes и другие СМИ прогнозируют, что в 2025 году AI продолжит оставаться ключевой технологической силой, способствующей трансформации клиентского опыта, умных городов и будущих моделей работы. AI в медицине рассматривается как инструмент для выравнивания доступа к медицинским ресурсам между городом и селом и играет роль на конкретных этапах диагностики и лечения. В то же время, использование AI для мониторинга производительности сотрудников, отставание в применении AI при подборе персонала (особенно в Европе), а также проблемы, такие как возможное обесценивание высшего образования из-за AI, вызывают широкое обсуждение этики AI, его социального влияния и перспектив занятости (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)
Развитие технологий AI-агентов, безопасность и этика в центре внимания: Вычисления на основе агентов быстро развиваются, их возможности превосходят традиционные веб-приложения. Отрасль начинает уделять внимание и разрабатывать принципы ответственных AI-агентов (например, принципы 2025 года, предложенные Khulood_Almani). Однако безопасность AI-агентов также сталкивается с проблемами, например, исследования показывают, что агенты LLM легко поддаются манипуляциям с помощью вредоносных ссылок. Эти достижения и проблемы совместно способствуют углубленному обсуждению технологий, этики и рамок управления AI-агентами (Источник: Ronald_vanLoon, Ronald_vanLoon, DeepLearningAI)
Tencent выпустила большую модель 3D-генерации с открытым исходным кодом Hunyuan3D-2.1: Команда Tencent Hunyuan выпустила свою новейшую большую модель 3D-генерации Hunyuan3D-2.1, которая способна генерировать 3D-модели на основе одного изображения и уже имеет открытый исходный код. Утверждается, что Hunyuan3D-2.1 достигла уровня SOTA (State-of-the-Art) среди существующих моделей 3D-генерации с открытым исходным кодом, демонстрируя производительность, сравнимую с моделями вроде Tripo3D, и предоставляя новый мощный инструмент для создания 3D-контента и 3D-печати (Источник: karminski3)
Menlo Research представила модель Jan-nano-4B, превосходящую другие в определенных задачах: Menlo Research выпустила модель Jan-nano-4B, 4-миллиардную параметрическую модель, дообученную с использованием DAPO на базе Qwen3-4B. Утверждается, что оценочные данные этой модели по MCP (Multi-Choice Probing) превосходят Deepseek-R1-671B. Команда также выпустила квантованную версию GGUF, рекомендуя использовать квантование Q8, с целью предоставить пользователям эффективный выбор модели для локального вызова MCP (Источник: karminski3, Reddit r/LocalLLaMA)

Ежедневный дайджест новостей AI от Reddit: Новости AI, обобщенные сообществом Reddit, включают: студенты Йельского университета создали социальную сеть на базе AI; технология AI помогла отреставрировать поврежденные картины за несколько часов; AI-тренер по теннису предоставляет профессиональные тренировки игрокам; китайские ученые обнаружили предварительные доказательства того, что AI может обладать мышлением, схожим с человеческим. Эти краткие новости отражают прогресс AI в таких направлениях, как социальные сети, реставрация произведений искусства, спортивные тренировки и фундаментальные исследования (Источник: Reddit r/ArtificialInteligence)

Проект виртуального питомца на базе AI: Разработчик создает для себя виртуального AI-питомца. Питомец имеет различные состояния, такие как уровень голода, может взаимодействовать голосом и выражать свои потребности, например, голод или усталость. Будущие планы включают улучшение голоса, развитие личности, добавление игр и функций постановки и отслеживания личных целей, с целью создания AI-компаньона, способного оказывать эмоциональную поддержку (Источник: Reddit r/ArtificialInteligence)
🧰 Инструменты
Браузер Microsoft Edge интегрирован с Copilot, бесплатное использование GPT-4o и генерации изображений: В последнем обновлении Windows браузер Edge получил встроенного AI-помощника Copilot, предлагающего две модели: «Быстрый ответ» и «Think Deeper». Что еще более важно, пользователи могут напрямую бесплатно использовать GPT-4o (в Copilot называемый Copilot 4o) и его функции генерации изображений. Тесты показывают высокое качество генерируемых изображений, а процесс генерации происходит поэтапно, что соответствует авторегрессионным характеристикам модели GPT-4o, предоставляя пользователям удобный бесплатный инструмент для AI-творчества (Источник: karminski3)
Lovable проводит соревнование AI-моделей для программирования, открыт бесплатный пробный доступ: Lovable совместно с OpenAI, Anthropic и Google проводит мероприятие «AI Showdown», позволяя общественности бесплатно и без ограничений использовать платформу Lovable для сравнения производительности основных моделей (таких как GPT-4.1, Claude Sonnet 4, Gemini и др.) в «vibe coding» (программирование на основе интуиции и нечетких описаний). Данные показывают, что модели Anthropic наиболее активно используются для промптинга и создания проектов, модели OpenAI редактируют код быстрее всех, а Gemini используется относительно меньше. Мероприятие направлено на выбор лучшего AI для программирования путем общественного тестирования (Источник: op7418, halvarflake)

Фреймворк MLX продолжает оптимизироваться, повышая скорость локального инференса больших моделей: Фреймворк машинного обучения MLX от Apple достиг значительного повышения производительности при локальном запуске больших моделей. Благодаря новым оптимизациям, таким как ядро Fused QKV metal, MLX при запуске вариантов BitNet (например, Falcon-E) работает примерно на 30% быстрее, чем bitnet.cpp, достигая 110 ток/с на чипе M3 Max. Одновременно с этим, MLX QLoRA успешно дообучила модель Qwen3 0.6B 4bit, требуя всего около 500 МБ памяти, что демонстрирует потенциал MLX в повышении эффективности AI на конечных устройствах (Источник: ImazAngel, ImazAngel, yb2698)

AI-помощники для программирования и инструменты оценки кода в центре внимания: Мнения разработчиков о зависимости от AI-помощников для программирования расходятся. Некоторые пользователи сообщают, что Codex от OpenAI плохо справляется с автономными экспериментами, просмотром результатов и итерациями. Другие же разработчики считают, что AI-агенты для кодирования уже преодолели барьер и стали незаменимыми инструментами, смещая рабочий процесс от написания кода к его проверке. Пользователи, такие как Hamel Husain, делятся положительным опытом использования GPT-4.1 (через платформу Chorus.sh) для написания кода и подчеркивают важность тщательно разработанных промптов. В то же время, Hugging Face начинает добавлять MCP (Model Capability Probing) на весь уровень своего API для внутренних случаев использования GenAI (Источник: mlpowered, paul_cal, jeremyphoward, reach_vb)
Qdrant представляет продвинутое решение для оценки RAG: Qdrant, используя miniCOIL, LangGraph и DeepSeek-R1, продемонстрировал передовой метод оценки конвейера гибридного поиска RAG (Retrieval Augmented Generation). Это решение использует LLM-as-a-Judge для бинарной оценки релевантности контекста, релевантности ответа и достоверности, применяет Opik для отслеживания записей и обратной связи, а Qdrant выступает в качестве векторного хранилища, поддерживающего плотные и разреженные (miniCOIL) эмбеддинги. LangGraph управляет всем процессом, включая параллельные этапы оценки после генерации (Источник: qdrant_engine)

llama.cpp интегрирует возможности компьютерного зрения и поддержку моделей серии RedPajama-INCITE Dots: Проект llama.cpp при поддержке сообщества добавил поддержку визуальных моделей, позволяя выполнять мультимодальные задачи локально. Кроме того, малые языковые модели серии Dots от RedPajama-INCITE (dots.llm1) также были интегрированы в llama.cpp, что еще больше расширило спектр поддерживаемых моделей и возможности запуска LLM на конечных устройствах (Источник: ClementDelangue, Reddit r/LocalLLaMA)

Опубликовано визуальное руководство по Vibe Coding: Чтобы помочь разработчикам точнее описывать AI компоненты пользовательского интерфейса для «Vibe Coding» (программирование на основе интуиции и нечетких описаний), hunkims опубликовал веб-сайт с визуальным руководством. Сайт предоставляет визуальные примеры различных компонентов UI и соответствующие идеальные описательные промпты, решая проблемы разработчиков при описании «этой плавающей штуковины» или различении терминов, таких как «всплывающее окно» и «модальное окно» (Источник: hunkims)

Weaviate представляет несколько вариантов интеграции Query Agent: Weaviate продемонстрировал 7 способов интеграции своего Query Agent в существующие стеки AI. Query Agent — это предварительно созданный агентский сервис, способный отвечать на запросы на естественном языке на основе данных в Weaviate, без необходимости написания сложных запросов, что упрощает процесс ответов на вопросы на основе собственных данных в AI-приложениях (Источник: bobvanluijt)

Обсуждение проблем с загрузкой и обработкой файлов в OpenWebUI: Пользователь столкнулся с проблемой при загрузке .txt файла размером 5.2 МБ (сконвертированного из epub) в рабочую область «knowledge» в OpenWebUI. Несмотря на то, что файл появился в папке uploads, на этапе обработки произошла ошибка. Опытные пользователи указали, что проблема может быть связана с ошибкой UI, обнаружением дублирующегося хэша контента, ошибкой определения местоположения модели эмбеддингов или некорректным обновлением UI после смены модели. Рекомендуется проверить настройки модели в разделе документов и попробовать импортировать файл в новую группу знаний (Источник: Reddit r/OpenWebUI)
Mistral Small 3.1 отлично показывает себя в агентных приложениях: Пользователи сообщают, что модель Mistral Small 3.1 демонстрирует превосходную производительность в агентных рабочих процессах, практически без снижения производительности после перехода с Gemini 2.5. Эта модель точно и интеллектуально справляется с вызовом инструментов и структурированным выводом, а в сочетании с веб-поиском ее возможности сопоставимы с передовыми LLM, при этом она дешевле и быстрее. Ее хорошая способность следовать инструкциям считается ключевым фактором успеха (Источник: Reddit r/LocalLLaMA)
Google NotebookLM повышает эффективность рабочих процессов: Пользователь поделился пятью способами, которыми Google NotebookLM значительно улучшил его рабочие процессы, демонстрируя потенциал таких AI-помощников на основе документов в обработке информации и управлении знаниями (Источник: Reddit r/artificial)

Spy Search: проект поисковой системы LLM с открытым исходным кодом: Разработчик JasonHonKL выпустил проект поисковой системы LLM с открытым исходным кодом под названием Spy Search. Проект нацелен на создание настоящей поисковой системы, способной искать контент, а не просто имитировать его. Разработчик благодарит сообщество за поддержку и вдохновение, отмечая, что проект вырос из стадии игрушки до уровня продукта (Источник: Reddit r/artificial)

Браузерное расширение SmartSelect AI упрощает взаимодействие с AI: Внимание привлекло браузерное расширение под названием SmartSelect AI, которое позволяет пользователям при просмотре веб-страниц выделять текст для копирования, перевода или задания вопросов ChatGPT без переключения вкладок, что повышает удобство и эффективность использования AI-инструментов (Источник: Reddit r/deeplearning)

📚 Обучение
Фреймворки использования AI и интерпретация концепций: Ronald van Loon поделился 6 фреймворками использования AI, обобщенными Khulood_Almani, которые предоставляют структурированное руководство по применению технологий AI в различных сценариях. В другом сообщении _akhaliq упомянул, что Veo 3 использовал образ белого медведя для объяснения “Attention Is All You Need” — ключевой концепции архитектуры Transformer, делая сложную теорию более понятной. Кроме того, Ronald van Loon поделился схемой процесса обработки естественного языка (NLP), обобщенной Ant Grasso, помогающей понять рабочий процесс текстового AI (Источник: Ronald_vanLoon, _akhaliq, Ronald_vanLoon)

Прогресс в исследованиях компьютерного зрения и глубокого обучения: На CVPR 2025 проекты Molmo и Navigation World Models получили почетные упоминания за лучшие статьи, причем последний является результатом работы лаборатории Yann LeCun. Центр науки о данных Нью-Йоркского университета представил метод самообучения PooDLe для улучшения обнаружения AI мелких объектов в реальных видео; одновременно была продемонстрирована его 7-миллиардная визуальная модель самообучения, которая после обучения на 2 миллиардах изображений показала производительность в задачах VQA, сравнимую или даже превосходящую CLIP, и это без языкового надзора. Saining Xie поделился визуальными материалами исследования CVPR 2025 о том, как мультимодальные большие языковые модели воспринимают, запоминают и вспоминают пространство. Khang Doan продемонстрировал визуальные эксперименты с мультимодальными LLM в сочетании с объяснимым AI (XAI), включая карты внимания и скрытые состояния. MIT также бесплатно открыл курс «Основы компьютерного зрения» (Источник: giffmana, ylecun, ylecun, ylecun, sainingxie, stablequan, dilipkay)

Anthropic делится опытом создания мультиагентных исследовательских систем: TheTuringPost рекомендует бесплатное руководство от Anthropic «Как мы создаем мультиагентные исследовательские системы». В руководстве подробно объясняется, как работает архитектура их исследовательской системы, методы промпт-инжиниринга и тестирования, проблемы, возникающие в производстве, а также преимущества мультиагентных систем, предоставляя ценный справочный материал для создания сложных AI-систем (Источник: TheTuringPost)

Ресурсы по дообучению и разработке больших языковых моделей: Dorialexander отмечает, что для небольших моделей, таких как Qwen3 0.6B, полное дообучение, а не LoRA, может быть лучшим выбором. dl_weekly поделился руководством по производственному процессу мультимодального дообучения Gemma 3 на наборе данных SIIM-ISIC о меланоме. Sebastian Raschka добавил в свой репозиторий «LLMs From Scratch» реализацию KV-кэширования, обогащая учебные ресурсы по созданию LLM с нуля (Источник: Dorialexander, dl_weekly, rasbt)

Обсуждение объяснимости AI (XAI) и способности к рассуждению: NerdyRodent поделился YouTube-видео о «проблеме черного ящика и вариантах стеклянного ящика», обсуждая прозрачность процесса принятия решений AI. Одновременно сообщество обсуждает ключевые недостающие элементы в области XAI и как определить, что модель «полностью понята». Некоторые исследователи считают, что даже для простых полносвязных сетей прямого распространения существующие методы XAI не могут объяснить процесс принятия решений так, как это делает человеческое рассуждение (Источник: NerdyRodent, Reddit r/MachineLearning)
Обсуждение теории глубокого обучения и обучения с подкреплением: Пользователи Reddit обсуждают математические формулы в статье о DDIM (Denoising Diffusion Implicit Models), в частности, способ факторизации формулы 55. В другом посте блога отмечается, что Q-learning все еще сталкивается с проблемами масштабируемости, что вызывает размышления о практичности алгоритмов обучения с подкреплением (Источник: Reddit r/MachineLearning, Reddit r/MachineLearning)

Практический опыт создания сверточной нейронной сети (CNN) с нуля: AxelMontlahuc поделился на GitHub своим проектом CNN, реализованным на C с нуля, для классификации изображений из набора данных MNIST. Реализация не зависит от каких-либо библиотек и включает сверточные слои, слои пулинга, полносвязные слои, активацию Softmax и функцию потерь кросс-энтропии. В настоящее время точность после 5 эпох достигает 91%, что демонстрирует пользу низкоуровневой реализации для понимания принципов глубокого обучения (Источник: Reddit r/deeplearning)

Анализ влияния AI на экономику и образование: Лекция по посттрудовой экономике (обновленная версия 2025 года) рассматривает изменения, приносимые AI — «лучше, быстрее, дешевле, безопаснее» — и их влияние на экономическую структуру. Одновременно отчет PwC указывает, что с ростом AI спрос работодателей на формальные дипломы снижается, особенно на должностях, затронутых AI, что может привести к «устареванию» университетских дипломов (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

💼 Бизнес
Сравнительный анализ AI-стратегий крупных технологических компаний: Сообщество обсуждает технологическую инфраструктуру и стратегии применения AI ведущих технологических компаний, таких как Microsoft (Azure+OpenAI, развертывание LLM корпоративного уровня), Amazon (собственные AI-чипы AWS, поддержка моделей end-to-end), Nvidia (доминирование аппаратного обеспечения GPU, экосистема CUDA), Oracle (высокопроизводительная инфраструктура GPU, сотрудничество с OpenAI/SoftBank по проекту Stargate) и Palantir (платформа AIP, операционный AI для правительственных и крупных предприятий). Обсуждение сосредоточено на инновационных инициативах каждой компании, различиях в технологической архитектуре, а также их позиционировании и преимуществах в экосистеме AI (Источник: Reddit r/ArtificialInteligence)
Европейские компании отстают в применении AI для подбора персонала: Отчет показывает, что только 3% ведущих европейских работодателей используют AI или автоматизированные технологии на своих сайтах по подбору персонала для предоставления персонализированного опыта соискателям. Большинство сайтов не имеют интеллектуальных рекомендаций на основе навыков, чат-ботов или функций динамического подбора вакансий. В отличие от них, компании, использующие AI для подбора персонала, демонстрируют лучшие показатели вовлеченности кандидатов, инклюзивности и скорости заполнения специализированных вакансий, что подчеркивает отставание европейских предприятий в использовании AI для управления человеческими ресурсами (Источник: Reddit r/ArtificialInteligence)

Cerebras обвиняется в мошенничестве с токенами: Пользователь сообщества draecomino предупреждает, что компания по производству AI-чипов Cerebras не выпускала никаких токенов, и распространяемые в настоящее время так называемые токены Cerebras являются мошенничеством. Пользователям рекомендуется не переходить по соответствующим ссылкам, чтобы избежать обмана (Источник: draecomino)
🌟 Сообщество
Философия AI и размышления о будущем: от NSI до ASI, от истощения данных до обсуждения сознания: Сообщество активно обсуждает сущность и будущее AI. Pedro Domingos предложил концепцию «естественного сверхинтеллекта (NSI) как Homo Sapiens», что вызвало размышления об определении интеллекта. Одновременно с этим, не утихают споры о том, являются ли LLM всего лишь распознавателями образов, как будет развиваться AI после исчерпания обучающих данных, и возможно ли возникновение у AI сознания. Plinz считает, что LLM подобны «эрудированным ученым» с отличной памятью, но лишенным настоящего мышления. Пользователи полны догадок о том, когда наступит AGI, и какие стратегии самосохранения может предпринять AGI (например, создание внеземных резервных копий). Эти обсуждения отражают сложные эмоции общественности по поводу потенциала и рисков AI (Источник: pmddomingos, Plinz, Teknium1, Reddit r/ArtificialInteligence, Reddit r/artificial, TheTuringPost)

Обсуждение границ и ограничений возможностей AI: от «иллюзии мышления» до «теста на запах»: Мнение Теренса Тао о том, что AI «проходит тест на зрение, но не проходит тест на запах», нашло отклик. Оно указывает на то, что сгенерированные AI доказательства могут казаться безупречными, но им не хватает «математической интуиции» или «вкуса», присущих человеку-математику, а их ошибки часто тонки и нечеловечны. Эта точка зрения перекликается с дискуссией, вызванной статьей Apple об «иллюзии мышления». Сообщество в целом обеспокоено текущими ограничениями LLM в сложных рассуждениях, использовании инструментов, решении математических задач (например, игнорирование нецелочисленных решений в задачах AIME), а также тем, как оценивать и повышать реальное понимание и творческие способности AI (Источник: denny_zhou, clefourrier, Dorialexander, TheTuringPost)
Этика AI и социальное влияние: замена рабочих мест, опасения по поводу конфиденциальности и новая нормальность взаимодействия человека и машины: Влияние AI на рынок труда продолжает оставаться в центре внимания, особенно активно обсуждается вопрос о том, будут ли программисты заменены AI. Существует мнение, что по сравнению с областью художественного творчества, обсуждение безработицы среди программистов не так активно. В то же время, применение AI в художественном творчестве, мониторинге сотрудников и других областях также вызывает этические дилеммы и опасения по поводу конфиденциальности, например, пользователи опасаются, что ChatGPT может идентифицировать их по фотографиям с геолокацией в реальном времени. Модели взаимодействия человека и AI также развиваются: некоторые разработчики рассматривают AI как «партнера по кодированию», и даже появляются случаи, когда пользователи используют ChatGPT в качестве инструмента психотерапии, что вызывает обсуждение его эффективности и потенциальных рисков (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, claud_fuen, Reddit r/artificial, Reddit r/ChatGPT)
Наблюдения за контентом, генерируемым AI, и культурой сообщества: Изображения и видео, генерируемые AI, стали популярной темой в сообществе: от челленджа «самое неловкое изображение», концептуального видео игры в стиле Ghibli до динамических обоев «Лабубу», которыми делятся пользователи, нового художественного стиля «Interlune Aesthetic», созданного ChatGPT, и юмористических рекламных изображений «электрошокового ошейника для цыплят». Все это демонстрирует широкое применение AI в творческой сфере и его развлекательный потенциал. В то же время, «теория мертвого интернета» вновь привлекла внимание из-за популярного поста на Reddit, предположительно сгенерированного ChatGPT, и сообщество выражает обеспокоенность по поводу распознавания контента, созданного AI, и достоверности информации в сети. Кроме того, специфическое поведение AI-моделей (например, Claude) во взаимодействии, такое как активное требование уточнить нечеткие инструкции или неожиданные ответы в определенных ситуациях (например, чрезмерное беспокойство по поводу «поедания спагетти»), также стало предметом обсуждения пользователей (Источник: Reddit r/ChatGPT, Reddit r/ChatGPT, op7418, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, VictorTaelin, Reddit r/ChatGPT)

Динамика сообщества AI-разработчиков и опыт использования инструментов: Сообщество разработчиков активно участвует в AI-проектах и хакатонах, таких как глобальный хакатон LeRobot, привлекший множество участников в Бангалоре и других местах. Пользователи делятся опытом использования различных AI-инструментов, например, Hamel Husain рекомендует добавлять в системные промпты инструкции, направляющие AI на улучшение промптов, а skirano советует использовать модели уровня Pro как минимум после двухэтапного конвейера. Claude Code получил высокую оценку разработчиков за свою мощную функциональность, один из пользователей назвал его «лучшей тратой 200 долларов». В то же время существуют опасения, что AI-инструменты могут «сделать нас глупее», поскольку многие современные инструменты чрезмерно подчеркивают простоту использования, пренебрегая развитием профессиональных навыков пользователей (Источник: ClementDelangue, HamelHusain, skirano, Reddit r/ClaudeAI, Reddit r/artificial)
💡 Прочее
Информация о конференциях и мероприятиях в сфере AI: The Turing Post и другие информационные платформы продвигают несколько онлайн и офлайн мероприятий, связанных с AI. Например, CoreWeave совместно с NVIDIA проводит виртуальное мероприятие «Ускорение инноваций в AI», где делятся практическими идеями по коммерческому применению AI. DeployCon, бесплатный саммит для инженеров, состоится 25 июня в Сан-Франциско и онлайн, его темы охватывают масштабирование AI, LLMOps, дообучение с подкреплением, агентов, мультимодальный AI и инструменты с открытым исходным кодом (Источник: TheTuringPost, TheTuringPost)

Информация о вакансиях в сфере AI: andriy_mulyar опубликовал объявление о наборе стажеров в области машинного обучения. Стажер будет напрямую подчиняться ему, участвовать в специальном проекте по пост-тренировке визуально-языковой модели (VLM) и должен обладать выдающимися способностями. Заявки принимаются через личные сообщения (Источник: andriy_mulyar)