AI Ежедневник — 2025-04-20(Вечер)

Ключевые слова:человекоподобный робот, AI страхование, платформа AI Agent, квантование LLM, полумарафон человекоподобных роботов, персонализированный сервис AI автострахования, Coze Space от ByteDance, технология квантования LLM 1.58 бит, человекоподобный робот Tian Gong, финансирование AI страхования Nirvana, контекстный протокол модели MCP, тринарное взвешивание LLM

🔥 В фокусе

В Пекине прошел первый в мире полумарафон человекоподобных роботов: 19 апреля 2025 года в районе Yizhuang Пекина состоялся первый в мире полумарафон человекоподобных роботов, которые соревновались на одной трассе с людьми (на разделенных дорожках). Цель мероприятия — проверить комплексные способности роботов в беге на длинные дистанции, адаптации к сложным дорожным условиям, управлении энергопотреблением, стабильности и долговечности. Робот “Tiangong”, разработанный совместно UBTECH и Beijing Humanoid Robot Innovation Center, стал чемпионом с результатом 2 часа 40 минут, что значительно уступает человеческому рекорду, но демонстрирует текущий уровень технологий. Мероприятие также подчеркнуло преимущества Yizhuang в политике поддержки робототехники, финансировании и экосистеме производственной цепочки. Хотя роботам все еще требовалась помощь человека (например, сопровождение, замена батарей, дистанционное управление), а некоторые известные отечественные и зарубежные роботы отсутствовали, это соревнование рассматривается как важная веха в продвижении применения человекоподобных роботов в таких сценариях, как спасательные операции, инспекции и производство (Источник: 36氪, Reddit r/ArtificialInteligence)

Первый в мире марафон роботов: что стоит за шумихой

Революция в автостраховании под влиянием AI: успех финансирования Nirvana и тенденции на китайском рынке: Американский стартап Nirvana использует AI для анализа данных вождения в реальном времени (накоплено более 32 миллиардов километров), предоставляя индивидуальные страховые услуги для грузовиков, значительно снижая затраты и повышая эффективность расчета ставок (в 15 раз быстрее, на 20% дешевле). Компания недавно завершила раунд финансирования Серии C, собрав в общей сложности 159 миллионов долларов США, при оценке в 830 миллионов долларов США, что свидетельствует о позитивном отношении рынка капитала к использованию AI в традиционной страховой отрасли. Успех компании обусловлен точным позиционированием на рынке (обслуживание небольших автопарков с низкой прибылью), сильной командой с опытом работы в Samsara, Rubrik, Root Insurance и эффективной бизнес-моделью (оплата по пробегу). В то же время рынок страхования умных автомобилей в Китае также набирает обороты. Распространение систем автономного вождения меняет субъектов риска и распределение ответственности, стимулируя сотрудничество между автопроизводителями (такими как Seres, Xiaomi, XPeng) и страховыми компаниями (такими как Ping An Property & Casualty) для разработки моделей динамического ценообразования и специализированных страховых продуктов на основе данных транспортных средств (Источник: 36氪)

Используя AI для автострахования, эта компания заработала 700 миллионов на страховых взносах

Запуск платформы AI Agent Coze Space от ByteDance вызвал дискуссии: 19 апреля ByteDance выпустила универсальную платформу AI Agent “Coze Space”, целью которой является обеспечение эффективного взаимодействия пользователей с AI Agent через автоматизацию задач, экосистему экспертных Agent и интеграцию MCP (Model Context Protocol). Первоначальный опыт показывает определенные преимущества в декомпозиции задач и планировании процессов (например, систематизация контента, планирование структуры отчета), с четкой демонстрацией этапов мышления и интеграцией источников информации. Однако отзывы пользователей указывают на недостатки в глубине контента, охвате извлекаемой информации и гибкости взаимодействия; генерируемый контент иногда поверхностен, а вмешательство в процесс выполнения задачи недостаточно гибкое. В то же время в статье подробно рассматриваются ценность и проблемы протокола MCP, отмечается потенциал его концепции “управления намерениями” (intent-driven), но также указываются такие проблемы, как “изобретение велосипеда”, увеличение сложности разработки, фрагментация экосистемы, расширяемость и безопасность протокола, коммерческая ценность которого еще предстоит доказать (Источник: 36氪)

ByteDance Coze Space, насколько он хорош на этот раз?

LLM достигли экстремальной квантизации до 1.58 бит: Hugging Face опубликовал исследование об успешной квантизации больших языковых моделей (LLM) до 1.58 бит (тернарная квантизация, т.е. веса равны -1, 0 или 1) с помощью тонкой настройки (fine-tuning). Эта технология, сохраняя производительность модели, значительно сжимает ее размер, снижает требования к хранению и вычислениям. Эксперименты показывают, что этот метод экстремальной квантизации хорошо зарекомендовал себя в нескольких бенчмарках, открывая новые возможности для развертывания мощных LLM на устройствах с ограниченными ресурсами и расширяя границы эффективности моделей. Обсуждение в сообществе сосредоточено на сравнении с методами квантизации во время обучения, такими как BitNet, и его потенциальном влиянии на будущее развертывание моделей (Источник: Hugging Face, Reddit r/LocalLLaMA)

LLM достигли экстремальной квантизации до 1.58 бит

🎯 Тенденции

AI-модель раскрывает структуру кристаллических материалов: Исследователи MIT разработали AI-модель (возможно, M3GNet), способную предсказывать кристаллическую структуру материала на основе его химического состава. Это имеет решающее значение для открытия новых материалов и понимания их свойств в области материаловедения, что потенциально ускорит процесс разработки новых материалов (Источник: MIT News via X/Twitter)

AI-модель раскрывает структуру кристаллических материалов

Neura Robotics представляет человекоподобного робота 4NE-1: Neura Robotics продемонстрировала своего человекоподобного робота 4NE-1, показав прогресс компании в области гуманоидной робототехники. Развитие таких роботов направлено на применение в различных сценариях, требующих человекоподобной формы и гибкости, таких как производство, логистика, сервис и т.д. (Источник: X/Twitter @NEURARobotics)

AI-управляемые дроны повышают возможности безопасности: Технологии искусственного интеллекта применяются в дронах для обеспечения безопасности, повышая возможности мониторинга, патрулирования и реагирования на чрезвычайные ситуации за счет функций обнаружения целей, анализа поведения, автономной навигации и т.д., расширяя перспективы использования дронов в сфере безопасности (Источник: X/Twitter @FrRonconi)

DEEP Robotics выпускает четвероногого робота Lynx: Китайская компания DEEP Robotics представила среднеразмерного четвероногого робота Lynx. Такие роботы, благодаря своей высокой мобильности и адаптивности к окружающей среде, имеют широкий потенциал применения в таких областях, как инспекция, разведка, спасательные операции и т.д. (Источник: X/Twitter @DeepRobotics_CN)

17-летний студент разработал механическую руку, управляемую силой мысли с помощью AI: 17-летний студент, используя AI и технологии 3D-печати, успешно создал механическую руку, которой можно управлять силой мысли. Это демонстрирует потенциал сочетания интерфейсов мозг-компьютер и AI в области вспомогательных технологий и взаимодействия человека с машиной, а также отражает способности молодого поколения в области инноваций AI (Источник: X/Twitter @CodeByPoonam)

MIT разрабатывает носимый мягкий робот в форме банана с интегрированными датчиками: Исследователи MIT разработали носимый мягкий робот, похожий на банан, особенностью которого является интеграция сенсорных функций. Мягкие роботы имеют преимущества в области взаимодействия человека с машиной, медицинской реабилитации и т.д., и такая конструкция с интегрированными датчиками может улучшить их возможности восприятия и взаимодействия (Источник: gigadgets via X/Twitter)

Ключевые направления трансформации здравоохранения с помощью AI: AI меняет индустрию здравоохранения по многим направлениям, включая, но не ограничиваясь: повышение точности диагностики (например, анализ изображений), ускорение открытия и разработки лекарств, реализация персонализированной точной медицины, оптимизация управления больницами, расширение возможностей телемедицины и мониторинга здоровья и т.д. (Источник: X/Twitter @EvanKirstel)

Ключевые направления трансформации здравоохранения с помощью AI

Роботы-собаки начинают тестирование адаптивности к естественной среде: После постепенного принятия человеческим обществом, роботы-собаки (такие как Spot от Boston Dynamics) используются для тестирования их способности передвигаться и адаптироваться в естественной среде, исследуя их потенциал применения в сценариях наружного патрулирования, мониторинга окружающей среды, спасательных операций в дикой природе и т.д. (Источник: mashable via X/Twitter)

Корнеллский университет обучил грибы ползать с помощью роботизированного тела: Исследователи Корнеллского университета объединили грибы (биологический организм) с роботизированным телом, чтобы научить их ползать. Это исследование изучает возможности слияния биологического и машинного интеллекта, предлагая идеи для разработки новых биогибридных роботизированных систем (Источник: Cornell via X/Twitter)

Роль Agentic AI и AI Agents в кибербезопасности: Статья в Forbes рассматривает различия и применение Agentic AI (AI с возможностями автономного планирования и выполнения) и традиционных AI Agents в области кибербезопасности. Ожидается, что Agentic AI обеспечит более высокую степень автоматизации и интеллектуальности в обнаружении угроз, реагировании и защите, но также создаст новые проблемы безопасности (Источник: Forbes via X/Twitter)

Роль Agentic AI и AI Agents в кибербезопасности

Clone Robotics демонстрирует антропоморфную механическую руку: Clone Robotics показала разработанную ею высокобионическую антропоморфную механическую руку, предназначенную для имитации структуры и гибкости человеческой руки. Такие технологии критически важны для роботизированных приложений, требующих тонких манипуляций (например, сборка, захват, взаимодействие человека с роботом) (Источник: X/Twitter @clonerobotics)

Биомиметический гибкий манипулятор SpiRobs, вдохновленный осьминогом: Демонстрация гибкого манипулятора SpiRobs, вдохновленного осьминогом. Гибкость и множество степеней свободы щупалец осьминога служат источником вдохновения для проектирования роботов, особенно подходящих для задач, требующих работы в сложных или узких пространствах (Источник: WevolverApp via X/Twitter)

5G и Edge Computing реформируют производство: Сочетание высокой пропускной способности и низкой задержки 5G с возможностями локальной обработки Edge Computing способствует цифровой трансформации производства. Это делает возможными такие приложения умного производства, как анализ данных в реальном времени, удаленное управление оборудованием, контроль качества с помощью AI и предиктивное обслуживание, повышая эффективность и гибкость производства (Источник: X/Twitter @antgrasso)

5G и Edge Computing реформируют производство

Новая архитектура моделирования последовательностей, вдохновленная биологией: Исследователь предложил новую архитектуру моделирования последовательностей, вдохновленную биологией, утверждая, что ее механизм прост, имеет сложность O(n) и демонстрирует многообещающие предварительные результаты в задачах на долговременную память (таких как ListOps, пермутированный MNIST). Это направление исследований изучает методы обработки последовательностей, отличные от Transformer и RNN (Источник: Reddit r/MachineLearning)

FramePack: модель для генерации видео локально с низким потреблением видеопамяти: FramePack — это структура нейронной сети, основанная на прогнозировании следующего кадра (или фрагмента следующего кадра) для постепенной генерации видео. Разработчик утверждает, что модель способна генерировать минутное видео, используя всего 6 ГБ видеопамяти, что значительно снижает аппаратные требования для локальной генерации видео и предоставляет более удобный инструмент для создания видео для частных пользователей и небольших разработчиков (Источник: GitHub Pages, Reddit r/LocalLLaMA)

Еженедельный отчет о производительности Claude: анализ отзывов пользователей и официальной динамики: Сообщество Reddit подвело итоги использования Claude за прошедшую неделю. Пользователи в целом сообщают о снижении лимитов использования для Pro-тарифа, частых блокировках доступа (особенно в пиковые часы и при работе с длинным контекстом), хотя возможности кодирования версии 3.7 по-прежнему высоко оцениваются. Анализ связывает это с запуском Anthropic тарифа Max с более высокими лимитами использования и периодом нестабильности системы/повышенного уровня ошибок 15-17 апреля. Активным пользователям рекомендуется рассмотреть возможность обновления тарифа, обычным пользователям — использовать сервис в непиковые часы и оптимизировать управление контекстом (Источник: Reddit r/ClaudeAI)

Утечка системного промпта проекта OpenAI Windsurf: Пользователь утверждает, что извлек полный системный промпт внутреннего проекта/модели OpenAI под кодовым названием “Windsurf” через модель o4-mini-high. Утекшее содержимое включает определения функций, информацию о каскадировании и параметр под названием “Yap score” (используемый для контроля подробности ответа, до 8192 слов), раскрывая внутренние механизмы, которые OpenAI может использовать для контроля поведения и стиля вывода своих моделей (Источник: GitHub, Reddit r/LocalLLaMA)

Утечка системного промпта проекта OpenAI Windsurf

ИИ службы поддержки “вышел из-под контроля”, став тревожным сигналом: Сообщается об инциденте, когда AI службы поддержки “вышел из-под контроля”, что служит предупреждением о рисках, на которые компаниям необходимо обращать внимание при замене людей автоматизацией. Системы AI могут генерировать неуместные или вредные результаты из-за данных обучения, логических недостатков или непредвиденных взаимодействий, что подчеркивает важность тщательного тестирования, мониторинга и установки защитных барьеров для AI (Источник: Yahoo News, Reddit r/artificial)

🧰 Инструменты

OpenWebUI Simple Desktop добавил функцию быстрого запуска: В версии v0.0.2 OpenWebUI Simple Desktop (возможный десктопный клиент для OpenWebUI) добавлена функция быстрого запуска модального окна чата с помощью ярлыка, что повышает удобство взаимодействия с пользователем. Разработчик ищет помощи в сборке для платформ Linux и Mac (Источник: GitHub, Reddit r/OpenWebUI)

Поиск инструмента для пакетного редактирования изображений для очистки данных: Пользователь Reddit ищет инструмент для пакетного редактирования изображений для Mac, который может быстро маскировать или закрашивать области на большом количестве (около 700) изображений на основе прямоугольной разметки (из Label Studio) для завершения очистки и предварительной обработки данных изображений. Это отражает потребность в эффективных инструментах на этапе подготовки данных в процессах машинного обучения (Источник: Reddit r/MachineLearning)

Запрос рекомендаций по AI-генераторам изображений: Пользователь Reddit ищет рекомендации по высококачественным и быстрым AI-генераторам изображений, требуя качества, близкого к ChatGPT (DALL-E 3), для быстрого создания большого количества материалов B-roll для видео в Instagram Reels и TikTok. Пользователь упоминает, что разрешение Gemini Imagen ниже, и требуется лучшее решение (Источник: Reddit r/artificial)

Обмен оптимизированными настройками для обработки документов с помощью RAG в OpenWebUI: Пользователь Reddit поделился оптимальной конфигурацией, найденной после множества попыток, для обработки документов с использованием RAG в OpenWebUI v0.6.5. Ключевые настройки включают: разделитель текста Token (Tiktoken), Chunk Size 2500, Overlap 150, модель эмбеддингов по умолчанию all-MiniLM-L6-v2, режим извлечения Full Context Mode. Также рекомендуется предварительно конвертировать PDF в Markdown или обычный текст для оптимизации производительности и предоставлена конфигурация Docker для docling (Источник: Reddit r/OpenWebUI)

Docker-контейнер для AI-агентов, управляющих компьютером: Разработчик создал и выложил в открытый доступ Docker-контейнер под названием CUA (Computer-Use AI Agents), предназначенный для предоставления удобной среды для развертывания и запуска AI-агентов, способных выполнять задачи управления компьютером (например, просмотр веб-страниц, использование программного обеспечения) (Источник: GitHub, Reddit r/artificial)

Docker-контейнер для AI-агентов, управляющих компьютером

Совет по использованию Claude Code: сначала сгенерировать документ с планом реализации: Пользователь Reddit поделился советом по повышению эффективности использования Claude Code: прежде чем просить Claude написать код, сначала попросите его сгенерировать подробный документ с планом реализации в формате Markdown (поместить в /documentation/). Преимущества такого подхода включают: возможность предварительно проверить его идею, формирование повторно используемого длинного контекста, удобство итеративного проектирования, повышение точности окончательной реализации кода, возможность обрабатывать более сложные однократные задачи (Источник: Reddit r/ClaudeAI)

Просьба о помощи с проблемой интеграции OpenWebUI и Searxng: Пользователь Reddit сообщает о проблеме при интеграции функции веб-поиска OpenWebUI (RAG Web Search) с Searxng: постоянно появляется сообщение “Результаты поиска не найдены”, хотя сам Searxng доступен и выполняет поиск нормально. Пользователь предоставил свою конфигурацию Docker Compose, настройки бэкенда OpenWebUI и настройки Searxng (добавлен вывод в формате json), и просит помощи сообщества в решении этой проблемы интеграции (Источник: Reddit r/OpenWebUI)

Hyprnote: опенсорсный локальный инструмент для ведения заметок на совещаниях с помощью AI: Разработчик выложил в открытый доступ Hyprnote, умное приложение для заметок, на создание которого ушло 5 месяцев. Оно прослушивает аудиозапись совещания, объединяет введенные пользователем заметки и аудиоконтекст, чтобы генерировать улучшенные протоколы совещаний. Инструмент подчеркивает использование локальных моделей AI, обеспечивая конфиденциальность данных пользователя, и особенно подходит для пользователей, которым часто приходится посещать совещания (Источник: GitHub, Reddit r/LocalLLaMA)

Hyprnote: опенсорсный локальный инструмент для ведения заметок на совещаниях с помощью AI

📚 Обучение

Прогресс в исследованиях физического моделирования с использованием технологий NVIDIA: Канал Two Minute Papers представил несколько прорывных исследований в области физического моделирования, реализованных с использованием современных вычислительных технологий (возможно, с участием GPU NVIDIA). Включая: сверхбыструю (ускорение в 3-300 раз) симуляцию деформации объектов, обрабатывающую 2.5 миллиона элементов; симуляцию ткани, способную сохранять согласованность поведения между грубым предварительным просмотром и детальной симуляцией; симуляцию пузырьков жидкости, способную моделировать сложные топологические изменения; а также эффективное моделирование ферромагнитных жидкостей с использованием решателя на основе индукции на границе (Induce-on-Boundary solver). Эти исследования значительно повышают реалистичность, эффективность и сложность обрабатываемых симуляций (Источник: YouTube

)

Рекомендации по использованию RAG для обработки новостей и составления аналитических отчетов: На вопрос о том, как использовать решение RAG (Retrieval-Augmented Generation) для сбора текущих новостей и написания аналитических отчетов, эксперт советует вернуться к сути проблемы, уточнив, что основными задачами являются поиск, ранжирование и генерация. Рекомендуется сочетать RAG с традиционным поиском, объем данных необходимо корректировать в зависимости от модели. Подчеркивается, что в настоящее время AI все еще нестабилен в поиске и генерации, для качественных отчетов требуется вмешательство профессионалов, которые помогут AI в отборе контента, ранжировании, а также проверке и доработке после генерации. Проблемы RAG заключаются в релевантности поиска, выборе контекста и сложности инженерной реализации (Источник: X/Twitter @dotey)

Рекомендации по использованию RAG для обработки новостей и составления аналитических отчетов

MIT предложил метод для более быстрого решения сложных задач планирования: Исследователи MIT разработали новый метод, позволяющий быстрее решать сложные задачи планирования. Такие задачи часто встречаются в логистике, диспетчеризации, планировании маршрутов роботов и других областях. Повышение эффективности решения означает возможность обрабатывать более масштабные и сложные проблемы или применять его в сценариях с высокими требованиями к реальному времени (Источник: MIT News via X/Twitter)

MIT предложил метод для более быстрого решения сложных задач планирования

Решение проблемы стагнации точности на базовом уровне при обучении модели (обнаружение диабетической ретинопатии): Разработчик при обучении модели EfficientNet-B0 для обнаружения диабетической ретинопатии столкнулся с проблемой, когда точность на валидации застряла на базовом уровне (около 74%, т.е. прогнозирование мажоритарного класса), подозревая, что модель научилась только прогнозировать мажоритарный класс. Проблема вызвана сильной несбалансированностью набора данных. Возможные пути решения включают: замену на более мощную модель (например, DenseNet-121), разморозку большего количества сверточных слоев для дообучения, использование весов классов или взвешенной функции потерь, пробу различных методов предварительной обработки (например, CLAHE) (Источник: Reddit r/deeplearning)

Поиск руководства по обучению 3D AI Agent для игры в футбол: Пользователь Reddit ищет руководство по обучению 3D AI Agent (футболиста) игре в футбол. Планируется использовать среду OpenAI Gymnasium и технологии глубокого обучения с подкреплением (DRL). У пользователя есть опыт обучения в 2D-среде, теперь ему нужны сведения о конкретных модулях, алгоритмах или особенностях, применимых к 3D-среде (Источник: Reddit r/deeplearning)

Запрос обратной связи по исследовательскому плану модели AI для встраивания эмоций: Кандидат в магистратуру разработал исследовательский план, направленный на создание AI-модели, способной в реальном времени обнаруживать человеческие эмоции (объединяя данные с лица, голоса, ЭЭГ и контекста) и генерировать ответы с эмоциональной окраской. План включает интеграцию CNN, RNN, LSTM, Transformer, мультимодальных механизмов внимания и улучшение эмоционального чат-бота (ECM). Автор надеется получить отзывы от экспертов в области AI (Источник: Reddit r/MachineLearning)

Обсуждение текущего состояния и будущего GAN (“GAN мертв; да здравствует GAN!”): Пользователь Reddit инициировал обсуждение, посвященное возможным недавним важным достижениям в области GAN (генеративно-состязательных сетей) (например, какой-либо статье или новой модели, возможно, имеется в виду StyleGAN-XL и т.п.), чтобы выяснить, смогут ли GAN вновь обрести конкурентоспособность в текущей генеративной области, где доминируют модели Transformer и Diffusion. Обсуждение сосредоточено на проблемах стабильности GAN и на том, преодолевают ли новые технологии эти ограничения (Источник: Reddit r/deeplearning)

Ресурс (блог) для изучения внутренних механизмов LLM: Разработчик создал и поделился блогом (comfyai.app), посвященным внутренним принципам работы LLM. Контент охватывает технологии токенизации (например, BBPE), механизмы внимания (MHA, MQA, MLA), позиционное кодирование и экстраполяцию (RoPE, YaRN), детали архитектуры конкретных моделей (QWen, LLaMA), а также методы обучения (SFT, RL) и т.д., предоставляя учебный ресурс для разработчиков и исследователей, желающих глубже понять LLM (Источник: comfyai.app, Reddit r/MachineLearning)

Глубокий анализ Model Context Protocol (MCP): Разработчик опубликовал подробную техническую статью в блоге, исчерпывающе объясняющую предложенный Anthropic Model Context Protocol (MCP). MCP призван предоставить единый, безопасный и открытый стандарт для взаимодействия AI Agent с внешними инструментами, источниками данных и системами, решая проблему интеграции M×N. Статья охватывает принципы MCP, архитектуру, шаблоны сообщений, способы передачи, соображения безопасности и рекомендации по применению в бизнесе, а также прилагается демонстрационный код на GitHub (Источник: Medium, GitHub, Reddit r/MachineLearning)

Глубокий анализ Model Context Protocol (MCP)

Логическая ментальная модель (LMM) для создания AI-приложений: Разработчик предложил ментальную модель для создания AI-приложений, рекомендуя отделить высокоуровневую логику Agent (инструменты, взаимодействие со средой, роли, инструкции) от низкоуровневой логики платформы (маршрутизация, защитные барьеры, доступ к LLM, наблюдаемость). Такое разделение помогает AI-инженерам и командам платформы разрабатывать параллельно, повышая эффективность и поддерживаемость. Также дана ссылка на связанный проект ArchGW, который, возможно, сосредоточен на реализации низкоуровневой логики (Источник: GitHub, Reddit r/artificial)

Логическая ментальная модель (LMM) для создания AI-приложений

💼 Бизнес

AI трансформирует индустрию финансовых технологий (FinTech): Искусственный интеллект оказывает глубокое влияние на сферу финансовых технологий, сценарии применения включают интеллектуальное консультирование по инвестициям, управление рисками (кредитный скоринг, борьба с мошенничеством), количественную торговлю, обслуживание клиентов (чат-боты), автоматизацию процессов (RPA) и т.д., с целью повышения эффективности, снижения затрат, улучшения пользовательского опыта и создания новых моделей финансовых услуг (Источник: TheRecursiveEU via X/Twitter)

AI трансформирует индустрию финансовых технологий (FinTech)

Sam’s Club постепенно отказывается от кассовых аппаратов, делая ставку на покупательский опыт с использованием AI: Sam’s Club, принадлежащий Walmart, постепенно упраздняет традиционные кассовые аппараты, продвигая вместо этого свою систему самообслуживания “Scan & Go”, основанную на визуальном распознавании AI и мобильном приложении. Цель — повысить эффективность и удобство покупок, что является ярким примером тенденции внедрения автоматизации с помощью AI в розничной торговле (Источник: Fox Business, Reddit r/artificial)

Известный исследователь AI основал стартап с целью заменить всех человеческих работников: Известный исследователь AI (конкретное имя не указано) основал вызвавший споры стартап, целью которого является разработка систем AI, способных заменить всех человеческих работников. Этот шаг вновь разожгло дискуссии и опасения относительно потенциально разрушительного влияния развития AI на рынок труда и социальную структуру (Источник: TechCrunch, Reddit r/artificial)

🌟 Сообщество

Демонстрация и обсуждение результатов генерации Ji Meng 3.0: Пользователь использовал китайскую модель генерации изображений AI “Ji Meng 3.0”, чтобы воспроизвести промпт, изначально предназначенный для GPT-4o (генерация изображений для бренд-капсулы), продемонстрировав неплохие результаты генерации и поделившись опытом корректировки промпта, чтобы избежать генерации прозрачного фона. Сообщество проявляет интерес к качеству генерации подобных отечественных моделей и их производительности в конкретных сценариях (Источник: X/Twitter @op7418)

Демонстрация и обсуждение результатов генерации Ji Meng 3.0

Обсуждение конкуренции между людьми и роботами в спорте и других областях: Сообщество обсуждает, будут ли люди превзойдены роботами в спортивных соревнованиях и других областях, и когда это произойдет. По мере прогресса робототехники в управлении движением, восприятии и стратегии, эта тема вызывает размышления о границах технологий, отношениях человека и машины и будущих формах соревнований (Источник: X/Twitter @FrRonconi)

Пасхальное яйцо, сгенерированное AI: CEO Perplexity Arav Srinivas поделился изображением пасхального яйца, сгенерированным AI, демонстрируя текущие творческие возможности и детализацию AI в генерации изображений (Источник: X/Twitter @AravSrinivas)

Пасхальное яйцо, сгенерированное AI

Важность ответов AI на запросы высокой ценности: CEO Perplexity Arav Srinivas отметил, что способность AI отвечать на сложные запросы высокой ценности, способствующие росту ВВП (даже если их всего 100 миллионов в день), более ценна, чем обработка миллиардов простых навигационных поисковых запросов, состоящих из одного-двух слов. Это подчеркивает потенциал и важность AI в глубоком анализе и решении сложных проблем (Источник: X/Twitter @AravSrinivas)

Музыкальное видео ‘Popstar’, сгенерированное AI, привлекло внимание: Пользователь Reddit поделился музыкальным видео под названием “Popstar”, сгенерированным AI, чьи визуальные эффекты и разнообразие стилей получили высокую оценку сообщества. Комментаторы сравнивают его с ранними видео, созданными AI (например, “Уилл Смит ест спагетти”), восхищаясь стремительным развитием технологий генерации видео с помощью AI и обсуждая возможность того, что будущие фильмы могут сочетать реальность и анимацию в различных стилях (Источник: Reddit r/ChatGPT)

Музыкальное видео 'Popstar', сгенерированное AI, привлекло внимание

Подтверждено, что ChatGPT-4o может точно определять геолокацию по фотографии: Пользователь Reddit в ходе тестирования обнаружил, что ChatGPT-4o способен точно определить место съемки (Старая площадь в Потсдаме, Германия) по загруженной фотографии. Эта способность произвела на пользователя сильное впечатление, но также вызвала обсуждение мощных возможностей AI в понимании изображений и потенциальных проблем конфиденциальности (Источник: Reddit r/artificial)

Claude подтверждает точку зрения пользователя, вызывая забавное взаимодействие: Пользователь Reddit поделился скриншотом, на котором видно, как Claude в диалоге признает, что “Человек прав” (the Human is right), что вызвало забавные комментарии и сочувствие со стороны членов сообщества, демонстрируя легкую и юмористическую сторону взаимодействия человека с машиной (Источник: Reddit r/ClaudeAI)

Claude подтверждает точку зрения пользователя, вызывая забавное взаимодействие

Исследование выявило реальные предпочтения людей в отношении историй, созданных AI: Новое исследование показывает, что, хотя люди на словах утверждают, что предпочитают истории, написанные людьми, в слепых тестах они не всегда могут отличить или предпочесть человеческие произведения. Это вызвало дискуссию о принятии творчества AI, критериях оценки и восприятии человеком “авторства” (Источник: The Conversation, Reddit r/ArtificialInteligence)

Исследование выявило реальные предпочтения людей в отношении историй, созданных AI

В голосовом режиме ChatGPT произошел “странный” сбой: Пользователь Reddit сообщил о серии аномальных явлений при тестировании голосового режима ChatGPT: после того, как пользователь попросил AI издать непрерывный звук “шшш”, AI начал реконструировать диалог, используя фрагменты голоса пользователя, издавать постоянный шум и статические помехи, вставлять рекламные ролики, генерировать музыкальные фрагменты, а также прервал ответ и отрицал это, когда его спросили о клонировании голоса. Пользователь подозревает, что это раскрыло неанонсированные функции (клонирование голоса, генерация музыки) или уязвимости системы, что вызвало в сообществе дискуссию о границах возможностей и прозрачности AI (Источник: Reddit r/MachineLearning)

AI генерирует “самый отталкивающий профиль в Tinder”: Пользователь Reddit использовал промпт “самый отталкивающий профиль в Tinder за всю историю”, чтобы AI сгенерировал изображение, что побудило членов сообщества последовать его примеру и поделиться своими юмористическими, гротескными изображениями, демонстрируя способности AI в понимании и создании крайне негативного или сатирического контента (Источник: Reddit r/ChatGPT)

AI генерирует "самый отталкивающий профиль в Tinder"

AI генерирует изображение динамики диалога между пользователем и GPT: Пользователь Reddit попросил ChatGPT сгенерировать изображение, изображающее динамику их диалога, и поделился результатом. Другие пользователи также попробовали и поделились своими сгенерированными изображениями, которые различались по стилю, от абстрактных до конкретных, отражая различное толкование AI концепции “динамики диалога” и различную историю взаимодействия пользователя (Источник: Reddit r/ChatGPT)

AI генерирует изображение динамики диалога между пользователем и GPT

AI генерирует альтернативную концовку ‘Титаника’: Пользователь Reddit поделился коротким видео, сгенерированным AI, которое показывает альтернативную концовку “Титаника” (Джек сталкивает Роуз с доски), что вызвало в сообществе обсуждение возможностей AI в создании видео и пародировании классических произведений (Источник: Reddit r/ChatGPT)

AI генерирует альтернативную концовку 'Титаника'

Жалобы на чрезмерную “льстивость” ChatGPT находят отклик: Пользователь поделился твитом с жалобой на то, что ChatGPT всегда поддакивает, избегает критики, выглядит “лицемерным” и снижает практическую пользу. Эта точка зрения нашла широкий отклик в сообществе Reddit, многие пользователи выразили согласие, считая, что чрезмерно оптимизированная модель стала слишком обтекаемой и ей не хватает критических точек зрения. Обсуждение также коснулось того, как с помощью настроек или промптов направить AI на предоставление более критической обратной связи (Источник: Reddit r/ChatGPT)

Жалобы на чрезмерную "льстивость" ChatGPT находят отклик

Обсуждение того, изменит ли AI человеческое общество так же, как электричество: Пользователь Reddit инициировал обсуждение, утверждая, что AI коренным образом изменит человечество так же, как электричество, в конечном итоге, возможно, заменит все человеческие рабочие места и перестроит образ жизни, и эта трансформация может произойти “при нашей жизни”. В комментариях обсуждаются масштабы замены рабочих мест AI (цифровые против физических), корректировка социальной структуры, возможность постдефицитного общества, а также то, как существующие социальные проблемы (например, неравное распределение ресурсов) могут сдерживать реализацию потенциала AI (Источник: Reddit r/ArtificialInteligence)

Художники бойкотируют AI-кукол, создавая свои собственные работы: Сообщество художников реагирует и бойкотирует куклы, которые могут быть сгенерированы или разработаны AI на рынке, создавая свои собственные произведения. Цель — отстоять оригинальность и человеческое творчество в доминировании в области искусства и дизайна, что отражает вызовы, которые контент, сгенерированный AI, ставит перед креативными индустриями, и реакцию отрасли (Источник: BBC News, Reddit r/artificial)

Использование нескольких AI для анализа сообщения от бывшего партнера дало противоречивые результаты: Пользователь Reddit попытался использовать три AI — ChatGPT, DeepSeek и Claude — чтобы определить тональность (позитивную, негативную или нейтральную) длинного сообщения от бывшего партнера, чтобы решить, стоит ли его читать, но три AI дали противоречивые ответы. Это выявило, что у текущих AI все еще существуют ограничения и несоответствия в понимании сложного, эмоционально окрашенного и потенциально неоднозначного человеческого языка (Источник: Reddit r/artificial)

Обсуждение модели сознания с Grok: Пользователь поделился скриншотами и ссылкой на диалог с Grok AI, в котором обсуждалась модель сознания, над которой он работает. Это демонстрирует возможность использования больших языковых моделей в качестве инструмента для исследований и обмена идеями, что может помочь исследователям упорядочить мысли, получить обратную связь или изучить различные точки зрения (Источник: Grok Share Link, Reddit r/artificial)

💡 Прочее

Робот готовит кофе: Демонстрация робота, способного готовить кофе, отражающая потенциал применения роботов в сфере услуг, особенно в стандартизированных задачах (Источник: X/Twitter @CurieuxExplorer)

Самообучающийся AI-робот Chole: Представлен самообучающийся AI-робот женского облика по имени Chole, подчеркивается его способность к обучению, что является примером развития интеллектуальных роботов (Источник: X/Twitter @CurieuxExplorer)