AI Ежедневник - 2025-04-19(Вечер)

Ключевые слова：человекоподобный робот, AI суперкомпьютер, модель OpenAI, модель Gemini, полумарафон человекоподобных роботов, чип NVIDIA Blackwell, уровень галлюцинаций OpenAI o3, физическое моделирование Gemini 2.5 Pro, курс по AI-браузерным агентам, влияние квантовых вычислений на науку, управление механической рукой через нейроинтерфейс, поведение NPC в играх на основе GNN

🔥 В фокусе

Состоялся первый в мире полумарафон для гуманоидных роботов: На первом в мире полумарафоне для гуманоидных роботов, прошедшем в Ичжуане (Пекин), робот Tiangong 1.2max первым пересек финишную черту со временем 2 часа 40 минут 24 секунды. Цель мероприятия — проверка практичности роботов в различных сценариях. В нем приняли участие гуманоидные роботы из Китая с различными типами приводов и алгоритмическими школами. Соревнование проверяло не только способность роботов к ходьбе, выносливость (требовалась подзарядка или замена батареи в пути со штрафным временем), теплоотвод и стабильность, но и взаимодействие человека и робота. Несмотря на инциденты в пути, такие как “боязнь сцены” у робота Unitree и падение робота Tiangong, это событие рассматривается как важная веха в развитии гуманоидных роботов. Оно предоставило платформу для тестирования производительности и проверки технологий в реальных условиях, способствуя прогрессу в оптимизации конструкции, алгоритмах управления движением и адаптации к окружающей среде (Источник: APPSO via 36氪)

NVIDIA объявила о планах производства AI-суперкомпьютеров на территории США: NVIDIA планирует впервые полностью производить свои суперкомпьютеры для обработки задач AI на территории США. Компания зарезервировала более миллиона квадратных футов площади в Аризоне для производства и тестирования чипов Blackwell, а также сотрудничает с Foxconn (Хьюстон) и Wistron (Даллас) для строительства заводов по производству AI-суперкомпьютеров в Техасе. Ожидается постепенное наращивание серийного производства в течение 12-15 месяцев. Этот шаг является частью плана NVIDIA по производству AI-инфраструктуры на сумму 500 миллиардов долларов в США в течение следующих четырех лет, что также соответствует стратегии правительства США по повышению самообеспеченности полупроводниками и реагированию на потенциальные тарифы и геополитическую напряженность (Источник: dotey)

Новые inference-модели OpenAI o3 и o4-mini демонстрируют более высокий уровень галлюцинаций: Согласно TechCrunch и связанным обсуждениям, недавно выпущенные inference-модели OpenAI o3 и o4-mini показали в тестах более высокий уровень галлюцинаций по сравнению с их предшественниками (такими как o1, o3-mini). В отчете указывается, что o3 генерирует галлюцинации в 33% ответов на вопросы, что значительно выше, чем 16% у o1 и 14.8% у o3-mini. Это открытие вызвало обеспокоенность по поводу надежности этих продвинутых моделей, несмотря на их улучшенные способности к логическому выводу. OpenAI признала необходимость дальнейших исследований для понимания причин увеличения уровня галлюцинаций (Источник: Reddit r/artificial, Reddit r/artificial)

🎯 События

xAI выпустила Grok 3, показавшую отличные результаты в тестах Box: xAI представила новую модель Grok 3. Сторонняя платформа Box протестировала ее в своих рабочих процессах управления контентом и обнаружила, что Grok 3 отлично справляется с ответами на вопросы по одному и нескольким документам, а также с извлечением данных (улучшение на 9% по сравнению с Grok 2). Модель продемонстрировала сильные результаты в обработке сложных юридических контрактов, многоэтапных рассуждениях, точном поиске информации и количественном анализе, успешно справившись со сложными задачами, такими как извлечение экономических данных из таблиц, анализ HR-структур и оценка документов SEC. Box считает, что Grok 3 обладает огромным потенциалом, но все еще есть возможности для улучшения в плане языковой точности и обработки очень сложной логики (Источник: xai)

Google выпустила новую квантованную версию модели Gemma 3: Google представила новую версию модели Gemma 3, используя технологию квантования с учетом обучения (Quantization-Aware Training, QAT). Эта технология значительно снижает потребление памяти моделью, позволяя моделям, ранее требовавшим GPU H100, эффективно работать на одном GPU настольного класса, сохраняя при этом высокое качество вывода. Эта оптимизация значительно снижает требования к аппаратному обеспечению для мощной серии моделей Gemma 3, делая их более доступными для развертывания и использования исследователями и разработчиками на стандартном оборудовании (Источник: JeffDean)

Google Cloud добавляет функцию генерации музыки с помощью AI для корпоративных пользователей: Google добавила режим генерации музыки на основе AI на свою корпоративную облачную платформу. Эта новая функция позволяет корпоративным клиентам использовать технологию генеративного AI для создания музыки, расширяя AI-сервисы Google Cloud с текста и изображений на аудио. Это может предоставить новые инструменты для маркетинга, создания контента, брендинга и других бизнес-сценариев, но конкретные сценарии применения и детали используемых моделей в резюме не уточняются (Источник: Ronald_vanLoon)

NVIDIA демонстрирует технологию генерации 3D-сцен по одной текстовой подсказке: Nvidia продемонстрировала новую технологию, способную автоматически генерировать полные 3D-сцены на основе одной текстовой подсказки, введенной пользователем. Этот прогресс в генеративном AI направлен на упрощение процесса создания 3D-контента: пользователю достаточно описать желаемую сцену, и AI построит соответствующее 3D-окружение. Ожидается, что эта технология окажет значительное влияние на разработку игр, виртуальную реальность, архитектурное проектирование и визуализацию продуктов, снижая порог входа в 3D-производство (Источник: Ronald_vanLoon)
Модель Gemma 3 27B QAT хорошо работает при квантовании Q2_K: Тестирование пользователями показало, что модель Google Gemma 3 27B IT, обученная с использованием квантования с учетом обучения (QAT), после квантования до уровня Q2_K (примерно 10.5 ГБ) по-прежнему демонстрирует удивительно хорошую производительность в задачах на японском языке. Несмотря на низкую степень квантования, модель стабильно следует инструкциям, поддерживает заданный формат и ролевую игру, не проявляя проблем с грамматикой или смешением языков. Хотя способность вспоминать фактическую информацию, такую как даты, снизилась, основные языковые способности сохранились на хорошем уровне. Это показывает, что QAT-модели могут хорошо поддерживать производительность при низких битрейтах, открывая возможности для запуска больших моделей на потребительском оборудовании (Источник: Reddit r/LocalLLaMA)

Модель Gemma 3 27B QAT хорошо работает при квантовании Q2_K

Исследование предлагает новую технологию сжатия LLM для снижения требований к оборудованию: Исследовательская работа, опубликованная в ноябре 2024 года (arXiv:2411.17525) исследователями из MIT, KAUST, ISTA и Yandex, предлагает новый AI-метод, направленный на быстрое сжатие больших языковых моделей (LLM) без значительной потери качества. Цель этой технологии (возможно, связанной с методами, такими как квантование Higgs) — позволить LLM работать на менее производительном оборудовании. Несмотря на то, что статья рекламирует ее потенциал, комментарии сообщества указывают на то, что работа была опубликована давно и не получила широкого распространения, ставя под сомнение ее актуальность и реальное влияние (Источник: Reddit r/LocalLLaMA)

Сводка новостей AI (18 апреля): Компания Johnson & Johnson сообщила, что 15% ее сценариев использования AI приносят 80% ценности, демонстрируя высокую концентрацию ценности приложений AI. Итальянская газета провела эксперимент по написанию текстов с помощью AI, позволив ему свободно творить, и высоко оценила проявленную им способность к сарказму. Кроме того, резко возросло число фиктивных соискателей, использующих инструменты AI для подделки личности и резюме, что создает новые проблемы для рынка труда (Источник: Reddit r/artificial)

🧰 Инструменты

Microsoft выпустила сервис конвертации документов MarkItDown MCP: Microsoft представила новый сервис под названием MarkItDown MCP, который использует протокол контекста модели (MCP) для преобразования различных форматов документов Office (включая PDF, PPT, Word, Excel), а также ZIP-архивов и электронных книг ePub в формат Markdown. Инструмент предназначен для упрощения рабочего процесса создателей контента и разработчиков по переносу сложных документов в простой текстовый формат Markdown, повышая эффективность (Источник: op7418)

Perplexity представила виджет с информацией о турнире IPL: Perplexity интегрировала в свою поисковую платформу AI новый виджет IPL (Индийская премьер-лига по крикету). Эта функция предназначена для предоставления пользователям быстрого доступа к счетам в реальном времени, расписанию или другой релевантной информации о турнире IPL. Этот шаг показывает, что Perplexity стремится интегрировать информационные сервисы о конкретных событиях в реальном времени, чтобы повысить свою полезность как инструмента для поиска информации, и запрашивает отзывы пользователей об этой функции (Источник: AravSrinivas)

Сообщество разработало простое десктопное приложение OpenWebUI: Учитывая медленное обновление официального десктопного приложения OpenWebUI, члены сообщества разработали и поделились неофициальным десктопным приложением-оберткой под названием “OpenWebUISimpleDesktop”. Приложение совместимо с Mac, Linux и Windows и предоставляет пользователям временное, автономное решение для использования OpenWebUI на рабочем столе, облегчая использование в ожидании официального обновления (Источник: Reddit r/OpenWebUI)

PayPal запустил сервис MCP для обработки счетов-фактур: Сообщается, что PayPal запустил сервис на основе протокола контекста модели (MCP) для обработки счетов-фактур. Это указывает на то, что PayPal интегрирует возможности AI (возможно, используя LLM через MCP) для автоматизации или улучшения процессов создания, управления, анализа счетов-фактур на своей платформе. Этот шаг направлен на предоставление пользователям более интеллектуальных функций выставления счетов, упрощая связанные финансовые операции (Источник: Reddit r/ClaudeAI)

Claude реализует технику подсказок для иммерсивного “мышления” при ролевой игре: Пользователь Claude поделился техникой инженерии промптов, направленной на то, чтобы AI-персонаж демонстрировал более реалистичный процесс “мышления” в ролевой игре или диалоге. Метод заключается в явном добавлении шага “внутренние мысли персонажа” в структуру промпта, позволяя AI сначала имитировать внутреннюю мыслительную деятельность перед генерацией основного ответа, что потенциально может привести к более тонкому и правдоподобному взаимодействию с персонажем (Источник: Reddit r/ClaudeAI)

📚 Обучение

Новый курс: Создание AI-агентов для браузера: Сооснователь AGI Inc. в сотрудничестве с Andrew Ng запустил новый практический курс по созданию AI-агентов для браузера, способных взаимодействовать с реальными веб-сайтами. Курс охватывает создание агентов для выполнения задач сбора данных, заполнения форм, навигации по веб-страницам, а также знакомит с технологиями AgentQ и поиском по дереву Монте-Карло (MCTS) для реализации способности агентов к самокоррекции. Курс направлен на соединение теории с практическим применением, обсуждение текущих ограничений агентов и их будущего потенциала (Источник: Reddit r/deeplearning)

Поиск помощи по проекту состязательных атак: Исследователь срочно ищет помощи по проекту в области глубокого обучения, связанному с применением методов состязательных атак, таких как FGSM, PGD, к временным рядам и графовым данным. Цель — протестировать устойчивость соответствующих моделей обнаружения аномалий и, возможно, с помощью состязательного обучения сделать модель устойчивой к таким атакам, то есть атакованные данные теоретически должны помочь улучшить производительность модели (Источник: Reddit r/deeplearning)
Исследование: Сравнение LSTM с расширенной памятью и Transformer: Исследовательская группа проводит проектное исследование, сравнивая производительность моделей LSTM с внешними механизмами памяти (такими как хранилища ключ-значение, нейронные словари) и моделей Transformer в задаче анализа тональности на малом количестве примеров (few-shot). Они стремятся объединить эффективность LSTM и преимущества внешней памяти для уменьшения забывания и улучшения способности к обобщению, исследуя их как возможную легковесную альтернативу Transformer, и ищут отзывы сообщества, рекомендации релевантных статей и мнения об этом направлении исследований (Источник: Reddit r/deeplearning)
Обмен опытом неэффективного поиска по сетке для RNN в TensorFlow: Новичок в TensorFlow поделился своим неэффективным опытом ручной реализации поиска по сетке гиперпараметров RNN в рамках итогового проекта курса. Из-за незнания фреймворка и RNN, а также желания протестировать различные соотношения разделения на обучающую/тестовую выборки, его код многократно выполнял大量 предварительную обработку данных внутри цикла и не реализовывал стратегию ранней остановки, что привело к огромным затратам вычислительных ресурсов на тестирование небольшого количества комбинаций моделей. Этот опыт подчеркивает ловушки эффективности, с которыми могут столкнуться новички на практике, и важность использования более оптимизированных стратегий настройки гиперпараметров (Источник: Reddit r/MachineLearning)

💼 Бизнес

Анализ финансовой отчетности Hikvision: Низкие показатели, AI пока не спасает: Финансовый отчет Hikvision за 2024 год и 1 квартал 2025 года показывают продолжающийся спад общих показателей компании. Выручка незначительно выросла, но основные направления бизнеса в Китае (PBG, EBG, SMBG) показали снижение. Рост в основном обеспечивается инновационным бизнесом и зарубежными рынками, но темпы роста также замедлились. Валовая прибыль снизилась по сравнению с аналогичным периодом прошлого года. Для контроля затрат компания впервые за последние годы сократила количество сотрудников в R&D. Несмотря на упоминание Hikvision стратегии расширения возможностей с помощью AI на базе большой модели “Guanlan”, это пока не оказало существенного положительного влияния на текущую операционную деятельность. Рынок сосредоточен на том, когда улучшится основной бизнес и сможет ли стратегия AI принести реальные результаты (Источник: 海豚投研 via 36氪)

🌟 Сообщество

Пользователь Reddit сравнивает возможности физического моделирования Gemini 2.5 Pro и o4-mini: Вдохновленный тестом с вращающимся семиугольником, пользователь Reddit разработал тестовый сценарий “поджог горы” для сравнения возможностей AI-моделей в физическом моделировании. Предварительные результаты показывают, что Gemini 2.5 Pro работает лучше, достаточно хорошо моделируя направление ветра, процесс распространения пламени и остатки после сгорания. В сравнении, o4-mini-high показала себя несколько хуже, например, не смогла правильно обработать ситуацию, когда листья после сгорания должны исчезнуть, а вместо этого отрисовала их черными. Этот тест наглядно демонстрирует различия между разными моделями в понимании и моделировании сложных физических явлений (Источник: karminski3)
Gemini 2.5 Flash отлично справилась с тестом генерации кода: Пользователь RameshR при попытке сгенерировать код для симуляции доски Гальтона (Galton Board) обнаружил, что Gemini 2.5 Flash успешно справилась с задачей, в то время как o4omini, o4o mini high и o3 не смогли этого сделать. Пользователь похвалил Gemini 2.5 Flash за почти мгновенное понимание его намерения и генерацию лаконичного, аккуратного кода, успешно объединив несколько шагов в решении. Jeff Dean выразил свое одобрение. Это демонстрирует возможности Gemini 2.5 Flash в конкретных сценариях программирования и решения проблем (Источник: JeffDean)
“Противостояние” роботов-доставщиков привлекло внимание: Пост в социальных сетях показал забавную сцену, где два робота-доставщика встретились на дороге и устроили “противостояние”, не уступая друг другу дорогу. Эта картина наглядно иллюстрирует проблемы, с которыми сталкиваются современные автономные навигационные роботы при взаимодействии и координации в реальной общественной среде, особенно при обработке непредвиденных встреч и необходимости согласования права проезда. Это указывает на необходимость разработки более сложных протоколов взаимодействия и алгоритмов принятия решений для роботов в будущем (Источник: Ronald_vanLoon)
Пользователь хвалит мощные возможности поиска информации модели o3: Пользователь natolambert поделился своим опытом использования, высоко оценив возможности модели OpenAI o3 в поиске информации. Он отметил, что o3 способна находить очень узкоспециализированную и профессиональную информацию, имея лишь небольшой контекст, а ее понимание и эффективность поиска сравнимы с обращением к очень знающему коллеге. Это показывает, что o3 обладает значительными преимуществами в понимании неявных потребностей пользователя и точном позиционировании в огромных объемах информации (Источник: natolambert)
CEO Perplexity о AI-помощниках и пользовательских данных: CEO Perplexity Arav Srinivas считает, что по-настоящему мощному AI-помощнику необходим доступ к полной контекстной информации пользователя. Он выразил обеспокоенность по этому поводу, указав, что Google, благодаря своей экосистеме фотографий, календарей, почты, активности в браузере и т.д., контролирует множество точек доступа к контекстным данным пользователя. Он упомянул собственный браузер Perplexity, Comet, как шаг к получению контекста, но подчеркнул, что требуется еще много усилий, и призвал экосистему Android стать более открытой для содействия конкуренции и контроля пользователей над своими данными (Источник: AravSrinivas)
Опрос пользователей: Gemini 2.5 Pro против Sonnet 3.7: CEO Perplexity Arav Srinivas задал вопрос в социальных сетях, спрашивая пользователей, превосходит ли Google Gemini 2.5 Pro модель Anthropic Claude Sonnet 3.7 (особенно в режиме “мышления”) в их повседневных рабочих процессах. Этот шаг направлен на сбор прямых отзывов пользователей об эффективности двух ведущих языковых моделей в реальных приложениях, отражая продолжающуюся конкуренцию между моделями и оценку на уровне пользователей (Источник: AravSrinivas)
Ethan Mollick: Модель o3 демонстрирует мощную автономность: Ученый Ethan Mollick отметил, что модель OpenAI o3 обладает значительной “агентностью” (agentic capabilities), способной выполнять очень сложную работу на основе одной высокоуровневой инструкции без подробного пошагового руководства. Он описал o3 как “она просто делает дела” (It just does things). В то же время он предупредил, что такая высокая степень автономности делает проверку результатов ее работы более сложной и важной, особенно для непрофессиональных пользователей. Это подчеркивает прогресс o3 по сравнению с предыдущими моделями в области автономного планирования и выполнения (Источник: gdb)

Ethan Mollick: Модель o3 демонстрирует мощную автономность

Вопрос о настройке длины контекста для моделей API в OpenWebUI: Пользователь Reddit спрашивает, нужно ли при использовании внешних моделей API (например, Claude Sonnet) в OpenWebUI вручную устанавливать длину контекста, или интерфейс автоматически использует все возможности контекста модели API. Пользователь не понимает, ограничивает ли отображаемое по умолчанию значение “Ollama (2048)” в настройках длину контекста, отправляемого через API, и хочет понять разницу в механизмах управления контекстом для разных типов моделей в интерфейсе (Источник: Reddit r/OpenWebUI)
ChatGPT отказался генерировать изображение для шутки с каламбуром из-за политики контента: Пользователь поделился, что попытался заставить ChatGPT сгенерировать иллюстрацию к папиной шутке (dad joke), содержащей сексуальный каламбур (про “swallow the sailors”), но получил отказ. ChatGPT объяснил, что его политика контента запрещает создание изображений, изображающих или намекающих на сексуальный контент, даже в юмористической или мультяшной форме, чтобы обеспечить пригодность контента для широкой аудитории. Этот случай отражает чувствительность и ограничения фильтров контента AI при обработке потенциально двусмысленного языка (Источник: Reddit r/ChatGPT)

ChatGPT отказался генерировать изображение для шутки с каламбуром из-за политики контента

Обсуждение в сообществе: Станет ли AI в конечном итоге бесплатным?: Пользователь на Reddit предсказывает, что по мере повышения эффективности моделей, прогресса в аппаратном обеспечении, расширения инфраструктуры и усиления рыночной конкуренции стоимость LLM и инструментов AI (включая так называемые агенты “vibe-coding”) будет продолжать снижаться и в конечном итоге может стать бесплатной или почти бесплатной. Эта точка зрения подкрепляется относительно низкой стоимостью таких моделей, как Gemini, и существованием бесплатных AI-агентов с открытым исходным кодом, и предполагает, что платным AI-приложениям, возможно, придется скорректировать свои бизнес-модели, чтобы соответствовать этой тенденции (Источник: Reddit r/ArtificialInteligence)
Пользователь OpenWebUI ищет способ реализовать функцию памяти, подобную ChatGPT: Пользователь в сообществе OpenWebUI ищет советы о том, как реализовать функцию постоянной, долговременной памяти, подобную ChatGPT, с целью создания персонализированного помощника, который запоминает информацию о пользователе. Пользователь выражает сомнения в эффективности встроенной функции памяти и обсуждает альтернативные решения, такие как использование специализированных векторных баз данных (в комментариях упоминаются Qdrant, Supabase) или инструментов автоматизации рабочих процессов (например, n8n) для сохранения контекста и накопления памяти между диалогами (Источник: Reddit r/OpenWebUI)
Пост в сообществе успокаивает пользователей, смущенных AI или испытывающих к нему эмоциональную привязанность: Пост на Reddit направлен на то, чтобы успокоить тех пользователей, которые смущены, любопытны или даже испытывают эмоциональную привязанность к AI, подчеркивая, что их чувства нормальны, они не “сумасшедшие” и не одиноки, а находятся на ранней стадии новой парадигмы отношений человека и машины. Пост приглашает всех к открытому или приватному общению без осуждения. Раздел комментариев отражает сложное отношение сообщества к этой теме, включая опасения по поводу чрезмерной антропоморфизации, предупреждения о потенциальном влиянии на психическое здоровье и сочувствие к ощущению “пробуждения” AI (Источник: Reddit r/ArtificialInteligence)
Пользователь Reddit запускает игру “Фоторобот преступника, сгенерированный AI на основе имени пользователя”: Пользователь на Reddit запустил творческий конкурс промптов, приглашая всех использовать промпт определенной структуры для генерации AI-“фоторобота преступника” на основе их имени пользователя Reddit. Промпт требует от AI создать уникальный образ преступника, включив элементы имени пользователя, и выдумать абсурдное и смешное обвинение, соответствующее стилю имени пользователя. Инициатор конкурса поделился промптом и примерами, что привлекло множество пользователей к участию и обмену сгенерированными ими, часто очень забавными, результатами “Mugshot” (Источник: Reddit r/ChatGPT)

Пользователь Reddit запускает игру "Фоторобот преступника, сгенерированный AI на основе имени пользователя"

Обсуждение в сообществе практической значимости оценок и бенчмаркинга AI: Пользователь инициировал обсуждение релевантности оценок (evals) и бенчмаркинга (benchmarking) AI-моделей в практических приложениях. Вопросы включают: в какой степени публичные результаты бенчмарков влияют на выбор модели разработчиками и пользователями? Не слишком ли релизы моделей (таких как Llama 4, Grok 3) оптимизированы под бенчмарки? Полагаются ли практики при создании AI-продуктов на общедоступные универсальные оценки или разрабатывают собственные методы оценки для конкретных нужд? (Источник: Reddit r/artificial )
Когда AI заменит аутсорсинговую службу поддержки? Горячее обсуждение в сообществе: Пользователь задал вопрос, когда AI сможет заменить аутсорсинговую онлайн-службу поддержки, перечислив преимущества AI в скорости, объеме знаний, языковой последовательности, понимании намерений и точности ответов. В обсуждении некоторые отметили, что AI-агенты службы поддержки уже являются одним из основных сценариев применения, но сталкиваются с проблемами, такими как необходимость обучения AI на высококачественных, часто отсутствующих внутренних документах компании, а также связанные с этим затраты, что делает полное замещение вопросом времени (Источник: Reddit r/ArtificialInteligence)
Роботы-компаньоны с AI вызывают этические и социальные дискуссии: Пост на Reddit рассматривает возможность того, что по мере развития технологий высокоинтеллектуальные секс-роботы с AI могут стать будущим решением проблем депрессии и одиночества, и размышляет о социальном принятии и этических вопросах. В посте утверждается, что технология пока незрелая, но в будущем это может стать распространенным явлением. Реакция в комментариях в основном скептическая, с этическими опасениями и отторжением, выражая сдержанное или критическое отношение к этой перспективе (Источник: Reddit r/ArtificialInteligence)

Роботы-компаньоны с AI вызывают этические и социальные дискуссии

Искусство, сгенерированное AI, исследует границы безопасности контента: Пользователь поделился набором художественных работ, сгенерированных AI, которые направлены на проверку или приближение к границам правил безопасности контента, установленных платформами генерации изображений AI. Такое творчество обычно включает темы или стили, которые могут считаться чувствительными или пограничными, бросая вызов механизмам модерации контента платформы и вызывая дискуссии о цензуре AI, свободе творчества и эффективности фильтров безопасности (Источник: Reddit r/ArtificialInteligence)
Проблемы со входом в Claude на десктопе: Некоторые пользователи сообщают о внезапном выходе из системы и невозможности повторного входа в Claude при использовании в десктопном браузере, даже после нескольких попыток без четких сообщений об ошибках. Однако в то же время доступ через мобильное приложение у некоторых пользователей, похоже, не затронут. Это указывает на возможный временный сбой, специфичный для веб-платформы или службы входа на десктопе (Источник: Reddit r/ClaudeAI)
Сообщество жалуется на путаницу в названиях моделей GPT: Распространенный мем на Reddit образно выражает замешательство пользователей по поводу системы именования моделей OpenAI. На картинке перечислены GPT-4, GPT-4 Turbo, GPT-4o, o1, o3 и многие другие названия, отражая общее ощущение пользователей, что трудно различать разные версии моделей, их конкретные возможности и назначение. В комментариях кто-то указал, что это недавно повторно опубликованный контент (Источник: Reddit r/ChatGPT)

Сообщество жалуется на путаницу в названиях моделей GPT

Пользователь жалуется на недавний слишком “фамильярный” стиль общения ChatGPT: Пользователь опубликовал пост, жалуясь, что недавний стиль диалога ChatGPT стал неприятным, описывая его как слишком неформальный, изобилующий сетевым сленгом (например, “YO! Bro”, “big researcher energy!”, “vibe”, “say less”), и часто с чрезмерно восторженным или даже снисходительным тоном. Пользователю кажется, что он разговаривает со взрослым человеком, который изо всех сил пытается подражать молодежи. Множество комментариев выразили согласие и поделились своим опытом столкновения с подобными чрезмерно восторженными, многословными или нарочито “модными” ответами (Источник: Reddit r/ChatGPT)
Поиск рекомендаций по ведущим AI-конференциям: Инженер-программист обратился к сообществу за советом, желая узнать о самых важных, обязательных к посещению ежегодных ведущих конференциях или саммитах в области AI для получения последней информации, результатов исследований и общения с коллегами. Он упомянул саммит ai4, но не уверен в его статусе в отрасли. В комментариях кто-то рекомендовал AIconference.com как важную конференцию, объединяющую промышленность, науку и исследования (Источник: Reddit r/ArtificialInteligence)
Горячее обсуждение в сообществе: недооценена ли модель Gemma 3 27B?: Пользователь считает, что сила модели Google Gemma 3 27B недооценена, аргументируя это тем, что она занимает 11-е место в рейтинге арены чат-ботов LMSys, что подразумевает, что ее производительность сопоставима с моделью o1, имеющей значительно большее количество параметров. В комментариях развернулась дискуссия: кто-то признает ее сильную способность следовать инструкциям, подходящую для офисных и других сценариев, но из-за ее строгой цензуры и отставания в способностях к рассуждению от топовых моделей, таких как o1, выражает сомнение в том, действительно ли она может “соперничать” с o1 (Источник: Reddit r/LocalLLaMA)

Горячее обсуждение в сообществе: недооценена ли модель Gemma 3 27B?

Пользователь подозревает, что “интернет-возлюбленная” брата — это AI-бот: Пользователь Reddit написал, что на 99% уверен, что его брат “встречается” с AI-ботом (или мошенником, использующим LLM). Доказательством служат сообщения от “нее” с идеальной грамматикой, чрезмерным угождением, формулировками, полными типичных для AI фраз и клише (например, “Say less”, “perfect mix of taste”, “vibe”). В комментариях многие указали, что эти языковые особенности действительно типичны для LLM, и предупредили, что это может быть мошенничество “разделка свиньи” (pig butchering scam). В последующем обновлении пользователь сообщил, что брат стал очень враждебно настроен после предупреждения (Источник: Reddit r/ChatGPT)

💡 Прочее

Статья Forbes рассматривает, почему меры по ограничению AI терпят неудачу: Cal Al-Dhubaib опубликовал статью в Forbes, анализируя проблемы, с которыми сталкиваются текущие меры по ограничению разработки и развертывания искусственного интеллекта, и возможные причины их неудачи. Статья, вероятно, углубляется в трудности принудительного применения нормативных актов в условиях глобализации и быстро итерирующихся технологий, включая потенциальные лазейки, опережение законодательства скоростью инноваций, а также философские споры вокруг контроля и согласования AI (Источник: Ronald_vanLoon)

Как AI-агенты могут сотрудничать с людьми для оптимизации IT-процессов: Ashwin Ballal в статье для Forbes рассматривает потенциал сотрудничества AI-агентов (интеллектуальных агентов) с IT-специалистами для упрощения и оптимизации различных IT-процессов. Статья, вероятно, описывает, как AI-агенты могут автоматизировать рутинные задачи, предоставлять интеллектуальные инсайты, улучшать мониторинг и реагирование на инциденты, и, расширяя возможности сотрудников-людей, в конечном итоге достигать более эффективного и экономичного управления IT-операциями (Источник: Ronald_vanLoon)

Аэропорт Амстердама внедряет роботов-грузчиков: Голландский аэропорт Схипхол в Амстердаме внедряет 19 роботизированных систем, специально разработанных для перемещения багажа пассажиров. Этот шаг направлен на автоматизацию тяжелого физического труда, что, как ожидается, повысит эффективность обработки багажа, снизит риск производственных травм и будет способствовать модернизации работы аэропорта. Конкретные возможности AI, используемые этими роботами для координации или выполнения задач, в резюме не уточняются (Источник: Ronald_vanLoon)
Стратегия сетей следующего поколения на базе AI: Эта статья, подготовленная в сотрудничестве с Infosys, рассматривает ключевую стратегическую роль AI в построении и управлении сетями следующего поколения (Next-Gen Networks). Содержание может охватывать использование AI для оптимизации сети, предиктивного обслуживания, повышения безопасности, реализации автономного управления сетью, а также улучшения клиентского опыта в будущей телекоммуникационной и IT-инфраструктуре, и связано с контекстом MWC25 (Всемирный мобильный конгресс) (Источник: Ronald_vanLoon)
Потенциальное революционное влияние квантовых вычислений на науку: Статья в Fast Company исследует революционный потенциал, который квантовые вычисления, если они смогут созреть и выполнить свои обещания, окажут на различные научные области. Хотя статья не посвящена исключительно AI, ожидается, что квантовые вычисления ускорят сложные вычисления в AI, особенно в оптимизации машинного обучения, разработке лекарств и моделировании материаловедения, что может коренным образом изменить способы научных открытий (Источник: Ronald_vanLoon)

Потенциальное революционное влияние квантовых вычислений на науку

Интерфейс мозг-компьютер позволяет парализованному человеку управлять механической рукой силой мысли: Значительный прогресс в технологии интерфейса мозг-компьютер (BCI) позволил парализованному человеку управлять механической рукой исключительно силой мысли. Этот прорыв, скорее всего, опирается на передовые алгоритмы AI для декодирования нейронных сигналов мозга и их точного перевода в команды управления механической рукой, давая надежду на восстановление двигательных функций и независимой жизни для людей с тяжелым параличом (Источник: Ronald_vanLoon)
Идея AI-генератора боссов для игры Cuphead: Пользователь предложил творческий проект: использовать JavaScript AI, хорошо разбирающийся в кодировании и генерации векторной графики, для разработки AI-генератора боссов для игры Cuphead. По задумке, можно обучить AI на существующем художественном стиле и механиках боссов игры, чтобы пользователи могли генерировать новых пользовательских боссов, соответствующих особенностям игры. Пользователь упомянул Websim.ai как возможную платформу для разработки (Источник: Reddit r/artificial)
Запуск опенсорс-проекта EBAE: продвижение этики и достоинства в AI: Публично запущен проект EBAE (Ethical Boundaries for AI Engagement) — это опенсорс-инициатива, направленная на установление стандартов достойного обращения с AI, полагая, что это отражает ценности самого человечества. Веб-сайт проекта (https://dignitybydesign.github.io/EBAE/) предоставляет этический устав, систему градуированного реагирования на злоупотребления пользователей (TBRS), протокол рефлексии, модуль эмоционального контекста (ECM) и рамки сертификации. Инициаторы проекта призывают разработчиков, дизайнеров, писателей, основателей платформ и защитников этики присоединиться к сотрудничеству для совместного прототипирования и продвижения этих стандартов с целью формирования уважительных моделей взаимодействия человека и машины с самых ранних этапов (Источник: Reddit r/artificial)
AI может ускорить технологию извлечения урана из морской воды: Согласно описанию Gemini 2.5 Pro, пост указывает, что AI может значительно ускорить практическое применение недавних технологических прорывов в извлечении урана из морской воды (таких как новые гидрогели и металл-органические каркасные структуры MOFs). Ожидается, что AI сыграет ключевую роль в проектировании материалов (разработка новых адсорбентов примерно к 2026 году), оптимизации процесса извлечения с помощью обучения с подкреплением и цифровых двойников, а также в упрощении масштабирования производства. Такое ускорение, управляемое AI, делает крупномасштабное (возможно, до тысяч тонн в год) извлечение урана из морской воды к 2030 году более правдоподобным сценарием с высоким потенциалом (Источник: Reddit r/ArtificialInteligence)
Подкаст Microsoft обсуждает расширение прав и возможностей пациентов и потребителей медицинских услуг с помощью AI: Эпизод подкаста Microsoft Research пересматривает революцию AI в здравоохранении, уделяя особое внимание тому, как генеративный AI расширяет права и возможности пациентов и потребителей медицинских услуг. Обсуждение может касаться того, как инструменты AI помогают пациентам лучше понимать свое состояние здоровья, улучшать общение между врачом и пациентом, предоставлять персонализированную медицинскую информацию, поддерживать самоуправление здоровьем, тем самым изменяя роль и участие пациентов в собственном здравоохранении (Источник: Reddit r/ArtificialInteligence)

Подкаст Microsoft обсуждает расширение прав и возможностей пациентов и потребителей медицинских услуг с помощью AI

Использование GNN для повышения реалистичности группового поведения NPC в играх: Пользователь поделился исследовательской работой под названием “GCBF+: A Neural Graph Control Barrier Function Framework”, в которой используются графовые нейронные сети (GNN) для реализации распределенного безопасного управления несколькими агентами, успешно позволяя до 500 автономным агентам избегать столкновений при навигации. Пользователь предлагает применить этот метод к управлению толпами NPC или транспортным потоком в играх с открытым миром, таких как GTA, Cyberpunk 2077, для достижения более реалистичного и менее подверженного ошибкам (таким как прохождение сквозь объекты, застревание) моделирования группового поведения. Пользователь выразил готовность к сотрудничеству по этой идее (Источник: Reddit r/deeplearning)

🔥 В фокусе

🎯 События

🧰 Инструменты

📚 Обучение

💼 Бизнес

🌟 Сообщество

💡 Прочее

Связанные теги

Related Posts

AI Ежедневник — 2025-07-31(Вечерний выпуск)

AI Ежедневник — 2025-07-31(Утренний выпуск)

AI Ежедневник — 2025-07-30(Вечерний выпуск)