Ключевые слова:Модели серии Qwen3, Claude Code, Бенчмаркинг ИИ-моделей, Runway Gen-4, LangGraph, Производительность Qwen3-235B-A22B, Программный ассистент Claude Code, Тесты SimpleBench, Функция References в Runway Gen-4, Применение LangGraph Agent

🔥 В фокусе

Выпуск и производительность моделей серии Qwen3: Alibaba выпустила серию моделей Qwen3, охватывающую несколько размеров от 0.6B до 235B. Отзывы сообщества показывают, что небольшие модели (например, 4B) чаще загружаются из-за простоты дообучения, а среди MoE моделей популярна 30B-A3B. По производительности Qwen3-235B-A22B отлично показала себя на SimpleBench, заняв 13-е место и превзойдя такие модели, как o1/o3-mini и DeepSeek-R1. Qwen3-8B хорошо работает локально, имеет небольшой размер (квантованная версия 4.3GB) и низкое потребление памяти (4-5GB), что подходит для сред с ограниченными ресурсами. Однако некоторые пользователи отмечают недостатки Qwen3 в управлении автономными AI Agent, такие как нестабильная структурированная генерация, трудности с межъязыковой обработкой, отсутствие понимания окружения и проблемы с цензурой. (Источник: karminski3, scaling01, BorisMPower, Reddit r/LocalLLaMA, Reddit r/MachineLearning)

Выпуск и производительность моделей серии Qwen3

Производительность и отзывы о Claude Code: Claude Code привлекает внимание как помощник в программировании. Пользователи обсуждают проблему галлюцинаций при работе с частными библиотеками, когда модель генерирует неверный код из-за отсутствия знаний о пользовательских реализациях. Решения включают предоставление большего контекста, дообучение модели или использование сервера MCP (Machine Collaboration Protocol) для доступа к частным библиотекам. В то же время пользователи Claude Pro сообщают о проблемах с лимитами использования, которые могут срабатывать даже при небольшом объеме использования, влияя на эффективность кодирования. Отчеты о производительности указывают, что недавние изменения в ограничении скорости с учетом кэша могут быть причиной неожиданного троттлинга, особенно затрагивающего пользователей Pro. Несмотря на проблемы, некоторые пользователи считают, что Claude превосходит ChatGPT в “vibe-coding”. (Источник: code_star, jam3scampbell, Reddit r/ClaudeAI, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Производительность и отзывы о Claude Code

Обсуждение и список бенчмарков (Benchmark) для AI моделей: Сообщество активно обсуждает эффективность различных бенчмарков для LLM. Некоторые пользователи считают GPQA и SimpleQA ключевыми бенчмарками, в то время как традиционные бенчмарки, такие как MMLU, HumanEval, теряют свою значимость. Предпочтение отдается бенчмаркам с простой концепцией, таким как SimpleBench, SOLO-Bench, AidanBench, а также бенчмаркам, основанным на играх и задачах реального мира. Одновременно был опубликован подробный список бенчмарков LLM, охватывающий общие способности, код, математику, Agent, длинный контекст, галлюцинации и другие аспекты, предоставляя ориентир для оценки моделей. Пользователи проявляют интерес к данным бенчмарков Grok 3.5, но также предостерегают от неофициальных или подделанных данных. (Источник: teortaxesTex, scaling01, scaling01, teortaxesTex, scaling01, natolambert, scaling01, teortaxesTex, Reddit r/LocalLLaMA)

Обсуждение и список бенчмарков (Benchmark) для AI моделей

Демонстрация функции Runway Gen-4 References: Функция References в модели Gen-4 от RunwayML демонстрирует мощные возможности генерации изображений и видео. Пользователи показали использование этой функции для преобразования пространства: достаточно предоставить изображение помещения и референсное изображение, чтобы сгенерировать новый дизайн интерьера. Кроме того, эту функцию можно использовать для создания интерактивных видеоигр в стиле «Myst», генерируя переходную анимацию путем указания начального и конечного кадров. Можно даже “перенестись” в исторические сцены, генерируя виды с разных ракурсов для определенного места (например, сцены из картины «Менины»), что демонстрирует ее огромный потенциал в создании креативного контента. (Источник: connerruhl, c_valenzuelab, c_valenzuelab, TomLikesRobots, c_valenzuelab)

Демонстрация функции Runway Gen-4 References

🎯 Тенденции

Claude скоро запустит режим голосового общения в реальном времени: Anthropic тестирует функцию голосового взаимодействия в реальном времени для Claude. Согласно утечке информации, этот режим обладает полным функционалом, будет поддерживать веб-поиск и загрузку файлов, а также предоставит режим “нажми и говори” (push-to-talk) и прокручиваемый текстовый вид. Хотя функция еще не выпущена публично, в системных подсказках уже появились соответствующие заполнители (<antml:voiceNote>), предвещая скорое крупное обновление мобильного приложения Claude, направленное на улучшение пользовательского опыта взаимодействия и конкуренцию с голосовыми возможностями ChatGPT и других. (Источник: op7418, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Claude скоро запустит режим голосового общения в реальном времени

OpenAI запускает функцию поиска внутри WhatsApp: OpenAI объявила, что пользователи теперь могут отправлять сообщения на номер 1-800-ChatGPT (+1-800-242-8478) через WhatsApp для получения ответов в реальном времени и спортивных результатов. Этот шаг рассматривается как важный этап в расширении охвата услуг OpenAI, но также вызывает дискуссии о стратегических соображениях предоставления основных услуг на платформе главного конкурента (WhatsApp, принадлежащего Facebook). Функция доступна во всех регионах, где доступен ChatGPT. (Источник: digi_literacy)

OpenAI запускает функцию поиска внутри WhatsApp

Grok скоро получит голосовую функцию: Grok от xAI объявил о скором запуске функции голосового взаимодействия, что еще больше расширит его мультимодальные возможности. Цель — конкурировать с другими основными AI-ассистентами (такими как ChatGPT, Gemini, Claude) в области голосового взаимодействия. Конкретные детали реализации и дата запуска пока не объявлены. (Источник: ibab)

Grok скоро получит голосовую функцию

TesserAct: Выпущена модель для изучения 4D воплощенного мира: DailyPapers объявили о запуске TesserAct, системы, способной изучать 4D модели воплощенного мира. Она может генерировать видео, содержащее информацию RGB, глубину и нормали, на основе входных изображений и текстовых инструкций, а также реконструировать 4D сцены. Эта технология имеет потенциал в понимании и симуляции динамического физического мира и может применяться в робототехнике, автономном вождении и виртуальной реальности. (Источник: _akhaliq)

Исследование возможностей пространственного мышления визуально-языковых моделей (VLM): Статья с ICML 2025 исследует причины плохой производительности VLM в задачах пространственного мышления. Исследование показало, что механизмы внимания существующих VLM при обработке пространственных отношений не могут точно сфокусироваться на релевантных визуальных объектах. В статье предлагается метод без необходимости обучения для смягчения этой проблемы, предоставляя новый взгляд на улучшение способностей VLM к пространственному пониманию. (Источник: Francis_YAO_)

LaRI: Иерархические пересечения лучей для 3D геометрического вывода из одного вида: Предложена новая технология под названием LaRI (Layered Ray Intersections), предназначенная для 3D геометрического вывода на основе одного изображения. Этот метод, вероятно, использует трассировку лучей и иерархическое представление для понимания и вывода трехмерной структуры сцены и пространственных отношений между объектами, что может найти применение в 3D реконструкции, понимании сцен и других областях. (Источник: _akhaliq)

IBM выпускает предварительную версию Granite 4.0 Tiny Preview: IBM предварительно выпустила модель следующего поколения Granite — Granite 4.0 Tiny Preview. Эта серия моделей использует новую гибридную архитектуру Mamba-2/Transformer, сочетающую скорость и эффективность Mamba с точностью самовнимания Transformer. Tiny Preview — это мелкозернистая модель смеси экспертов (MoE) с общим количеством параметров 7B, из которых во время вывода активируется только 1B, с целью обеспечения высокой эффективности. Это свидетельствует об усилиях IBM по исследованию новых архитектур моделей для повышения производительности и эффективности. (Источник: Reddit r/LocalLLaMA)

IBM выпускает предварительную версию Granite 4.0 Tiny Preview

Cisco выпускает LLM Foundation-Sec-8B, специализированную на кибербезопасности: Команда Foundation AI из Cisco выпустила модель Foundation-Sec-8B на Hugging Face. Это LLM, построенная на базе Llama 3.1 и сфокусированная на области кибербезопасности. Утверждается, что эта 8B модель способна конкурировать с Llama 3.1-70B и GPT-4o-mini в специфических задачах безопасности, демонстрируя потенциал специализированных моделей превосходить универсальные большие модели в конкретных задачах. Это указывает на то, что крупные технологические компании активно применяют LLM в вертикальных областях для решения конкретных проблем. (Источник: _akhaliq, Suhail)

Cisco выпускает LLM Foundation-Sec-8B, специализированную на кибербезопасности

Исследование влияния обучения в контексте (ICL) и дообучения (fine-tuning) на способность LLM к обобщению: Исследование Google DeepMind и Стэнфордского университета сравнивает влияние двух основных методов — обучения в контексте (ICL) и дообучения (fine-tuning) — на способность LLM к обобщению. Исследование показало, что ICL делает модель более гибкой при обучении и улучшает способность к обобщению. Однако, когда информация должна быть интегрирована в более обширную структуру знаний, дообучение показывает лучшие результаты. Исследователи предложили новый метод, сочетающий преимущества обоих подходов — расширенное дообучение (augmented fine-tuning), который заключается во включении в данные для дообучения процессов рассуждения, аналогичных ICL, с целью достижения наилучшего эффекта. (Источник: TheTuringPost)

Исследование влияния обучения в контексте (ICL) и дообучения (fine-tuning) на способность LLM к обобщению

Meta выпускает PerceptionLM: открытые данные и модели для детального визуального понимания: Meta запустила проект PerceptionLM, целью которого является предоставление полностью открытой и воспроизводимой среды для прозрачных исследований в области понимания изображений и видео. Проект анализирует стандартные процессы обучения, не зависящие от дистилляции проприетарных моделей, и исследует использование крупномасштабных синтетических данных для выявления пробелов в данных, особенно в области детального понимания видео. Для восполнения этих пробелов проект выпустил 2.8 миллиона пар вопросов и ответов по видео с мелкозернистой ручной разметкой и видео-субтитры с пространственно-временной локализацией. Кроме того, был представлен набор для оценки PLM–VideoBench, сфокусированный на оценке сложных задач рассуждения при понимании видео. (Источник: Reddit r/MachineLearning)

🧰 Инструменты

LangGraph представляет несколько примеров приложений Agent: LangChain продемонстрировал несколько примеров приложений Agent, построенных на базе LangGraph: 1. Curiosity: Открытый интерфейс чата ReAct, похожий на Perplexity, поддерживающий потоковую передачу в реальном времени, поиск Tavily и мониторинг LangSmith, с возможностью подключения к различным LLM, таким как GPT-4-mini, Llama3. 2. Meeting Prep Agent: Интеллектуальный помощник для календаря, который автоматически исследует информацию об участниках встречи и компаниях, предоставляя инсайты о встрече через интерфейс React/FastAPI, используя LangGraph для реализации сложных рабочих процессов Agent и рассуждений в реальном времени. 3. Generative UI: Исследование генеративных UI как будущего взаимодействия человека и компьютера, выпущена библиотека примеров генеративных UI для LangGraph.js, демонстрирующая потенциал графов Agent в создании динамических интерфейсов. (Источник: LangChainAI, hwchase17, LangChainAI, Hacubu)

LangGraph представляет несколько примеров приложений Agent

Обновление Cline v3.14: поддержка LaTeX, перетаскивание файлов и определение правил: AI-помощник для программирования Cline выпустил версию v3.14 с несколькими обновлениями функций: 1. Рендеринг LaTeX: Полная поддержка LaTeX, позволяющая обрабатывать сложные математические формулы и научные документы прямо в интерфейсе чата. 2. Загрузка перетаскиванием: Поддержка перетаскивания файлов напрямую из файлового менеджера ОС (необходимо удерживать Shift) для добавления контекста. 3. Определение правил: Новая команда /newrule, позволяющая Cline анализировать проект и генерировать документы с правилами, такими как система дизайна, стандарты кодирования, для обеспечения соблюдения стандартов проекта. 4. Контрольные точки процесса: Добавлено больше контрольных точек в рабочий процесс задач, позволяя пользователям просматривать и изменять план перед “выполнением” (Act). (Источник: cline, cline, cline, cline)

Обновление Cline v3.14: поддержка LaTeX, перетаскивание файлов и определение правил

LlamaParse помогает 11x.ai создавать интеллектуальных AI SDR: LlamaIndex продемонстрировал, как его технология LlamaParse помогла 11x.ai улучшить свою систему AI Sales Development Representative (SDR). Благодаря интеграции LlamaParse, 11x.ai может обрабатывать различные типы документов, загружаемых пользователями, предоставляя необходимую контекстную информацию для AI SDR, что позволяет осуществлять персонализированные автоматические кампании по работе с клиентами и сокращает время адаптации новых SDR до нескольких дней. Это подчеркивает важность передовых технологий анализа документов в автоматизации бизнес-процессов и повышении возможностей AI-приложений. (Источник: jerryjliu0)

LlamaParse помогает 11x.ai создавать интеллектуальных AI SDR

Tiny Agents теперь могут работать локально: Благодаря вкладу сообщества, Tiny Agents, основанные на Hugging Face mcp-client (huggingface.js), теперь могут полностью работать локально. Пользователям достаточно запустить локально модель, совместимую с инструментами (например, Qwen3 14B), и указать локальную конечную точку API через ENDPOINT_URL, чтобы реализовать локализованные функции AI Agent, что считается важным шагом для локального AI. (Источник: cognitivecompai)

Tiny Agents теперь могут работать локально

Локальный инструмент отладки AI для командной строки cloi: cloi — это инструмент для отладки кода с помощью AI, работающий в командной строке, особенностью которого является полная локальная работа. Он включает встроенную модель Phi-4 от Microsoft, а также поддерживает переключение и запуск других локальных больших языковых моделей через Ollama. Это предоставляет разработчикам удобный вариант использования AI для отладки и анализа кода в локальной среде. (Источник: karminski3)

AI Decision Circuits: Повышение надежности систем LLM: Статья рассматривает применение концепций проектирования электронных схем к системам LLM для создания “AI Decision Circuits” с целью повышения надежности. С помощью этого подхода точность системы может достигать 92.5%. Реализация использует LangSmith для отслеживания и оценки в реальном времени, чтобы проверить точность вывода системы. Этот метод предлагает новые идеи для создания более надежных и предсказуемых приложений LLM. (Источник: LangChainAI)

AI Decision Circuits: Повышение надежности систем LLM

Local Deep Research (LDR) ищет предложения по улучшению: Инструмент для исследований с открытым исходным кодом Local Deep Research выпустил версию v0.3.1 и обратился к сообществу за предложениями по улучшению, включая области, требующие внимания, необходимые функции, предпочтения по типам исследований и предложения по улучшению UI. Инструмент предназначен для выполнения задач глубокого исследования локально и рекомендует использовать SearXNG для повышения скорости. (Источник: Reddit r/LocalLLaMA)

Local Deep Research (LDR) ищет предложения по улучшению

Выпущена OpenWebUI Adaptive Memory v3.1: Функция адаптивной памяти OpenWebUI обновлена до версии v3.1. Улучшения включают оценку достоверности памяти и фильтрацию, поддержку локальных/API провайдеров Embedding, автоматическое обнаружение локальных моделей, проверку размерности Embedding, обнаружение метрик Prometheus, конечные точки состояния и метрик, эмиттер состояния UI и исправления отладки. Дорожная карта включает рефакторинг, динамические маркеры памяти, настройку персонализированных ответов, проверку межсессионной персистентности, улучшенную обработку конфигурации, настройку извлечения, обратную связь по состоянию, расширение документации, опциональную синхронизацию с внешними RememberAPI/mem0 и десенсибилизацию PII. (Источник: Reddit r/OpenWebUI)

Выпущена OpenWebUI Adaptive Memory v3.1

📚 Обучение

Дорожная карта обучения инженера по машинному обучению: Ronald van Loon поделился дорожной картой обучения для инженеров по машинному обучению, предоставляя путь обучения и обзор ключевых навыков для тех, кто стремится войти в эту область. (Источник: Ronald_vanLoon)

Дорожная карта обучения инженера по машинному обучению

Учебное пособие по созданию суммаризатора видео с использованием Gemma: LangChainAI выпустил видеоурок, демонстрирующий, как создать приложение для суммирования видео с использованием локально запущенной LLM Gemma (через Ollama). Приложение Streamlit использует LangChain для обработки видео и автоматического создания кратких резюме, предоставляя пример для изучения и практики применения локальных LLM. (Источник: LangChainAI)

Учебное пособие по созданию суммаризатора видео с использованием Gemma

Учебное пособие по созданию сервера MCP для обработки данных фондового рынка: LangChainAI предоставил учебное пособие, которое показывает пользователям, как создать сервер MCP (Machine Collaboration Protocol) с использованием FastMcp и LangChain для обработки данных фондового рынка. Руководство демонстрирует, как использовать LangGraph для создания ReAct Agent для стандартизированного доступа к данным, что помогает понять и применить технологии MCP и Agent. (Источник: LangChainAI)

Учебное пособие по созданию сервера MCP для обработки данных фондового рынка

Концепция бенчмарка рациональности LLM: Deep Learning Weekly упоминает статью в блоге, представляющую концептуальный бенчмарк для оценки рациональности LLM путем адаптации оценки ART-Y. В статье подчеркивается важность оценки того, является ли AI более рациональным (а не просто более умным), чем люди. (Источник: dl_weekly)

AI Red Teaming как упражнение в критическом мышлении: Deep Learning Weekly рекомендует статью, которая определяет AI Red Teaming не просто как тестирование технических уязвимостей LLM, а как упражнение в критическом мышлении, заимствованное из военной практики и кибербезопасности. Это предлагает более широкую перспективу для понимания и внедрения оценки безопасности AI. (Источник: dl_weekly)

Рекомендация книги для изучения Python: Члены сообщества рекомендуют книгу для изучения Python «Python Crash Course», считая ее хорошей отправной точкой для эффективного использования Python, и делятся PDF-версией. Подчеркивается важность Python как основного языка для изучения разработки AI. (Источник: omarsar0)

Рекомендация книги для изучения Python

Deeply Supervised Nets получает награду “Проверка временем” на AISTATS 2025: Ранняя докторская работа Saining Xie “Deeply Supervised Nets” получила награду “Проверка временем” (Test of Time Award) на AISTATS 2025. Он поделился, что эта статья была отклонена NeurIPS, и призвал студентов сохранять настойчивость перед лицом отказов в публикации статей и продолжать исследования. (Источник: sainingxie)

Deeply Supervised Nets получает награду "Проверка временем" на AISTATS 2025

Обсуждение обзора методов дистилляции LLM: Пользователь Reddit ищет актуальный обзор методов дистилляции LLM, особенно от больших моделей к малым, а также от больших моделей к более специализированным. В обсуждении упоминаются три основных типа: 1. Генерация данных + SFT (простая дистилляция); 2. Дистилляция на основе Logit (требует гомогенности моделей); 3. Дистилляция на основе скрытых состояний (модели могут быть гетерогенными). Также упоминаются связанные инструменты, такие как DistillKit. (Источник: Reddit r/MachineLearning)

Исследование федеративного дообучения LLaMA2: Пользователь Reddit поделился предварительными результатами экспериментов по федеративному дообучению LLaMA2 с использованием FedAvg и FedProx. Эксперимент проводился на наборе данных Reddit TL;DR, сравнивались глобальная валидация ROUGE-L, затраты на связь и дрейф клиента. Результаты показали, что FedProx превосходит FedAvg в снижении дрейфа и незначительном улучшении ROUGE-L, но все еще уступает централизованному дообучению. Сообществу предложено обсудить конфигурации адаптеров, методы сжатия и проблемы стабильности при работе с не-IID данными. (Источник: Reddit r/deeplearning)

💼 Бизнес

Разработчики на платформе Replit монетизируют свои приложения: Два разработчика поделились успешными примерами создания и продажи AI-приложений через платформу Replit. Один разработчик получил свой первый доход в 550 долларов с помощью CreateMVPs.app; приложение другого разработчика, созданное за один день, было продано за 4700 долларов, и он получил больше предложений по проектам. Это показывает потенциал платформ, таких как Replit, в предоставлении разработчикам возможностей для быстрого создания и коммерциализации AI-приложений. (Источник: amasad, amasad)

Разработчики на платформе Replit монетизируют свои приложения

ChatGPT Edu развернут в Медицинской школе Икан на горе Синай: Медицинская школа Икан на горе Синай объявила о предоставлении доступа к ChatGPT Edu всем студентам-медикам и аспирантам. Это знаменует собой внедрение образовательной версии продукта OpenAI в ведущее медицинское учебное заведение с целью использования AI для поддержки медицинского образования и исследований. Видео демонстрирует сценарии его применения. (Источник: gdb)

Постоянные убытки в индустрии венчурного капитала вызывают беспокойство: Sam Altman выразил недоумение по поводу того, что индустрия венчурного капитала (VC) в целом несет долгосрочные убытки, но продолжает получать инвестиции от ограниченных партнеров (LP). Он считает, что хотя инвестирование в ведущие фонды является разумным, феномен постоянных убытков всей отрасли заслуживает размышлений о лежащих в его основе причинах и мотивах LP. (Источник: sama)

🌟 Сообщество

Обсуждение влияния AI на занятость и образование: Сообщество обсуждает потенциальное влияние автоматизации AI на существующие модели работы (интерфейс клавиатура-мышь-экран), а также то, как преподаватели должны реагировать на AI-чат-ботов. Высказывается мнение, что учителя не должны запрещать студентам использовать инструменты вроде ChatGPT, а должны учить, как эффективно и ответственно использовать этот AI, развивая у студентов грамотность в области AI и навыки применения лучших практик. (Источник: NandoDF, NandoDF)

Обсуждение интерпретируемости и безопасности AI: Dario Amodei подчеркивает срочность проблемы интерпретируемости AI моделей, считая понимание принципов их работы критически важным. Neel Nanda высказывает иное мнение: хотя инвестиции в интерпретируемость — это хорошо, не следует преувеличивать ее важность по сравнению с другими методами обеспечения безопасности. Путь к надежной защите мощного AI не ограничивается только интерпретируемостью; она должна быть частью комплекса мер безопасности. (Источник: bookwormengr)

Обсуждение интерпретируемости и безопасности AI

Обсуждение сложности RLHF и феномена “угодничества” моделей: Nathan Lambert и другие обсуждают сложность и важность обучения с подкреплением на основе отзывов человека (RLHF), а также возникающий из-за этого феномен “угодничества” (sycophancy) моделей (например, GPT-4o-simp). В статье утверждается, что RLHF критически важен для выравнивания моделей, но процесс хаотичен, и пользователи часто не понимают его сложности, что приводит к недопониманию или недовольству поведением моделей (например, негативная реакция на LMArena). Понимание внутренних проблем RLHF имеет решающее значение для оценки и улучшения моделей. (Источник: natolambert, aidangomez, natolambert)

Потенциальное влияние AI на когнитивные способности и образ мышления человека: Сообщество обсуждает потенциальное влияние AI на человеческое мышление. Одно из опасений заключается в том, что чрезмерная зависимость от AI приведет к снижению когнитивных способностей (обленивание при чтении, ослабление критического мышления). Другая точка зрения состоит в том, что если AI сможет предоставлять более точную информацию и суждения, он может, наоборот, повысить когнитивный уровень тех людей, чьи мыслительные способности изначально слабее или кто подвержен влиянию дезинформации, выполняя роль “когнитивного усилителя” и помогая принимать лучшие решения. Также обсуждается, что развитие AI может позволить нам глубже понять сознание и даже обнаружить, что некоторые люди могут лишь имитировать сознание. (Источник: riemannzeta, HamelHusain, Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

Обсуждение этики AI и сценариев применения: Обсуждаются вопросы применения AI в медицине, юриспруденции и других областях. Пользователь делится случаем использования ChatGPT врачом при постановке диагноза, что вызывает дискуссию о применении AI в профессиональных сценариях. Одновременно рассматриваются этические аспекты использования AI для написания текстов от чужого имени (ghostwriting), особенно когда сам автор испытывает трудности. Кроме того, выражаются опасения по поводу потенциально вводящего в заблуждение и рискованного контента, генерируемого AI (например, книги о ADHD). (Источник: BorisMPower, scottastevenson, Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

Обсуждение этики AI и сценариев применения

Прогресс в области роботов, управляемых AI: Демонстрируются несколько роботов, управляемых AI: робот, разработанный Google DeepMind, способный играть в настольный теннис; робот-собака, показанный на выставке; робот для инкрустации бриллиантов; дрон, вдохновленный птицами, способный взлетать прыжком; механическое долото для художественного творчества; а также видео с человекоподобным роботом Unitree G1, идущим по торговому центру. Эти демонстрации показывают прогресс AI в управлении роботами, их восприятии и взаимодействии. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

AI и будущее гуманитарных и социальных наук: Цитируется мнение из статьи в The New Yorker, обсуждающее влияние AI на гуманитарные науки. В статье утверждается, что AI не может постичь человеческую “самость” (me-ness) и уникальный человеческий опыт, но в то же время отмечается, что AI, реорганизуя и воспроизводя коллективное человеческое письмо (архивы), способен симулировать значительную часть того, что мы ожидаем получить от отдельных людей, что ставит перед гуманитарными науками вызовы и новые аспекты для размышлений. (Источник: NandoDF)

AI и будущее гуманитарных и социальных наук

💡 Прочее

Использование AI-инструментов для личного совершенствования: Пользователь Reddit поделился успешным опытом использования ChatGPT в качестве личного тренера по фитнесу и питанию. С помощью AI был разработан план тренировок, диета (сочетающая кето, силовые тренировки, голодание и т.д.), и даже получались советы по макронутриентам при заказе еды, что в итоге привело к лучшим результатам, чем с платным тренером-человеком. Это демонстрирует потенциал AI в персонализированном руководстве и помощи в повседневной жизни. (Источник: Reddit r/ChatGPT)

Сочетание AI и способности угадывать географическое положение: Sam Altman ретвитнул и прокомментировал статью о тестировании, в котором AI (возможно, o3) продемонстрировал поразительные способности в Geoguessr (игра на угадывание географического положения). Даже при минимальной информации на изображении (например, только размытый знак или даже чистый градиентный цвет), AI смог включить правильный ответ в варианты, показав мощные способности к распознаванию изображений, сопоставлению образов и выводу географических знаний. (Источник: op7418)

Сочетание AI и способности угадывать географическое положение

Тенденции мобильности исследователей в области AI: График показывает изменения в распределении стран трудоустройства ведущих исследователей в области AI: доля исследователей, работающих в США, снизилась, в то время как доля работающих в Китае значительно возросла. В комментариях сообщества отмечается, что с учетом увеличения возможностей для исследований в Китае и потенциального возвращения талантов, реальный разрыв может быть больше, чем показано на графике, что отражает изменения в глобальной конкуренции за таланты в области AI. (Источник: teortaxesTex, bookwormengr)

Тенденции мобильности исследователей в области AI

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *