Ключевые слова:Qwen3-Next, Генерация видео с помощью ИИ, ИИ-агент, Обучение с подкреплением, Большая языковая модель, Рецензирование с помощью ИИ, Производство фильмов с ИИ, Музыка с ИИ, Гибридный механизм внимания, ИИ-агент Meituan Сяомэй, Фреймворк RhymeRL, Платформа AiraXiv, Студия Utopai
🔥 В центре внимания
Выпуск модели Qwen3-Next: архитектурные инновации для скачка производительности : Команда Alibaba Qwen выпустила Qwen3-Next, предварительную версию Qwen3.5. Модель имеет 80B параметров, но только 3B активных параметров, стоимость обучения составляет менее 1/10 от Qwen3-32B, а пропускная способность инференса в сценариях с длинным контекстом увеличилась более чем в 10 раз. Ключевые улучшения включают механизм смешанного внимания, структуру MoE высокой разреженности, оптимизацию стабильности обучения и механизм прогнозирования нескольких токенов. Qwen3-Next-80B-A3B-Thinking превзошел Gemini-2.5-Flash-Thinking в нескольких бенчмарках, демонстрируя исключительную эффективность и производительность, особенно в задачах математического конкурса AIME и программирования. (Источник: 量子位, Alibaba_Qwen, dejavucoder, awnihannun)

Meituan Agent “Сяомэй” внедрен в сферу бытовых услуг, реализуя удобные функции, такие как голосовой заказ еды на вынос : Meituan запустила интеллектуального секретаря “Сяомэй” (XiaoMei), который, напрямую подключаясь к внутренним сервисам Meituan, позволяет пользователям выполнять такие задачи, как заказ еды на вынос, поиск ресторанов и бронирование столиков, используя только команды на естественном языке, без необходимости сложного графического интерфейса. XiaoMei интегрирован с универсальной большой моделью Meituan LongCat, обладает мощными возможностями обработки естественного языка и понимания сценариев, может рекомендовать блюда в соответствии с предпочтениями пользователя и распознавать неразумные запросы. Это приложение направлено на снижение затрат на обучение работе с технологическими продуктами, повышение эффективности бытовых услуг и превращение инструментов AI в нечто более человечное. (Источник: 量子位)

Университет Западного озера запустил платформу AiraXiv и систему DeepReview: AI-рецензирование ускоряет академическую оценку : Лаборатория обработки естественного языка Университета Западного озера запустила AiraXiv, первую открытую платформу препринтов для академических работ, сгенерированных AI, и систему рецензирования AI DeepReview. AiraXiv используется для централизованного управления статьями, сгенерированными AI, снижая нагрузку на традиционное рецензирование. DeepReview впервые имитирует цепочку рассуждений человеческого эксперта, предоставляя высококачественные рецензии за считанные минуты, включая проверку инновационности, многомерную оценку и проверку надежности. Модель DeepReviewer-14B превзошла GPT-o1 и DeepSeek-R1 в оценках, что, как ожидается, ускорит отбор статей, сгенерированных AI, и эффективность академического обмена. (Источник: 量子位)

Университет Цзяотун и ByteDance объединились для преодоления узких мест в обучении с подкреплением: скорость обучения RhymeRL выросла в 2,6 раза : Исследовательские группы Шанхайского университета Цзяотун и ByteDance представили фреймворк RhymeRL, направленный на решение проблемы низкой эффективности обучения с подкреплением (RL). Используя “историческое сходство” ответов, генерируемых моделью, RhymeRL внедряет две ключевые технологии: HistoSpec и HistoPipe. HistoSpec вводит спекулятивное декодирование в RL, повторно используя исторические ответы в качестве “лучшего сценария” для пакетной проверки; HistoPipe, в свою очередь, максимизирует использование вычислительной мощности GPU за счет пошагового комплементарного планирования. Результаты экспериментов показывают, что RhymeRL увеличивает пропускную способность обучения RL до 2,61 раза без ущерба для точности, значительно ускоряя итерации моделей AI. (Источник: 量子位)

Бывшая команда Google X основала AI-нативную киностудию Utopai Studios, предварительные продажи превысили 100 миллионов долларов : Utopai Studios, основанная бывшими членами команды Google X, является первой в мире AI-нативной киностудией, которая уже достигла 110 миллионов долларов предварительных продаж благодаря производству контента на основе AI и глобальному распространению. Компания использует процедурную генерацию контента (PCG) для создания основы 3D-активов, разрабатывает “пространственную грамматику” для понимания пространственного порядка и использует AI Agent для интерпретации нечетких творческих инструкций, в конечном итоге достигая промышленного цикла Previz-to-Video, решая проблемы согласованности, управляемости и непрерывности повествования в генерации видео AI. Utopai стремится снизить затраты на кинопроизводство, освободить создателей и уже сотрудничает с известными голливудскими компаниями по продажам и визуализации. (Источник: 量子位)

🎯 Тенденции
Технологии генерации видео AI продолжают развиваться, сосуществуя с вызовами и возможностями : Модели генерации видео AI, такие как Sora от OpenAI, Veo 3 от Google DeepMind и Gen-4 от Runway, достигли значительного прогресса за последние девять месяцев, способные генерировать практически indistinguishable видеофрагменты. Veo 3 впервые реализовал синхронную генерацию видео и аудио. Однако видео, сгенерированные AI, также несут с собой проблемы, такие как распространение “AI-мусора”, риск фейковых новостей и огромное потребление энергии. Технологическое ядро — это модели латентного диффузионного Transformer, которые, сжимая видеокадры в латентное пространство и комбинируя их с моделями Transformer для обработки последовательных данных, повышают эффективность генерации и согласованность между кадрами. (Источник: MIT Technology Review, MIT Technology Review, c_valenzuelab, NerdyRodent)

Meta выпустила видеомодель V-JEPA 2, которая игнорирует несущественные детали с помощью самообучения : Главный AI-ученый Meta Yann LeCun представил V-JEPA 2, новую самообучающуюся видеомодель, которая учится игнорировать несущественные детали для понимания важной информации. Эта модель превосходит существующие системы в прогнозировании движения, предвосхищении действий и управлении роботами, что знаменует новый прогресс AI в понимании видео и обучении роботов. (Источник: ylecun)
AI обладает огромным потенциалом в области открытия лекарств, что может значительно сократить цикл исследований и разработок : Генеральный директор Google DeepMind Demis Hassabis заявил, что AI может сократить время открытия лекарств до менее чем одного года или даже быстрее. Этот прогноз подчеркивает огромный потенциал AI в ускорении научных исследований и медицинских инноваций, хотя его реализация по-прежнему сталкивается с проблемами. (Источник: MIT Technology Review)
Библиотека Hugging Face Transformers выпустит версию v5, представляющую новые функции, такие как Continuous Batching : Библиотека Hugging Face Transformers готовится к выпуску версии v5, призванной предоставить более продвинутую, стабильную и простую в разработке библиотеку ML. Новая версия представит функцию Continuous Batching, упростит циклы оценки и обучения, повысит эффективность инференса и оптимизирует кодовую базу, удалив старые предупреждения и устаревший код, чтобы обеспечить лучший опыт “из коробки”. (Источник: clefourrier, huggingface, mervenoyann, huggingface)
Фреймворки AI Agent становятся следующим фокусом конкуренции для AI-лабораторий : По мере того как большие модели становятся все более коммерциализированными, фреймворки AI Agent становятся новым полем битвы для AI-лабораторий. Эти фреймворки позволяют моделям планировать, вызывать инструменты и принимать решения о выполнении задач, превращая AI из простого языкового вывода в автономного агента, выполняющего задачи. Это предвещает переход AI-приложений от внешнего режима управления “подсказка + код” к внутреннему режиму, где модель принимает решения самостоятельно, что значительно повышает практичность и гибкость AI. (Источник: dzhng, dotey)

Китайская AI-модель, вдохновленная мозгом, заявляет о 25-кратном превосходстве в скорости над ChatGPT : Сообщается, что китайские ученые разработали AI-модель, вдохновленную мозгом (“brain-inspired”), которая в 25 раз быстрее ChatGPT. Если это правда, это станет значительным прорывом в области AI, который может привести к революционным изменениям в архитектуре моделей и вычислительной эффективности. Однако в настоящее время отсутствует сторонняя проверка, и ее реальная производительность еще предстоит оценить. (Источник: Reddit r/ArtificialInteligence)

AI демонстрирует новые возможности в науке, DeepMind лидирует в развитии AI-ученых : Google DeepMind продемонстрировала AI-систему, способную писать научное программное обеспечение экспертного уровня и изобретать новые методы в таких областях, как биоинформатика, эпидемиология, геопространственный анализ, превосходя даже человеческий уровень. Это указывает на растущую роль AI в научных открытиях и исследованиях, что, как ожидается, будет способствовать дальнейшему развитию “AI-ученых”. (Источник: shaneguML)

Гуманоидные роботы и модели визуального языка и действий: революционные достижения в робототехнике : Технологии и применение гуманоидных роботов продолжают развиваться, постепенно проникая в такие области, как заводы и логистика, демонстрируя потенциал автоматизации. В то же время прорыв в моделях визуального языка и действий (VLAMs) позволяет роботам более эффективно обрабатывать сложные визуальные данные, понимать языковые инструкции и выполнять точные физические действия, продвигая роботов от выполнения одной задачи к более универсальным и адаптивным направлениям. Хотя отрасль по-прежнему сталкивается с проблемой ажиотажа, снижение стоимости оборудования, прогресс AI и увеличение инвестиций ускоряют созревание робототехнической промышленности, особенно в таких областях, как здравоохранение, уход за пожилыми людьми, производство и складирование. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Reddit r/ArtificialInteligence)
🧰 Инструменты
Replit AI Agent демонстрирует выдающиеся возможности самотестирования и автоматизации : AI Agent от Replit демонстрирует выдающиеся возможности самотестирования и автоматизации. Например, он может автономно выполнять сквозные UI-тесты, тестировать инструменты в приложении для доски, кнопки отмены и даже отправлять сообщения в чат. Кроме того, пользователи обнаружили, что Replit AI Agent может работать автономно в течение длительного времени и является экономически эффективным, что указывает на его огромный потенциал в автоматизированном тестировании и рабочих процессах разработки. (Источник: amasad, amasad)
Kling AI запускает новую функцию Avatar и обновляет технологию синхронизации губ : Kling AI представила новую функцию Avatar и обновила свою существующую технологию синхронизации губ (Lip Sync). Новая функция, являющаяся частью модуля Avatar, предоставит пользователям более реалистичный и естественный опыт взаимодействия с виртуальными персонажами, особенно подходящий для создания контента и виртуальных социальных сценариев. (Источник: Kling_ai)
Qodo Aware: глубокий исследовательский Agent для корпоративных кодовых баз : Qodo Aware — это готовый к производству глубокий исследовательский Agent, разработанный специально для навигации и понимания крупномасштабных корпоративных кодовых баз. Он помогает разработчикам и командам лучше управлять и анализировать сложные кодовые базы, решать проблемы адаптации новых сотрудников, отслеживания ошибок и планирования рефакторинга, повышая эффективность разработки и качество кода. (Источник: TheTuringPost)
AI-браузеры: Perplexity Comet и Neo улучшают интеллектуальный просмотр : Perplexity выпустила AI-браузер Comet, предлагающий такие функции, как AI-резюмирование, генерация викторин и автоматическая организация вкладок. Браузер Neo также интегрирует AI, обеспечивая суммирование писем Gmail, управление вкладками и персонализированную ленту новостей, а также поддерживает локальную работу AI для защиты конфиденциальности. Эти два AI-браузера призваны повысить эффективность просмотра и производительность пользователей с помощью интеллектуальных функций, предоставляя им более удобный и персонализированный опыт работы в сети. (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)
WEBGEN-OSS: LLM для веб-дизайна, работающий на ноутбуке : WEBGEN-OSS-20B — это открытая модель с 20B параметрами, специально разработанная для генерации адаптивных веб-сайтов из одного запроса. Эта компактная модель может работать локально, обеспечивая быструю итерацию, и была доработана для генерации современного HTML/CSS (с использованием Tailwind). Она предпочитает семантический HTML и современные блоки компонентов, предоставляя эффективное локальное решение для генерации веб-страниц для индивидуальных разработчиков и дизайнеров. (Источник: Reddit r/LocalLLaMA)

Игра на основе LLM “Among LLMs: You are the Impostor” : Python-терминальная игра под названием “Among LLMs: You are the Impostor” использует модели Ollama и gpt-oss:20b, позволяя игрокам выступать в роли человеческого “самозванца” в чате, состоящем из AI-агентов. Игроки должны использовать такие стратегии, как манипулирование диалогом, редактирование, шепот и газлайтинг, чтобы заставить AI-агентов противостоять друг другу и в конечном итоге выжить. Эта игра демонстрирует потенциал LLM в создании интерактивных повествований и сложных ролевых игр. (Источник: Reddit r/LocalLLaMA)

AI оживляет старые картины, повышая эффективность художественного творчества : Технологии AI используются для преобразования старых картин или набросков в анимацию или цветные произведения, открывая новые возможности для художественного творчества. Например, модель Kling v2.1 может анимировать нарисованную от руки лису и бабочек, а такие инструменты, как ChatGPT и Gemini Nano Banana, могут раскрашивать картины 15-летней давности. Хотя пользователи по-прежнему спорят о “душе” и оригинальности произведений, сгенерированных AI, их преимущества в эффективности и увлекательности очевидны. (Источник: Reddit r/ChatGPT, Reddit r/artificial)

📚 Обучение
Понимание архитектуры GPU имеет решающее значение для AI-инженеров : Ресурсы по пониманию архитектуры GPU, предоставленные Корнеллским университетом, рекомендуются AI-инженерам и исследователям. GPU достигают высокой пропускной способности, разбивая большие задачи на мелкие и распределяя их по тысячам простых ядер, что особенно подходит для повторяющихся матричных и тензорных вычислений при обучении AI-моделей. Понимание архитектуры GPU помогает оптимизировать производительность глубокого обучения, выбирать подходящее оборудование и удовлетворять растущие потребности в вычислительной эффективности в области AI. (Источник: algo_diver, halvarflake, TheTuringPost, TheTuringPost)

Обзор применения обучения с подкреплением в больших языковых моделях : Привлечен внимание всеобъемлющий обзорный отчет о применении обучения с подкреплением (RL) в больших языковых моделях (LLM). Отчет охватывает преобразование LLM в LRM с помощью RL (математика, код, рассуждения), разработку вознаграждений, оптимизацию стратегий, выборку, сравнение RL и SFT, методы обучения, а также применение в таких областях, как кодирование, Agent, мультимодальность и робототехника, а также перспективы будущих методов, предоставляя исследователям всесторонние учебные ресурсы. (Источник: TheTuringPost, TheTuringPost)

Дорожная карта обучения AI Agent и объяснение концепции Agentic AI : Python_Dv поделился дорожной картой обучения AI Agent и объяснением концепции Agentic AI. Эти ресурсы предоставляют структурированный путь обучения для разработчиков, желающих углубить свои знания в области AI Agent, охватывая определение, функции, сценарии применения и важность AI Agent в развитии AI, помогая понять переход AI от пассивного реагирования к активному выполнению. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

Исследование проблемы “галлюцинаций” LLM: обучение и бенчмаркинг поощряют чрезмерно уверенные догадки : В статье OpenAI указывается, что “галлюцинации” AI-моделей не являются дефектом самой модели, а скорее результатом того, что механизмы обучения и бенчмаркинга поощряют чрезмерно уверенные догадки, а не честность. В статье предлагается изменить метод оценки бенчмарков, не наказывать модели за ответы “я не знаю” и пересмотреть существующие рейтинги, чтобы решить эту ключевую проблему и способствовать более надежному развитию AI-моделей. (Источник: TheTuringPost)

Исследование архитектуры “настоящей” памяти LLM: постоянный слой памяти, выходящий за рамки RAG : Разработчики исследуют возможность предоставления LLM “настоящего” слоя долговременной памяти, а не традиционной модели RAG (Retrieval Augmented Generation). Они создали систему “память как услуга” (BrainAPI), которая хранит знания с помощью встраиваний и графовых структур, позволяя Agent вспоминать факты, документы или прошлые взаимодействия, как если бы у них была постоянная память. Это вызвало дискуссию о том, должна ли память AI быть внешней базой данных или внутренними адаптивными весами, с целью решения проблемы отсутствия точного контекста у LLM в кросс-сессиях. (Источник: Reddit r/artificial)
Исследование долгосрочного выполнения LLM: замедление прогресса AI — это “иллюзия” : Статья под названием “The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs” указывает, что представление о замедлении прогресса AI является “иллюзией”. Исследование показывает, что масштабирование во время тестирования (test-time scaling) значительно полезно для автономных Agent с длительным горизонтом, и медленный прогресс моделей в одношаговой точности достаточен для сверхэкспоненциального роста возможностей выполнения долгосрочных задач. Это исследование подчеркивает необходимость постоянного внимания к размеру модели и вычислениям во время тестирования для продвижения будущего Agentic AI. (Источник: lateinteraction, Reddit r/MachineLearning)

Необходимые навыки и ресурсы для AI-инженеров и исследователей : Сообщество обсудило необходимые навыки и ресурсы для AI-инженеров и исследователей. Это включает глубокое понимание архитектуры GPU, эффективные стратегии обучения LLM, а также способность развертывать модели и создавать сквозные системы. Для студентов и специалистов, желающих войти или углубиться в область AI, освоение этих основных знаний и практических навыков имеет решающее значение. (Источник: Reddit r/deeplearning, Reddit r/deeplearning, Reddit r/deeplearning)

💼 Бизнес
OpenAI и Microsoft достигли пересмотренного соглашения, ускоряя поиск модели получения прибыли : OpenAI и Microsoft достигли пересмотренного соглашения, но конкретные детали пока не разглашаются. Этот шаг происходит в то время, когда OpenAI стремится к своей коммерческой трансформации и сталкивается с проблемой необходимости привлечения большего числа платных пользователей. Соглашение может включать новые условия сотрудничества или инвестиционные структуры для поддержки дальнейшего развития и коммерциализации OpenAI. (Источник: MIT Technology Review)
Mistral AI завершила раунд финансирования серии C на 1,7 миллиарда евро, ASML возглавила раунд, оценка компании достигла 14 миллиардов долларов : Mistral AI объявила о завершении раунда финансирования серии C на сумму 1,7 миллиарда евро (около 2 миллиардов долларов США), который возглавил голландский производитель полупроводникового оборудования ASML, при этом оценка компании достигла 14 миллиардов долларов США. Этот огромный объем финансирования еще больше укрепит конкурентоспособность Mistral AI в области AI, ускорит разработку ее моделей и расширение рынка, а также подчеркнет стратегические инвестиции полупроводниковых гигантов в будущее развитие AI. (Источник: dl_weekly)
xAI уволила 500 сотрудников, обучавших Grok AI, что вызвало опасения по поводу влияния AI на занятость : Компания xAI Илона Маска уволила 500 сотрудников, отвечавших за обучение Grok AI. Этот шаг вызвал дискуссии о влиянии AI на рынок труда, особенно о том, заменит ли сам AI своих разработчиков и специалистов по обучению. Это сокращение может отражать оптимизацию затрат или корректировку стратегии обучения xAI, но, несомненно, усиливает опасения общественности по поводу перспектив занятости в эпоху AI. (Источник: Reddit r/ChatGPT)

🌟 Сообщество
“Галлюцинации” AI-моделей и достоверность: опасения пользователей по поводу подлинности контента AI : В социальных сетях широко обсуждается проблема “галлюцинаций” контента, генерируемого AI-моделями, особенно в художественном творчестве и новостных репортажах. Пользователи скептически относятся к “душе” и оригинальности произведений искусства, созданных AI, и опасаются, что социальные сети будут наводнены фейковыми новостями. Исследование OpenAI указывает, что галлюцинации моделей могут быть вызваны тем, что обучение и бенчмаркинг поощряют чрезмерно уверенные догадки. Кроме того, применение AI в рекламе, например, использование AI-изображений в Kebab-кафе, также вызвало дискуссии о подлинности контента и этике. (Источник: Reddit r/artificial, Reddit r/artificial, teortaxesTex)

Влияние AI на рынок труда: сотрудничество человека и AI или замена человеком AI : Дискуссии о влиянии AI на рынок труда продолжают набирать обороты. С одной стороны, некоторые считают, что “вас может заменить человек, использующий AI, а не сам AI”, подчеркивая важность владения инструментами AI. С другой стороны, увольнение 500 сотрудников xAI, занимавшихся обучением Grok AI, напрямую вызвало опасения по поводу замены человеческого труда AI, особенно на должностях, непосредственно связанных с разработкой и обучением AI. (Источник: Ronald_vanLoon, Reddit r/ChatGPT)

Безопасность и выравнивание AI: от пессимизма к практическим вызовам : Безопасность и выравнивание AI являются центральными темами обсуждений в сообществе. Пессимисты, такие как Eliezer Yudkowsky, предупреждают, что AI может привести к вымиранию человечества, и призывают закрыть AI-компании. Генеральный директор DeepMind Demis Hassabis, напротив, считает, что нынешний AI далек от “интеллекта уровня доктора наук”, подчеркивая, что он все еще совершает элементарные ошибки. В то же время исследователи активно изучают глубинные причины “проблемного поведения” AI-моделей для решения потенциальных проблем несоответствия. (Источник: teortaxesTex, shaneguML, MillionInt, NeelNanda5, RichardMCNgo, ylecun, ClementDelangue, scaling01, 量子位, Reddit r/ChatGPT)

Применение AI в финансовой сфере: возможности и риски : Пользователь поделился опытом, как ChatGPT помог ему удвоить свои сбережения на фондовом рынке за три месяца, что вызвало дискуссию о применении AI в финансовой сфере. Хотя некоторые считают это случайностью бычьего рынка, другие отмечают, что AI может давать плохие инвестиционные советы, но его потенциал в анализе и отборе рынка по-прежнему признается. В то же время, юмористические предположения о “торговой версии Cursor” отражают как ожидание, так и осторожность в отношении финансовых приложений AI. (Источник: Reddit r/ChatGPT)

AI Agent и производительность LLM: модели рассуждений, длинный контекст и компромисс эффективности : Сообщество активно обсуждает роль моделей рассуждений в LLM: некоторые пользователи считают, что они тратят токены впустую, в то время как другие подчеркивают их ключевую ценность в сложных задачах, следовании инструкциям и социальных сценариях. Улучшение способности обработки длинного контекста рассматривается как значительный признак прогресса AI. В то же время, обсуждения узких мест GPU, различий в производительности A100 и A5000, а также выбора между Mac Studio и NVIDIA PC для глубокого обучения, отражают обеспокоенность пользователей производительностью аппаратного обеспечения AI и экономической эффективностью. (Источник: Reddit r/LocalLLaMA, Reddit r/deeplearning, Reddit r/deeplearning, Reddit r/deeplearning)
Практическая ценность AI в повседневной работе: решение реальных проблем : Пользователь поделился опытом использования ChatGPT для решения проблемы с работой упаковочной машины для картона в супермаркете, что демонстрирует потенциал AI в решении практических задач в повседневной работе. Такие случаи показывают, что AI является инструментом не только в высокотехнологичных областях, но также может повышать эффективность в обычных отраслях, помогая сотрудникам справляться с трудностями. (Источник: Reddit r/ArtificialInteligence)
Влияние AI на критическое мышление: осторожность при аутсорсинге мозга : Статья MIT Technology Review указывает, что критическое мышление не следует отдавать на аутсорсинг чат-ботам, что вызвало дискуссию о том, как AI меняет человеческое мышление. Пользователи обеспокоены тем, что чрезмерная зависимость от AI может ослабить способность человека к независимому мышлению, подчеркивая важность сохранения бдительности и критического мышления, наслаждаясь удобствами AI. (Источник: MIT Technology Review)
Проблемы производительности ChatGPT: зависания, ограничения скорости и альтернативы : Пользователи ChatGPT жалуются на зависание окна при слишком длинных диалогах, ограничения скорости и нестабильность сервиса. Некоторые пользователи даже утверждают, что GPT-4o посоветовал им перейти к конкурентам. Эти проблемы отражают трудности OpenAI в предоставлении стабильных и эффективных услуг, что побуждает некоторых пользователей рассматривать альтернативы, такие как Claude, и вызывает дискуссии о поведении LLM и ограничениях контекстного окна. (Источник: Reddit r/ArtificialInteligence, Reddit r/ChatGPT, Reddit r/ChatGPT)

Музыка AI наводняет стриминговые сервисы, вызывая споры об авторских правах и качестве : Музыкальные стриминговые сервисы “затоплены” песнями, сгенерированными AI, что вызывает широкие дискуссии о авторских правах, качестве контента и творческой этике. Пользователи ставят под сомнение “мошеннический” и “бездушный” характер песен AI, а также исследуют границы между AI-творчеством и человеческим творчеством в музыке, а также потенциальное влияние на будущее музыкальной индустрии. (Источник: Reddit r/artificial)

Иски об авторских правах на AI продолжают расти: Британская энциклопедия подала в суд на Perplexity : Британская энциклопедия и Merriam-Webster подали в суд на AI-поисковик Perplexity за предполагаемое нарушение авторских прав. Это один из растущего числа исков о нарушении авторских прав в области генерации контента AI, что подчеркивает юридические и этические проблемы балансирования инноваций и защиты авторских прав, когда AI использует существующие данные для обучения и генерации контента. (Источник: MIT Technology Review)
Нехватка AI-талантов и пробелы в навыках: вызовы для лидеров : Нехватка AI- и технических талантов становится препятствием для роста предприятий, что считается “тревожным звонком для каждого лидера”. Это указывает на растущую потребность в развитии талантов и повышении квалификации в условиях быстрого развития технологий AI, и предприятиям необходимо принимать активные меры для восполнения кадрового дефицита, чтобы адаптироваться к будущему развитию. (Источник: Ronald_vanLoon)

“Парадокс населения” Илона Маска: противоречие между роботами и рождаемостью : Сообщество обсудило “парадокс населения” Илона Маска, касающийся снижения рождаемости и развития робототехники. С одной стороны, он обеспокоен снижением рождаемости и призывает к увеличению населения; с другой стороны, он активно инвестирует в AI и роботов, технологии, которые могут автоматизировать большое количество рабочих мест, снижая потребность в рабочей силе. Это вызывает размышления о будущей роли человека, универсальном базовом доходе и социальном влиянии AI. (Источник: Reddit r/ArtificialInteligence)
💡 Прочее
AI-голосовое взаимодействие: ключевые элементы для создания человекоподобного опыта : Ключ к созданию человекоподобного AI-голоса заключается в системном дизайне, а не в самой модели. Для достижения естественного и плавного AI-голоса необходимо соблюдение пяти основных элементов: задержка ответа от начала до конца менее 300 миллисекунд, поддержка крупномасштабной параллельной обработки, поддержка бесшовного переключения между более чем 30 языками, бесшовное переключение между несколькими Agent, а также полное тестирование прерываний, фонового шума и переключения контекста с помощью симуляции перед производством. Кроме того, возможности корпоративной интеграции (чтение/запись в CRM в реальном времени, запуск инструментов и т. д.) также имеют решающее значение для обеспечения глубокой интеграции AI-голоса в бизнес-процессы. (Источник: Ronald_vanLoon)
Cohere и Dell сотрудничают для предоставления корпоративных локальных AI-решений : Cohere сотрудничает с Dell Technologies, чтобы помочь предприятиям развертывать безопасные, локализованные AI-решения. Это партнерство сосредоточено на конфиденциальности данных, скорости и масштабе, и через Cohere North и Dell AI Factory оно делает процесс внедрения AI более плавным, удовлетворяя строгие требования предприятий к развертыванию AI. (Источник: cohere)
Toronto School of Foundation Modelling получила спонсорскую поддержку от Modal в области вычислений : Toronto School of Foundation Modelling получила спонсорскую поддержку от Modal в области вычислений. Школа будет использовать Modal Notebooks, среду Python в браузере с поддержкой GPU, которая обеспечивает запуск за секунды и совместную работу в реальном времени, позволяя студентам немедленно начать эксперименты с AI. Этот шаг предоставит мощную вычислительную поддержку для тех, кто изучает базовые модели AI. (Источник: JayAlammar)