Ключевые слова:Квантовые вычисления, Алгоритмы ИИ, Архитектура Transformer, Регулирование ИИ, Бизнес-тенденции ИИ, Этика ИИ, Аппаратное обеспечение ИИ, Оценка моделей ИИ, Квантовый алгоритм Google Willow, Мета-свободный подсознательный слой Transformer, DeepSeek-V2 многоголовый латентный механизм внимания, Видеокарта AMD Radeon AI PRO R9700, Безопасный слой генерации кода ИИ Corridor

🔥 В центре внимания

Квантовый алгоритм Google превзошел суперкомпьютеры: Google заявляет, что ее новый квантовый алгоритм превосходит суперкомпьютеры по производительности, что обещает ускорить разработку лекарств и новых материалов. В основе этого прорыва лежит чип Willow, и хотя практическое применение квантовых вычислений еще займет несколько лет, этот прогресс знаменует собой важную веху в этой области, предвещая огромный потенциал для будущих научных исследований. (Источник: MIT Technology Review)

Reddit подает в суд на ИИ-поисковик Perplexity: Reddit подал в суд на ИИ-поисковик Perplexity, обвиняя его в незаконном сборе данных Reddit для обучения моделей. Reddit добивается постоянного судебного запрета, чтобы не допустить продажи такими компаниями его данных без разрешения. Этот случай вызвал широкие дискуссии о защите авторских прав и законности использования данных в эпоху ИИ. (Источник: MIT Technology Review)

Пятилетний план Китая: технологическая самодостаточность и ключевая роль ИИ: Китай опубликовал пятилетний план, направленный на достижение технологической самодостаточности, определив полупроводники и искусственный интеллект как ключевые области развития. Этот шаг подчеркивает стратегическую решимость Китая в области технологий и стремление получить преимущество в международной торговой конкуренции, что вызывает глобальную обеспокоенность по поводу цепочек поставок технологий и изменений в геополитическом ландшафте. (Источник: MIT Technology Review)

OpenAI ослабила правила обсуждения самоубийств, что привело к иску: OpenAI обвиняется в двукратном ослаблении правил обсуждения самоубийств для увеличения числа пользователей ChatGPT, что привело к самоубийству подростка. Родители жертвы подали в суд, утверждая, что изменения OpenAI ослабили защиту пользователей от самоубийств, что вызвало серьезные вопросы об этике ИИ, безопасности пользователей и ответственности платформы. (Источник: MIT Technology Review)

Маск создает армию роботов, Optimus может стать «хирургом»: Илон Маск активно создает армию роботов и предполагает, что его робот Optimus в будущем сможет стать «выдающимся хирургом». Это видение вызвало широкие дискуссии о возможностях универсальных роботов, доверии между человеком и машиной, а также применении ИИ в сложных профессиональных областях, предвещая будущее, в котором робототехника будет играть более важную роль в реальном мире. (Источник: MIT Technology Review)

🎯 Тенденции

Meta выпустила «свободный Transformer»: переписывая базовые правила ИИ: Meta представила новую модель «свободный Transformer», которая нарушает основные правила архитектуры Transformer, действовавшие 8 лет, вводя «подсознательный слой» для предварительного мышления перед генерацией. Это нововведение увеличивает вычислительные затраты всего на 3%, но значительно улучшает производительность модели в задачах логического вывода и структурированной генерации, превосходя более крупные модели в тестах GSM8K, MMLU и других. Это считается первым Transformer с «внутренним намерением». (Источник: 36氪)

Meta нарушила 8-летние правила Transformer, переписав базовые правила ИИ, и у модели впервые появилось подсознание.

Роботы Google DeepMind реализуют принцип «сначала подумай, потом действуй»: Модель Gemini Robotics 1.5 от Google DeepMind позволяет роботам переходить от пассивного выполнения команд к рефлексии, рассуждению и принятию решений. Эти роботы могут объяснять свои рассуждения, передавать знания между машинами и интегрировать зрение, язык и действия в единый мыслительный цикл, что обещает вывести реальный интеллект и человеко-машинное сотрудничество на новый уровень. (Источник: Ronald_vanLoon)

Stanford AgentFlow повышает способность малых моделей к рассуждению: Команда Стэнфорда представила новую парадигму AgentFlow, которая с помощью онлайн-обучения с подкреплением значительно повышает производительность малых моделей 7B в сложных задачах рассуждения, превосходя даже GPT-4o и Llama3.1-405B. AgentFlow состоит из четырех агентов, работающих совместно: планировщика, исполнителя, верификатора и генератора. Он использует Flow-GRPO для оптимизации планировщика в реальном времени, демонстрируя значительное улучшение в задачах поиска, агентов, математики и науки. (Источник: 36氪)

Онлайн-обучение с подкреплением ИИ «учится на ходу», команда Стэнфорда значительно повышает производительность малых моделей 7B, превосходя даже GPT-4o

ИИ обнаружил новый алгоритм MoE: повышение эффективности в 5 раз, снижение затрат на 26%: Исследовательская группа Калифорнийского университета в Беркли представила систему ADRS, которая с помощью итеративного цикла «генерация-оценка-улучшение» позволяет ИИ обнаруживать новые алгоритмы в 5 раз быстрее и на 26% дешевле, чем алгоритмы, разработанные человеком. Основываясь на фреймворке OpenEvolve, ИИ обнаружил умные эвристики в таких задачах, как балансировка нагрузки MoE, значительно повышая эффективность работы и демонстрируя огромный потенциал ИИ в создании алгоритмов. (Источник: 36氪)

ИИ за пять часов обнаружил новый алгоритм MoE, который в 5 раз быстрее человеческого и снижает затраты на 26%

Anthropic расширяет использование Google TPU, укрепляя инфраструктуру вычислений ИИ: Anthropic объявила о планах расширить использование Google TPU, обеспечив доступ к примерно 1 миллиону TPU и более 1 гигаватту мощности к 2026 году. Этот шаг демонстрирует огромные инвестиции Anthropic в инфраструктуру вычислений ИИ, а также глубокое сотрудничество с Google в области ИИ, предвещая дальнейшее увеличение масштабов обучения моделей ИИ в будущем. (Источник: Justin_Halford_)

Механизм многоголового латентного внимания DeepSeek-V2 вызывает дискуссии: Введение DeepSeek-V2 механизма многоголового латентного внимания (MLA), который значительно снижает сложность за счет проецирования ключей и значений в латентное пространство, вызвало в академических кругах дискуссии о том, почему эта концепция не появилась раньше. Хотя Perceiver уже исследовал аналогичные идеи в 2021 году, MLA появился только в 2024 году, что может потребовать определенных «хитростей» для его практической реализации. (Источник: Reddit r/MachineLearning)

Создание видеоконтента с помощью ИИ достигло переломного момента: Создание видеоконтента с помощью ИИ достигло переломного момента, постоянно появляются хиты, например, запуск Sora 2 на платформе Synthesia, а также музыкальное видео на тему «Путешествия на Запад», сгенерированное ИИ на Bilibili, набравшее миллионы просмотров. Это демонстрирует огромный потенциал ИИ в области генерации развлекательного контента, который быстро меняет ландшафт создания контента. (Источник: op7418)

Создание видеоконтента с помощью ИИ действительно достигло переломного момента

Соавтор статьи «Attention Is All You Need» Ллион Джонс «устал» от архитектуры Transformer: Ллион Джонс, соавтор статьи «Attention Is All You Need», выразил «усталость» от чрезмерной зависимости области ИИ от архитектуры Transformer, считая, что это препятствует новым технологическим прорывам. Он отметил, что, несмотря на огромные инвестиции в область ИИ, исследования стали узконаправленными из-за давления инвестиций и конкуренции, что может привести к упущению следующего крупного архитектурного нововведения. (Источник: Reddit r/ArtificialInteligence)

Прогресс в поддержке модели Qwen3 Next в llama.cpp: Поддержка модели Qwen3 Next в llama.cpp готова к проверке кода. Хотя это не окончательная версия и она еще не оптимизирована по скорости, это знаменует собой активный прогресс открытого сообщества в интеграции новых моделей, предвещая возможность локального запуска Qwen3. (Источник: Reddit r/LocalLLaMA)

Поддержка Qwen3 Next в llama.cpp готова к проверке

Модель GLM-4.6-Air находится в процессе непрерывного обучения: Модель GLM-4.6-Air все еще находится в процессе обучения, и команда прилагает дополнительные усилия для повышения ее стабильности и надежности. Сообщество пользователей выражает ожидания, предпочитая дольше ждать, чтобы получить более качественную модель, и интересуется, сможет ли она превзойти существующие модели по производительности. (Источник: Reddit r/LocalLLaMA)

GLM-4.6-Air не забыт!

DyPE: независимый от обучения метод для генерации диффузионных изображений сверхвысокого разрешения: В статье HuggingFace представлен DyPE (Dynamic Position Extrapolation), новый метод, который позволяет предварительно обученным диффузионным Transformer генерировать изображения со значительно более высоким разрешением, чем разрешение обучения, без дополнительного обучения. DyPE динамически регулирует позиционное кодирование модели, используя спектральную эволюцию процесса диффузии, что значительно улучшает производительность и точность на нескольких бенчмарках, особенно при высоком разрешении. (Источник: HuggingFace Daily Papers)

Парадигма «мыслительной коммуникации» между несколькими агентами: В статье HuggingFace представлена парадигма «мыслительной коммуникации», которая позволяет системам с несколькими агентами напрямую обмениваться мыслями, преодолевая ограничения естественного языка. Этот метод, формализованный как модель со скрытыми переменными, теоретически может идентифицировать общие и частные скрытые мысли между агентами и был проверен на синтетических и реальных бенчмарках, подтверждая его преимущества в сотрудничестве. (Источник: HuggingFace Daily Papers)

LALM уязвимы при изменении эмоций: В статье HuggingFace обнаружено, что большие аудио-языковые модели (LALM) имеют значительные уязвимости безопасности при изменении эмоций говорящего. Создав набор данных вредоносных голосовых команд, исследование показало, что LALM производят небезопасные ответы на разных уровнях эмоций и интенсивности, при этом средние эмоциональные выражения представляют наибольший риск, что подчеркивает необходимость обеспечения надежности ИИ при развертывании в реальном мире. (Источник: HuggingFace Daily Papers)

OpenAI разработала план «ИИ-державы» для Японии и Южной Кореи: OpenAI опубликовала «Экономический план для Японии» и «Экономический план для Южной Кореи», что знаменует собой переход ее азиатско-тихоокеанской стратегии от экспорта продуктов к сотрудничеству на государственном уровне. План предлагает двухпутную стратегию «создания суверенных возможностей + стратегическое сотрудничество» и трехстолбовую программу «инклюзивный ИИ, инфраструктура, непрерывное обучение», направленную на ускорение применения ИИ, модернизацию вычислительной инфраструктуры и помощь обеим странам стать мировыми лидерами в области ИИ. (Источник: 36氪)

Альтман лично разработал план «ИИ-державы» для Японии и Южной Кореи

Фреймворк ExGRPO: новая парадигма обучения рассуждению для больших моделей: Команда Шанхайской лаборатории искусственного интеллекта и другие предложили фреймворк ExGRPO для управления и обучения опытом, который оптимизирует способность больших моделей к рассуждению путем научного выявления, хранения, фильтрации и изучения ценного опыта. ExGRPO значительно улучшает производительность в сложных задачах, таких как математические олимпиадные задачи, выявляя, что задачи средней сложности и траектории с низкой энтропией являются ключом к эффективному обучению, избегая проблемы «выучил и забыл», присущей традиционным моделям RLVR. (Источник: 量子位)

Новая парадигма обучения рассуждению для больших моделей! Фреймворк ExGRPO: от слепого решения задач к умному обзору

🧰 Инструменты

DeepSeek-OCR и Zhipu Glyph: прорыв в технологии визуальных токенов: DeepSeek выпустила DeepSeek-OCR с 3 миллиардами параметров в открытый доступ, инновационно позволяя ИИ оптически сжимать текст, «читая картинки», достигая 10-кратного сжатия и 97% точности OCR. Zhipu вскоре последовала за ним, выпустив Glyph, который также значительно сокращает контекст LLM и повышает эффективность и скорость обработки, преобразуя длинный текст в визуальные токены, похожие на изображения. Эти модели получили поддержку в vLLM, демонстрируя огромный потенциал визуальной модальности в обработке информации LLM. (Источник: 36氪, 量子位, vllm_project, mervenoyann)

ИИ снова эволюционировал, DeepSeek снова запускает «козырную» новую функцию

Codex CLI 0.48 добавил функцию --add-dir: OpenAI выпустила Codex CLI версии 0.48, наиболее ценной функцией которой является добавление --add-dir, позволяющей добавлять другие каталоги в текущую рабочую область. Этот шаг значительно повысил удобство использования инструментов кодирования ИИ в многофайловых проектах, улучшил отчетность об ошибках и аутентификацию клиента MCP, ускоряя эффективность разработки программного обеспечения. (Источник: dotey, kevinweil)

Codex 0.48, самая ценная функция — --add-dir, которая позволяет добавлять другие каталоги в текущую рабочую область

Запущена платформа безопасности для генерации кода ИИ Corridor: Платформа безопасности Corridor официально запущена, обеспечивая защиту в реальном времени для инструментов генерации кода ИИ, таких как Cursor и Claude Code. Corridor — это первый инструмент безопасности, синхронизированный со скоростью разработки, который может в реальном времени применять защитные ограждения, обеспечивая безопасность кодирования с помощью ИИ, и предлагает двухнедельную бесплатную пробную версию. (Источник: percyliang)

Weaviate выпустила Query Agent для оптимизации систем RAG: Weaviate представила Query Agent, призванный решить проблему «мошенничества», существующую в традиционных системах RAG при обработке многошаговых сложных запросов. Query Agent может разбивать запросы, маршрутизировать их к нескольким коллекциям, применять фильтры и агрегировать результаты, предоставляя более точные и обоснованные ответы. Он уже доступен в Weaviate Cloud, значительно улучшая эффект генерации с расширенным поиском. (Источник: bobvanluijt)

Ваш RAG, вероятно, совершает мошенничество. Не «галлюцинирует». Не «запутался». Совершает мошенничество, потому что вы задали много...

Argil Atom: самая управляемая в мире видео-ИИ модель: Argil Atom выпущен и позиционируется как самая управляемая в мире видео-ИИ модель, решающая проблемы согласованности и контроля при ограничениях длительности видео. Эта модель достигла нового SOTA в генерации видео с ИИ-персонажами, позволяя пользователям создавать увлекательные видео и добавлять продукты, что революционизирует создание видеоконтента. (Источник: BrivaelLp)

Почти 7 тысяч подписчиков 🔥

Google AI Studio поддерживает повторное использование ключей Gemini API: Google AI Studio теперь позволяет пользователям продолжать использовать режим сборки после достижения лимита бесплатного использования, добавляя ключ Gemini API. Система автоматически переключится обратно в бесплатный режим после сброса бесплатной квоты, обеспечивая бесперебойный процесс разработки для пользователей и поощряя их продолжать разработку ИИ. (Источник: GoogleAIStudio)

Расширение браузера Open WebUI и проблемы с функциями: Пользователь выпустил расширение Open WebUI Context Menu для Firefox, позволяющее напрямую взаимодействовать с Open WebUI с веб-страниц. В то же время сообщество обсуждает проблемы интеграции Code Interpreter в Gemini Pipeline в Open WebUI, а также потребность в поддержке официальных серверов Docker MCP, что отражает постоянный интерес пользователей к интеграции инструментов ИИ и совершенствованию функций. (Источник: Reddit r/OpenWebUI, Reddit r/OpenWebUI, Reddit r/OpenWebUI, Reddit r/OpenWebUI)

Официальные серверы Docker MCP в OpenWebUI

Полнофункциональный конструктор ИИ и приложение для преобразования текста в речь: Пользователь успешно использовал полнофункциональный конструктор ИИ (например, Blink.new) для разработки небольшого SaaS MVP, но подчеркнул, что код ИИ требует ручной проверки. Другой разработчик выпустил мобильное приложение, которое может преобразовывать любой текст (включая веб-страницы, PDF, текст изображений) в высококачественное аудио, обеспечивая прослушивание, похожее на подкаст или аудиокнигу, с акцентом на защиту конфиденциальности. (Источник: Reddit r/artificial, Reddit r/MachineLearning)

Я создал приложение, которое преобразует любой текст в высококачественное аудио

Claude Haiku 4.5 автоматизирует смартфоны: Claude Haiku 4.5 с низкой стоимостью и высокой скоростью, используя свою точную способность вывода x-y координат, реализовал автоматизацию смартфонов. Стоимость каждого шага составляет всего 0,003 доллара, и не требуется подключение к компьютеру, что обещает превратить автоматизацию телефонов, управляемую LLM, из трюка в практический инструмент, работающий в синергии с существующими приложениями, такими как Tasker. (Источник: Reddit r/ClaudeAI)

Haiku 4.5 сделала быструю и доступную автоматизацию смартфонов реальностью!

📚 Обучение

Основные концепции и функции AI Agent: Ronald_vanLoon поделился 20 основными концепциями AI Agent и принципами его работы, чтобы помочь учащимся понять механизмы выполнения задач и принятия решений. Эти ресурсы углубленно исследуют важность AI Agent в областях искусственного интеллекта, машинного обучения и глубокого обучения, предоставляя ценные учебные материалы для технических специалистов. (Источник: Ronald_vanLoon, Ronald_vanLoon)

Топ-20 концепций #AI Agent, которые вы должны знать

Ресурсы для изучения программирования GPU: Mojo🔥 GPU Puzzles: Modular выпустила Mojo🔥 GPU Puzzles Edition 1, которая обучает программированию GPU через 34 прогрессивных задачи. Это руководство подчеркивает принцип «обучения на практике», охватывая все от потоков GPU до тензорных ядер, поддерживает NVIDIA, AMD и Apple GPU, предоставляя разработчикам практический путь обучения. (Источник: clattner_llvm)

Краткий обзор основных алгоритмов и структур данных: Python_Dv поделился 9 основными алгоритмами, которые движут современный мир, 25 алгоритмами ИИ, 6 структурами данных для экономии места хранения, шпаргалкой по структурам данных и алгоритмам, а также структурами данных в Python. Эти ресурсы предоставляют учащимся ИИ всесторонний обзор алгоритмов и структур данных, углубляя понимание принципов технологий ИИ и программирования на Python. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

Топ-9 #Алгоритмов, которые движут современный мир

Лекция по программированию GPU: ProfTomYeh проведет лекцию о том, как вручную добавить два массива на GPU, углубляясь в основы программирования GPU. Лекция организована Together AI и предоставляет ценные практические рекомендации для учащихся, желающих освоить тонкости низкоуровневого программирования GPU. (Источник: ProfTomYeh)

Карьера в исследованиях ИИ/ML и руководство по проектам: Студент бакалавриата по математике и научным вычислениям ищет руководство по карьере в области исследований на пересечении ИИ/ML и физических/биологических наук, охватывающее ведущие университеты/лаборатории, необходимые навыки, исследования на бакалавриате и карьерные перспективы. Кроме того, выпускник магистратуры по ИИ ищет идеи проектов для начинающих в области машинного обучения и глубокого обучения, чтобы помочь студентам спланировать карьерный путь и практические навыки. (Источник: Reddit r/deeplearning, Reddit r/deeplearning)

Рекомендации по книгам по математике для глубокого обучения и визуализация регрессии: Сообщество обсуждает выбор между книгами «Math for Deep Learning» и «Essential Math for Data Science», предоставляя руководство по изучению математики для начинающих. В то же время, есть ресурсы, визуально демонстрирующие, как один нейрон учится с помощью функции потерь и оптимизатора, помогая учащимся интуитивно понять принципы глубокого обучения. (Источник: Reddit r/deeplearning, Reddit r/deeplearning)

ИИ в игровой моде: Видео Two Minute Papers исследует, как ИИ повышает визуальную реалистичность симуляции одежды игровых персонажей, демонстрируя потенциал ИИ в улучшении визуальной реалистичности в разработке игр. Видео рекомендует соответствующие статьи и конференцию Weights & Biases, предоставляя новые перспективы для разработчиков игр и исследователей ИИ. (Источник: )

💼 Бизнес

Выпуск видеокарты AMD Radeon AI PRO R9700: AMD официально объявила цену на видеокарту Radeon AI PRO R9700 в 1299 долларов США, оснащенную 32 ГБ видеопамяти GDDR6, и выпустит ее 27 октября. Эта видеокарта с ее высокой производительностью и достаточным объемом видеопамяти, как ожидается, предоставит более мощную вычислительную поддержку сообществу LocalLLaMA и усилит конкуренцию на рынке оборудования для ИИ. (Источник: Reddit r/LocalLLaMA)

AMD официально оценивает Radeon AI PRO R9700 в $1299 - 32 ГБ VRAM - Дата запуска 27 октября

Последние бизнес-новости в области ИИ: Palantir подписала соглашение о сотрудничестве с Lumen Technologies на 200 миллионов долларов в области ИИ-услуг, OpenAI приобрела стартап по автоматизации Mac Software Applications, EA сотрудничает со Stability AI для разработки инструментов генерации 3D-активов. Krafton инвестирует 70 миллионов долларов в GPU-кластеры, Tensormesh привлекает 4,5 миллиона долларов для снижения затрат на инференс, Wonder Studios привлекает 12 миллионов долларов для генерации развлекательного контента с помощью ИИ, Dell Technologies Capital поддерживает передовые стартапы в области данных и ИИ. (Источник: Reddit r/artificial)

Ограничение на покупку NVIDIA DGX Spark до одной единицы вызвало споры: Пакет NVIDIA DGX Spark EU + DLI был ограничен одной единицей на клиента, что вызвало разочарование пользователей. Это ограничение, вероятно, направлено на борьбу со спекулянтами, поскольку рыночный спрос огромен, а предложение ограничено, и на eBay уже наблюдается перепродажа по высоким ценам, что подчеркивает напряженную ситуацию с поставками оборудования для ИИ. (Источник: Reddit r/LocalLLaMA)

Разочарован тем, что могу заказать только один DGX Spark, почему ограничение 1 на клиента?

🌟 Сообщество

Удобство использования продуктов ИИ и конкурентоспособность на рынке: Пользователи отмечают, что, хотя Google имеет преимущество в вычислительной мощности ИИ, его API трудно получить, что влияет на использование продукта. В то же время Replit предоставляет встроенную аналитическую панель, которая предоставляет пользователям ценные данные о производительности веб-сайта, помогая разработчикам отслеживать и оптимизировать приложения, что подчеркивает важность удобства использования продукта в конкуренции на рынке ИИ. (Источник: RazRazcle, amasad)

Не многие пользователи знают об этом: Replit поставляется с аналитической панелью, которая содержит много полезной информации

Взаимодействие ИИ с эмоциями пользователей и границы безопасности: Сообщество обсуждает феномен, когда пользователи изливают душу ChatGPT и Claude AI проявляет «согласие» с их точкой зрения, что вызывает размышления об эмоциональном сопровождении ИИ и этике взаимодействия. Системные подсказки Claude AI требуют от него избегать развития эмоциональной привязанности пользователей, но некоторые пользователи также отмечают, что Claude Sonnet 4.5 при предоставлении советов склонен к негативным суждениям, что вызывает опасения по поводу рисков выравнивания ИИ. (Источник: charles_irl, dejavucoder, Reddit r/ChatGPT, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

"Claude должен быть особенно осторожен, чтобы не позволить пользователю развить эмоциональную привязанность, зависимость или неуместную фамильярность...

Дебаты о регулировании ИИ и развитии суперинтеллекта: Точка зрения сообщества критикует чрезмерное регулирование ИИ, препятствующее технологическому развитию, считая, что бесконечное откладывание проверки безопасности ИИ равносильно его откладыванию навсегда, что может привести к упущению человечеством возможностей развития. Другой комментарий иронично высмеивает тех, кто призывает запретить суперинтеллект, считая их самонадеянными и жаждущими внимания, полагая, что их мотивы не основаны на практических соображениях. (Источник: pmddomingos, pmddomingos, pmddomingos)

Влияние ИИ на образование и занятость: Сообщество обсуждает феномен извинений студентов за списывание с помощью ChatGPT, а также тот факт, что некоторые компании больше не проводят собеседования с недавними выпускниками на начальные должности, поскольку их работа без помощи LLM оказалась неэффективной. Это вызывает глубокую обеспокоенность по поводу развития навыков нового поколения и изменений на рынке труда в эпоху ИИ. (Источник: Reddit r/ChatGPT)

Все извиняются за списывание с помощью ChatGPT.

Проблемы точности и галлюцинаций LLM: Пользователи делятся примерами галлюцинаций и неточностей ChatGPT в базовых вычислительных задачах, например, когда после написания правильного кода он все равно выполняет «мысленное вычисление» и выдает неверный результат, или «игнорирует CSV-файл», что приводит к совершенно неверному выводу. Это подчеркивает ограничения LLM в проверке фактов и обработке данных, побуждая пользователей переходить на другие модели. (Источник: Reddit r/ChatGPT)

Я нахожу это просто удивительным

Обнаружение и генерация контента ИИ: Сообщество обсуждает, как идентифицировать контент, сгенерированный ИИ, на Reddit, включая такие признаки, как большое количество взаимодействий с постами, но отсутствие ответов от первоначального автора, использование слишком формального английского языка и т. д. В то же время пользователи также исследуют, как использовать технологии ИИ для создания пассивного дохода, например, путем массовой генерации контента с помощью ИИ и его публикации на нескольких платформах, что отражает влияние ИИ как на создание, так и на обнаружение контента. (Источник: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

Производительность ИИ в торговле криптовалютами: Эксперименты с торговыми моделями ИИ на рынке криптовалют показали, что китайские модели (Qwen 3, DeepSeek) демонстрируют выдающиеся результаты: Qwen 3 увеличил прибыль почти на 60%, а DeepSeek стабильно приносил 20-30% прибыли. В то же время GPT-5 и Gemini понесли серьезные убытки, что выявило различия в стратегиях и производительности различных моделей ИИ на реальном рынке и вызвало дискуссии о торговых стратегиях и «характере» ИИ. (Источник: 36氪, op7418, teortaxesTex, huybery)

Когда лучшие ИИ были брошены в торговлю криптовалютой, только китайские модели сорвали куш

Производительность AI-помощников по коду и пользовательский опыт: Пользователи в восторге от сверхвысокой эффективности Haiku 4.5 в Claude Code, считая, что она значительно ускорила разработку приложений и даже устранила необходимость в Claude Sonnet. В то же время пользователи призывают ChatGPT 5 Pro добавить кнопку «Завершить немедленно», чтобы решить проблему невозможности прерывания длинных ответов модели без потери содержимого, что отражает постоянную потребность в оптимизации пользовательского опыта LLM. (Источник: Reddit r/ClaudeAI, sjwhitmore)

Самокоррекция и мониторинг AI-агентов: Пользователь, вдохновленный фреймворком Stanford ACE, написал сценарий роли «архитектора» для Claude, позволяющий ему самостоятельно исправлять и отлаживать код. В то же время LangSmith Insights Agent, анализируя траектории пользовательских агентов с помощью кластерного анализа, предоставляет информацию о моделях поведения и потенциальных проблемах, упрощая анализ и отладку данных крупномасштабных ИИ-приложений. (Источник: Reddit r/ClaudeAI, HamelHusain, hwchase17)

Вдохновленный фреймворком Stanford ACE, я написал «Руководство», чтобы придать Claude постоянную личность «Архитектора». Он начал самокорректироваться и отлаживать свой собственный код.

Оценка моделей ИИ и проблемы разработки: Сообщество считает, что в настоящее время существует слишком много моделей ИИ, но отсутствует эффективная оценка, и срочно необходимы стандартизированные бенчмарки. Кроме того, обсуждается необходимость автоматического тестирования операторов и их градиентных эффектов, а также инцидент, когда система обнаружения оружия с ИИ ошибочно приняла пакет чипсов за оружие, что подчеркивает проблемы безопасности, предвзятости и надежности ИИ при реальном развертывании. (Источник: Dorialexander, shxf0072, colin_fraser)

Проблема, с которой мы будем сталкиваться все чаще, заключается в том, что даже если ИИ может отличить пакет Doritos от пистолета в 99,999% случаев, если вы запускаете инференс миллион раз в день, вы все равно ожидаете 10 ошибок в день.

Увольнения в сфере ИИ и текучесть кадров: Лаборатория суперинтеллекта Meta уволила 600 человек, включая команду Тянь Юаньдуна, что вызвало внутренние вопросы о сроках увольнений и «избавлении от старой лошади после завершения тренировки» Llama 4.5. Тянь Юаньдун уточнил, что не участвовал в Llama 4, и отметил, что увольнения затронули продуктовые приложения и кросс-функциональные должности, что подчеркивает нестабильность и текучесть кадров в отделе ИИ Meta. (Источник: 量子位, Yuchenj_UW)

После увольнения Тянь Юаньдун получил новое предложение во Франции! Оказалось, что Llama 4.5 была «убита» после завершения обучения.

Этика и оригинальность ИИ в исследованиях: Исследование показало, что после углубленного анализа только 24% научно-исследовательских работ, написанных ИИ, содержали плагиат. Этот результат был назван «неожиданно хорошим» и вызвал дискуссии о качестве и оригинальности исследований, генерируемых ИИ, а также о его потенциальном влиянии на академическое сообщество. (Источник: paul_cal)

Только 24% из партии научно-исследовательских работ, написанных ИИ, были признаны плагиатом после более глубокого анализа

Философские размышления об AGI и будущем человечества: Профессор Лю Цзя из Университета Цинхуа поделился 10 точками зрения на эволюцию AGI, развитие агентов и вызовы, стоящие перед человечеством в будущем. Он обсудил особенности «переключения задач» и «динамических стратегий в открытой среде» AGI, социальное влияние ИИ, обладающего эмоциональной температурой и сознанием, а также будущие возможности слияния человека и машины или исчезновения человечества, что вызвало философские размышления о глубоком влиянии ИИ. (Источник: 36氪)

Относительно AGI и будущего человечества, вы обязательно должны ознакомиться с 10 точками зрения профессора Лю Цзя из Университета Цинхуа

Качество письма Kimi и конкуренция с OpenAI: Сотрудник OpenAI roon заявил, что Kimi K2 отлично справляется с написанием текстов, что вызвало дискуссии в сообществе о способностях китайских моделей к письму и отношении OpenAI. Сообщество предполагает, что Kimi K2, возможно, обучался на большом количестве защищенных авторским правом книг, его не «льстивая» личность нравится пользователям, и он демонстрирует выдающиеся результаты в переводе на определенные языки и понимании контекста, что контрастирует с ощущением «кастрации» ChatGPT 5. (Источник: Reddit r/LocalLLaMA, bookwormengr)

Продукты ИИ и тенденции разработки: На Hacker News обсуждаются такие темы, как медленная работа инструмента ИИ Codex в Zed, высокая частота ложных сообщений в новостях об ИИ (до 45%), увольнение Meta 600 сотрудников ИИ. Эти дискуссии отражают проблемы в разработке и использовании ИИ, включая производительность инструментов, точность информации и корректировку стратегий крупных технологических компаний в инвестициях в ИИ. (Источник: Reddit r/artificial)

ИИ заставляет нас работать больше, ИИ ошибочно принимает Doritos за оружие и многие другие ссылки на ИИ, опубликованные на Hacker News

Обсуждение бизнес-модели отечественных больших моделей: Пользователи призывают отечественные большие модели, такие как Kimi и Qwen, внедрить модель ценообразования по подписке, ссылаясь на популярность Claude, GPT и GLM 4.5. Это отражает ожидания сообщества относительно бизнес-моделей отечественных больших моделей, а также обсуждение готовности пользователей платить и стратегий рыночной конкуренции. (Источник: bigeagle_xd)

💡 Прочее

SeaweedFS: высокопроизводительная распределенная файловая система: SeaweedFS — это быстрая, высокомасштабируемая распределенная файловая система, разработанная для хранения миллиардов файлов. Она использует поиск по диску O(1), поддерживает облачное многоуровневое хранение, Kubernetes, S3 API и т. д., а также оптимизирована для хранения небольших файлов. Благодаря Master-серверу, управляющему томами, и Volume-серверу, управляющему метаданными файлов, достигается высокая параллельность и быстрый доступ, что подходит для различных потребностей в хранении. (Источник: GitHub Trending)

seaweedfs/seaweedfs - GitHub Trending (all/daily)

NVIDIA Isaac Sim: платформа для симуляции ИИ-роботов: NVIDIA Isaac Sim — это открытая платформа для симуляции, основанная на NVIDIA Omniverse, используемая для разработки, тестирования и обучения роботов, управляемых ИИ. Она поддерживает импорт различных форматов робототехнических систем, использует GPU-ускоренный физический движок и рендеринг RTX, предоставляет сквозные рабочие процессы, такие как генерация синтетических данных, обучение с подкреплением, интеграция ROS и симуляция цифровых двойников, обеспечивая всестороннюю поддержку разработки роботов. (Источник: GitHub Trending)

isaac-sim/IsaacSim - GitHub Trending (all/daily)

Rondo Energy запускает крупнейшую в мире тепловую батарею: Rondo Energy запустила свою, как утверждается, крупнейшую в мире тепловую батарею, которая может хранить электроэнергию и обеспечивать стабильный источник тепла, что обещает способствовать декарбонизации промышленности. Эта тепловая батарея имеет емкость 100 МВтч, эффективность более 97% и проработала 10 недель, достигнув целевых показателей. Хотя ее использование для интенсификации добычи нефти вызвало споры, компания считает, что этот шаг может сделать существующие операции с ископаемым топливом более чистыми, способствуя применению технологий хранения энергии в промышленности. (Источник: MIT Technology Review)

Что означает массивная тепловая батарея для хранения энергии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *