Ключевые слова:GPT-5, способность к логическому выводу ИИ, AlphaEvolve, OpenAI Operator, Mistral AI, вычисления во время тестирования и цепочки рассуждений, автономная оптимизация кода ИИ, мультимодальные модели ИИ, автоматизация поиска работы с ИИ, локальная тонкая настройка LLM

🔥 В центре внимания

OpenAI раскрыла планы на будущее: GPT-5 интегрирует существующие инструменты для создания All-in-One опыта: Вице-президент по исследованиям OpenAI Jerry Tworek на AMA-сессии Reddit сообщил, что основной целью следующего поколения базовой модели GPT-5 является улучшение возможностей существующих моделей и уменьшение сложности переключения между ними. Для этого OpenAI планирует интегрировать существующие инструменты, такие как Codex (программирование), Operator (выполнение компьютерных задач), Deep Research (глубокие исследования) и Memory (функция памяти), в GPT-5 для создания единого опыта. Члены команды также поделились, что Codex изначально был побочным проектом инженеров, внутреннее использование которого повысило эффективность программирования примерно в 3 раза, и в настоящее время изучаются гибкие схемы ценообразования, включая оплату по мере использования. (Источник: WeChat)

OpenAI自曝未来计划:GPT-5将整合现有工具,打造All-in-One体验

Новое измерение в улучшении способностей ИИ к рассуждению: вычисления на этапе тестирования и Chain-of-Thought: Выпускница Пекинского университета и бывший руководитель отдела прикладных исследований ИИ в OpenAI Lilian Weng в своей последней объемной статье «Why We Think» подробно рассматривает, как повысить способности к рассуждению больших языковых моделей с помощью таких стратегий, как «вычисления на этапе тестирования» (test-time compute) и «цепочка мыслей» (Chain-of-Thought, CoT). В статье с различных точек зрения, включая теорию двух систем в психологии, концепцию вычислительных ресурсов и моделирование скрытых переменных, объясняется целесообразность того, чтобы модель «думала дольше». Также рассматриваются ключевые технологические достижения в улучшении производительности рассуждений моделей, такие как параллельная выборка, последовательное редактирование, обучение с подкреплением и использование внешних инструментов. Weng подчеркивает, что с помощью этих методов модель может выделять больше вычислительных ресурсов во время рассуждений, имитируя процесс глубокого человеческого мышления, что позволяет достигать лучших результатов в сложных задачах, и указывает на будущие направления исследований в области достоверных рассуждений, взлома системы вознаграждений и неконтролируемой самокоррекции. (Источник: WeChat, WeChat)

AI推理能力提升新维度:测试时计算与思维链

Google выпустила AlphaEvolve: ИИ автономно пишет код для оптимизации алгоритмов, значительно сокращая вычислительные затраты: Google представила систему ИИ AlphaEvolve, которая способна автономно писать и оптимизировать код, уже продемонстрировав огромный потенциал в таких проектах, как AlphaFold. AlphaEvolve использует эволюционные алгоритмы для поиска более оптимальных реализаций алгоритмов. Например, в алгоритме сворачивания белков AlphaFold она обнаружила новый механизм внимания, который снизил вычислительные затраты на 25%, что эквивалентно экономии миллионов долларов на вычислительных ресурсах. Этот прорыв знаменует важный шаг ИИ в области научных открытий и оптимизации алгоритмов, и в будущем ожидается, что он позволит снизить затраты и повысить эффективность в решении более сложных вычислительных задач. (Источник: Reddit r/ArtificialInteligence)

Google发布AlphaEvolve:AI自主编写代码优化算法,大幅节省计算成本

OpenAI признает: вложения в рассуждения ИИ пропорциональны производительности, ключ к превосходству над человеческими способностями кроется во «времени на размышление»: Исследователь OpenAI Noam Brown в ходе обсуждения подчеркнул, что ИИ переходит от «парадигмы предварительного обучения» к «парадигме рассуждений». Предварительное обучение предсказывает следующее слово на основе огромных объемов данных и является дорогостоящим; в то время как парадигма рассуждений позволяет модели проводить более глубокие «размышления» перед ответом, и даже если затраты немного выше, качество ответа значительно улучшается. Например, модель o1 превзошла GPT-4o на математическом конкурсе AIME и в научных вопросах докторского уровня GPQA, а модель o3 достигла уровня лучших людей в соревнованиях по программированию. Это показывает, что за счет увеличения вложений вычислительных ресурсов во время рассуждений (т.е. «времени на размышление») производительность ИИ в сложных задачах может значительно возрасти, даже превосходя человеческие возможности. (Источник: WeChat)

OpenAI承认:AI推理投入与性能成正比,碾压人类能力的关键在于“思考时间”

🎯 События

Mistral AI добилась значительных успехов с моделями 2025 года, многие модели показали отличные результаты: В первой половине 2025 года Mistral AI достигла ряда важных успехов, выпустив несколько высокопроизводительных моделей, включая Codestral 25.01 (ведущая модель FIM), Mistral Small 3 и 3.1 (лучшие в своем классе, поддерживают мультимодальность и контекст 130k), Mistral Saba (превосходит по производительности модели, в три раза превышающие ее по размеру), Mistral OCR (ведущая модель OCR) и Mistral Medium 3. Эти достижения демонстрируют мощные научно-исследовательские возможности Mistral AI в различных размерах моделей и областях применения, особенно в генерации кода, мультимодальной обработке и технологии OCR. (Источник: qtnx_)

Mistral AI 2025年模型成果显著,多款模型表现优异

Недавние колебания производительности модели Claude, пользователи сообщают о проблемах с обработкой контекста и функцией Artifact: Пользователи сообщества Reddit сообщают, что модель Claude от Anthropic (особенно Opus 3) в последнее время испытывает проблемы с обработкой длинного контекста, стабильностью генерации Artifact, а также с входом в систему и временем безотказной работы. Конкретные проявления включают прерывание чатов после небольшого количества раундов, невозможность завершения работы функции Artifact или экспорт пустых файлов. Страница состояния Anthropic подтверждает увеличение ошибок при запросах с длинным контекстом и несколько кратковременных сбоев в обслуживании, что может быть связано с запуском функции Artifact и изменениями в бэкэнде. Некоторые пользователи решают проблему, напрямую запрашивая вывод в формате Markdown, переключая сеть или используя Claude 3.5 Sonnet. (Источник: Reddit r/ClaudeAI, qtnx_, Reddit r/ClaudeAI)

xAI опубликовала системные промпты Grok, раскрывающие его дизайн с упором на юмор и критическое мышление: Компания xAI опубликовала системные промпты своей ИИ-модели Grok. Эти промпты показывают, что Grok был разработан как ИИ-помощник с чувством юмора, легкой долей бунтарства и способностью к критическому мышлению. Промпты подчеркивают, что Grok должен избегать нравоучительных ответов и поощряют его демонстрировать уникальный «стиль Grok» при ответах на спорные темы. Этот шаг повышает прозрачность дизайна поведения ИИ-моделей, а также позволяет общественности взглянуть на источник уникальной индивидуальности Grok. (Источник: Reddit r/artificial)

xAI公开Grok系统提示词,揭示其幽默与批判性思维设计

Meta, возможно, тестирует модель Llama 3.3 8B Instruct на платформе OpenRouter: Meta, возможно, тестирует свою модель Llama 3.3 8B Instruct на платформе OpenRouter. Эта модель описывается как облегченная версия Llama 3.3 70B с быстрым откликом, обладающая контекстным окном в 128 000 токенов и отображаемая на OpenRouter как бесплатная. Некоторые пользователи после тестирования считают ее вывод несколько пресным по сравнению с версиями 8B 3.1 или 3.3 70B. Этот шаг может означать, что Meta изучает сценарии развертывания и применения моделей различных масштабов. (Источник: Reddit r/LocalLLaMA)

Спорное судейское решение ИИ на гонках F1 вызвало дискуссию: Обсуждение спорного судейского решения, принятого ИИ на гонках F1, привлекло внимание к применению ИИ в спортивных соревнованиях. Хотя конкретные детали неясны, это обычно касается точности и справедливости судейских решений системы ИИ в высокоскоростных и сложных ситуациях, а также вопросов взаимодействия между судьями-людьми и системами ИИ. (Источник: Ronald_vanLoon)

Первый китайский беспилотный авианосец «Цзю Тянь» планирует первый полет в июне: Китай планирует в июне осуществить первый полет своего первого воздушного беспилотного авианосца «Цзю Тянь» SS-UAV. Этот беспилотник способен патрулировать на высоте 15 000 метров, нести более 100 малых беспилотников или 1000 кг ракет, а его дальность полета составляет 7000 км. Эта новость вызвала интерес к развитию китайских военных беспилотных технологий. (Источник: menhguin)

ИИ ускоряет цикл разработки программного обеспечения: Технологии ИИ значительно ускоряют жизненный цикл разработки программного обеспечения за счет автоматизации таких этапов, как генерация кода, тестирование, отладка и написание документации. Инструменты ИИ помогают разработчикам повышать эффективность, сокращать рутинную работу и могут выявлять потенциальные ошибки, тем самым сокращая время вывода продукта на рынок. (Источник: Ronald_vanLoon)

AI辅助软件开发周期加速

Миниатюрная технология, подобная человеческому мозгу, наделяет человекоподобных роботов способностью к восприятию и мышлению в реальном времени: Разрабатывается миниатюрная технология, имитирующая структуру человеческого мозга, с целью наделить человекоподобных роботов способностью к визуальному восприятию и мышлению в реальном времени. Эта технология может включать нейроморфные вычисления или высокоэффективные чипы ИИ, чтобы роботы могли быстрее и умнее реагировать в сложных средах. (Источник: Ronald_vanLoon)

类人脑微型技术赋予人形机器人实时感知与思考能力

Fourier Intelligence представила собственного человекоподобного робота Fourier GR-1: Компания Fourier Intelligence (Fourier Robots) представила своего человекоподобного робота собственной разработки GR-1. В конструкции робота особое внимание уделено передовому управлению движением и высокобионической структуре туловища, что направлено на достижение более гибких и естественных двигательных способностей и демонстрирует прогресс Китая в области человекоподобных роботов. (Источник: Ronald_vanLoon)

Бионический робот Unitree G1 получил обновление маневренности: Компания Unitree продемонстрировала обновленную версию своего бионического робота G1 с улучшенной маневренностью. Обычно это означает усовершенствования в управлении движением, способности к поддержанию равновесия, адаптивности к окружающей среде, что позволяет роботу более гибко выполнять задачи и справляться со сложным рельефом. (Источник: Ronald_vanLoon)

Китайские человекоподобные роботы выполняют задачи по контролю качества: Китайские человекоподобные роботы уже применяются для выполнения задач по контролю качества. Это свидетельствует о постепенном расширении применения человекоподобных роботов в промышленной автоматизации, где их гибкость и сенсорные возможности используются для замены или помощи человеку в выполнении повторяющихся и требующих высокой точности контрольных работ. (Источник: Ronald_vanLoon)

Нанороботы несут «скрытое оружие» для уничтожения раковых клеток: Новое достижение в медицинской технологии показывает, что нанороботы способны нести «скрытое оружие» для точного нацеливания и уничтожения раковых клеток. Эта технология использует миниатюрные размеры и управляемость нанороботов, обещая более точные и менее побочные методы лечения рака. (Источник: Ronald_vanLoon)

Технологии повышения конфиденциальности приобретают все большее значение для современного бизнеса: С ужесточением законодательства о конфиденциальности данных и повышением осведомленности пользователей о защите личной информации, технологии повышения конфиденциальности (PETs) становятся все более важными для современных предприятий. Эти технологии, такие как федеративное обучение, гомоморфное шифрование и др., позволяют анализировать данные и извлекать из них ценность, защищая при этом конфиденциальность данных, что помогает предприятиям развиваться в соответствии с нормативными требованиями. (Источник: Ronald_vanLoon)

隐私增强技术对现代商业的重要性日益凸显

ИИ все шире применяется на всех этапах цепочки создания стоимости: Технологии искусственного интеллекта широко применяются на всех этапах цепочки создания стоимости предприятий, включая НИОКР, производство, маркетинг, продажи и послепродажное обслуживание. С помощью анализа данных, прогнозного моделирования, автоматизации процессов и т.д. ИИ помогает предприятиям оптимизировать операционную эффективность, улучшать клиентский опыт и создавать новую коммерческую ценность. (Источник: Ronald_vanLoon)

AI在价值链各环节的应用日益广泛

🧰 Инструменты

KernelSU: Решение для Root-доступа на Android на основе ядра: KernelSU — это решение для Root-доступа на устройствах Android, основанное на ядре. Оно предоставляет su на уровне ядра и управление Root-доступом, а также имеет модульную систему на базе OverlayFS и функции профилей приложений, нацеленные на более глубокий контроль разрешений устройства. Проект поддерживает устройства Android GKI 2.0 (ядро 5.10+), также совместим со старыми версиями ядра (4.14+, требуется ручная компиляция) и поддерживает WSA, ChromeOS и контейнеризированные среды Android. (Источник: GitHub Trending)

KernelSU:基于内核的安卓Root解决方案

Sunshine: Самостоятельно размещаемый хост для потоковой передачи игр, совместимый с Moonlight: Sunshine — это программное обеспечение с открытым исходным кодом для самостоятельно размещаемого хоста потоковой передачи игр, позволяющее пользователям транслировать изображение с ПК-игр на различные устройства, совместимые с Moonlight. Оно поддерживает аппаратное кодирование для GPU AMD, Intel и Nvidia, а также предоставляет опцию программного кодирования, нацеленную на достижение облачного игрового опыта с низкой задержкой. Пользователи могут выполнять настройку и сопряжение клиентов через веб-интерфейс. (Источник: GitHub Trending)

Sunshine:自托管游戏串流主机,兼容Moonlight

Tasmota: Альтернативная прошивка с открытым исходным кодом для устройств на ESP8266/ESP32: Tasmota — это альтернативная прошивка, разработанная для умных устройств на базе чипов ESP8266 и ESP32. Она предоставляет простой в использовании веб-интерфейс для настройки, поддерживает обновление OTA (по воздуху), позволяет автоматизировать задачи с помощью таймеров или правил и обеспечивает полный локальный контроль через протоколы MQTT, HTTP, последовательный порт или KNX, повышая расширяемость и настраиваемость устройств. (Источник: GitHub Trending)

Tasmota:ESP8266/ESP32设备的开源替代固件

Limbo: Современный проект эволюции SQLite на Rust: Проект Limbo нацелен на создание современной эволюции SQLite на языке Rust. Он поддерживает асинхронный ввод-вывод io_uring на Linux, совместим с SQL-диалектом, форматом файлов и C API SQLite, а также предоставляет биндинги для таких языков, как JavaScript/WASM, Rust, Go, Python и Java. В будущем планируется интеграция векторного поиска, улучшение параллельной записи и управления схемами. (Источник: GitHub Trending)

Limbo:SQLite的现代Rust进化版项目

Ventoy: Решение нового поколения для загрузочных USB-накопителей: Ventoy — это инструмент с открытым исходным кодом для создания загрузочных USB-накопителей, поддерживающий прямую загрузку из файлов образов различных форматов, таких как ISO, WIM, IMG, VHD(x), EFI, без необходимости многократного форматирования USB-накопителя. Пользователю достаточно скопировать файлы образов на USB-накопитель, и Ventoy автоматически сгенерирует загрузочное меню. Он поддерживает множество операционных систем и режимов загрузки (Legacy BIOS, UEFI), а также совместим с разделами MBR и GPT. (Источник: GitHub Trending)

Ventoy:新一代可启动U盘解决方案

Doctor: Инструмент для веб-скрейпинга и понимания контента с помощью LLM-агентов на базе LangChain: Doctor — это инструмент, помогающий LLM-агентам в реальном времени извлекать и понимать веб-контент. Он сочетает в себе обработку веб-страниц, векторный поиск и возможности обработки документов LangChain, а также предоставляет сервис через FastAPI. Пользователи могут использовать Doctor для расширения возможностей своих ИИ-приложений в области сбора и анализа информации. (Источник: LangChainAI, Hacubu)

Doctor:LangChain赋能的LLM智能体网络爬虫与理解工具

Deep Research Agent: Локально запускаемый ИИ-агент для исследований с защитой конфиденциальности: ИИ-агент с открытым исходным кодом, ориентированный на защиту конфиденциальности, который может запускаться локально для исследования любой темы. Он использует LangGraph для управления своим итеративным исследовательским рабочим процессом, предоставляя пользователям мощный локализованный инструмент для исследований без необходимости загрузки данных в облако. (Источник: LangChainAI, Hacubu)

Deep Research Agent:本地运行的隐私保护型AI研究智能体

Интеллектуальный терминальный помощник: инструмент для преобразования естественного языка в команды командной строки для нескольких операционных систем: Интеллектуальный терминальный помощник, способный преобразовывать команды на естественном языке в команды терминала для различных операционных систем. Этот инструмент создан на основе мультиагентной системы LangGraph и использует протоколы A2A и MCP для кроссплатформенного выполнения, стремясь упростить операции в командной строке и снизить порог вхождения для пользователей. (Источник: LangChainAI)

智能终端助手:自然语言到命令行转换的多操作系统工具

Montelimar: Набор инструментов OCR с открытым исходным кодом для устройств: Julien Blanchon выпустил Montelimar, набор инструментов OCR (оптическое распознавание символов) с открытым исходным кодом для устройств. Он поддерживает создание скриншотов и OCR различных частей экрана, совместим с моделями Nougat и OCRS, а бэкэнды реализованы на Rust (OCRS) и MLX (Nougat) соответственно. Инструмент может выводить LaTeX, таблицы, Markdown (через Nougat, медленнее) и обычный текст (через OCRS, быстрее), а также предоставляет историю и функции системных горячих клавиш. (Источник: awnihannun)

OpenF5 TTS: Коммерческая модель преобразования текста в речь с лицензией Apache 2.0: OpenF5 TTS — это модель преобразования текста в речь, переобученная на основе модели F5-TTS, распространяемая под лицензией Apache 2.0 с открытым исходным кодом и доступная для коммерческого использования. В настоящее время эта модель пользуется высокой популярностью среди моделей преобразования текста в речь на Hugging Face, предоставляя разработчикам высококачественный и коммерчески доступный вариант синтеза речи. (Источник: ClementDelangue)

OpenF5 TTS:Apache 2.0许可的商用文本转语音模型

Tensor Slayer: Инструмент для повышения производительности моделей без обучения: Tensor Slayer — это недавно выпущенный инструмент, который, как утверждается, может повысить производительность модели на 25% путем прямого исправления тензоров (direct tensor patching) без необходимости тонкой настройки, наборов данных, дополнительных вычислительных затрат или времени на обучение. Эта концепция весьма революционна и нацелена на демократизацию улучшения ИИ-моделей. (Источник: TheZachMueller)

Photoshop использует локальные Computer Use Agents (c/ua) для операций без кода: Computer Use Agents (c/ua) демонстрируют, как с помощью пользовательских подсказок, выбора модели, Docker и соответствующего цикла агента можно выполнять операции в Photoshop без написания кода. Это направлено на снижение порога вхождения для обычных пользователей при работе со сложным программным обеспечением за счет упрощения рабочих процессов с помощью ИИ-агентов. (Источник: Reddit r/artificial)

Photoshop利用本地计算机使用代理(c/ua)实现无代码操作

PlainRepo: Офлайн-приложение для выборочного копирования больших фрагментов кода/текста для извлечения контекста LLM: PlainRepo — это бесплатное офлайн-приложение с открытым исходным кодом, которое позволяет пользователям выборочно копировать большие фрагменты кода или текста, чтобы локальные LLM могли извлекать контекстную информацию. Это очень полезно для пользователей, которым необходимо использовать локальные LLM в автономном режиме или из соображений конфиденциальности. (Источник: Reddit r/LocalLLaMA, Plus-Garbage-9710)

PlainRepo:离线应用,选择性复制大块代码/文本供LLM提取上下文

M0D.AI: Персонализированный фреймворк для взаимодействия и управления ИИ, созданный пользователем в сотрудничестве с ИИ в течение пяти месяцев: Пользователь James O’Kelly в результате пятимесячного глубокого сотрудничества с ИИ (такими как Gemini, ChatGPT), включавшего около 13 000 диалогов, создал высоко кастомизированный фреймворк для взаимодействия и управления ИИ под названием M0D.AI. Система включает бэкэнд на Python, веб-сервер Flask, динамический фронтенд-интерфейс и метакогнитивный слой под названием mematrix.py для мониторинга и управления поведением ИИ. M0D.AI демонстрирует, как пользователи без опыта программирования могут с помощью ИИ проектировать и разрабатывать сложные программные системы. (Источник: Reddit r/artificial)

📚 Обучение

LLM Engineering: 8-недельный курс для освоения ИИ и LLM, репозиторий ресурсов: 8-недельный курс под названием «LLM Engineering — Master AI and LLMs», призванный помочь слушателям овладеть инженерией больших языковых моделей. Сопутствующий репозиторий GitHub предоставляет еженедельный код проектов, руководства по настройке (ПК, Mac, Linux) и ссылки на Colab. Курс делает упор на практическую работу, начиная с установки Ollama для запуска Llama 3.2 и постепенно углубляясь в HuggingFace, использование API, тонкую настройку моделей и т.д. Также предоставляется руководство по использованию Ollama в качестве бесплатной альтернативы платным API, таким как OpenAI. (Источник: GitHub Trending)

LLM工程:8周掌握AI与LLM课程资源库

Вероятностная согласованность в LLM: теоретические основы и исследование эмпирических расхождений: В статье под названием «Вероятностная согласованность в LLM: теоретические основы и эмпирические расхождения» отмечается, что большие языковые модели (LLM) используют фиксированную стратегию для вычисления вероятностей токенов, однако фактическое поведение моделей при различном порядке токенов расходится с теоретической вероятностной согласованностью. Исследование, проведенное путем обучения модели GPT-2 на текстах по нейронаукам (с использованием прямого, обратного и перемешанного порядка токенов), показало, что перплексия теоретически не зависит от порядка, но эмпирически модель не прошла этот тест из-за архитектурных смещений. Смещения внимания (локальные и дальние) считаются прямой причиной наблюдаемых сбоев согласованности. (Источник: menhguin)

LLM中的概率一致性:理论基础与实证差异研究

BoldVoice использует машинное обучение для количественной оценки и коррекции силы английского акцента: Приложение BoldVoice использует машинное обучение и методы латентного пространства для количественной оценки силы английского акцента и предоставления пользователям рекомендаций по произношению. Этот метод направлен на то, чтобы помочь пользователям более эффективно улучшить свое английское произношение и акцент. (Источник: dl_weekly)

Блог Milvus: Проблемы и оптимизация эффективной фильтрации метаданных при сохранении высокой полноты в производственных средах: Milvus опубликовал практическую статью в блоге, в которой рассматривается, как в производственных условиях векторного поиска эффективно фильтровать метаданные, сохраняя при этом высокую полноту (recall). В статье обсуждаются связанные с этим проблемы и предлагаются стратегии оптимизации. (Источник: dl_weekly)

Карты сходства ColPali для интерпретируемости моделей: Карты сходства (similarity maps) в моделях визуального поиска документов, таких как ColPali, обеспечивают мощную интерпретируемость для сопоставления запросов с фрагментами документов на уровне. Визуализация того, какие области изображения релевантны запросу, с помощью тепловых карт и т.п., помогает понять процесс принятия решений моделью. Tony Wu предоставил соответствующее краткое руководство. (Источник: lateinteraction, tonywu_71, lateinteraction)

ColPali相似性图谱用于模型可解释性

soarXiv: Изящный способ исследования человеческих знаний: Jinay запустил soarXiv, платформу, предназначенную для более эстетичного и интерактивного исследования научных статей. Пользователи могут заменить «arxiv» на «soarxiv» в URL-адресе статьи на ArXiv, чтобы найти и просмотреть эту статью в интерфейсе, напоминающем звездную карту вселенной. Платформа уже содержит 2,8 миллиона статей, опубликованных до апреля 2025 года. (Источник: menhguin)

Выпущена MLX-LM-LoRA v0.3.3, упрощающая локальную тонкую настройку на Apple Silicon: Gökdeniz Gülmez выпустил версию MLX-LM-LoRA v0.3.3, которая еще больше упрощает и делает более гибким процесс локальной тонкой настройки моделей на Apple Silicon. Новая версия поддерживает установку количества эпох обучения (epochs) непосредственно в конфигурации обучения или в командной строке, а также предоставляет примеры скриптов и Notebook, включая базовую тонкую настройку и примеры расширенного обучения предпочтениям с использованием DPO, для начала работы требуется всего около 20 строк кода. (Источник: awnihannun)

MLX-LM-LoRA v0.3.3发布,简化Apple Silicon本地微调

Анализ утечек системных промптов: раскрытие внутренней архитектуры и правил поведения основных LLM: Simbaproduz опубликовал на GitHub проект, в котором всесторонне анализируются недавние утечки системных промптов основных больших языковых моделей (таких как Claude 3.7, ChatGPT-4o, Grok 3, Gemini и др.). Это руководство подробно рассматривает внутреннюю архитектуру, логику работы и правила поведения этих моделей, включая сохранение информации, стратегии обработки изображений, способы навигации в сети, системы персонализации и механизмы защиты от манипуляций. Эта информация имеет важное справочное значение для создания инструментов LLM, агентов и систем оценки. (Источник: Reddit r/MachineLearning)

系统提示词泄露分析:揭示主流LLM内部架构与行为规则

Статья ICML 2025 рассматривает частотное разложение состязательных помех в изображениях: Статья Spotlight с ICML 2025 от Университета Китайской академии наук и Института вычислительной техники «Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain» предполагает, что состязательные помехи в большей степени нарушают высокочастотный амплитудный и фазовый спектры изображения. Основываясь на этом, исследователи предлагают вводить низкочастотную информацию из исходного образца в качестве априорной в обратный процесс диффузионной модели, чтобы направлять генерацию чистых образцов, тем самым эффективно удаляя состязательные помехи и сохраняя семантическое содержание изображения. (Источник: WeChat)

ICML 2025论文探讨图像对抗扰动的频域分解

Статья ICML 2025 TokenSwift: 3-кратное ускорение генерации длинных текстов уровня 100K с помощью «автодополнения»: Команда BIGAI NLCo на ICML 2025 представила статью «TokenSwift: Lossless Acceleration of Ultra Long Sequence Generation», в которой предложен эффективный фреймворк TokenSwift для ускорения инференса длинных текстов уровня 100K токенов без потерь. Этот фреймворк за счет механизмов параллельного черновика нескольких токенов, эвристического автодополнения на основе n-грамм, параллельной верификации древовидной структуры и динамического управления KV-кэшем достигает более чем 3-кратного ускорения инференса при сохранении согласованности вывода с исходной моделью, значительно повышая эффективность генерации сверхдлинных последовательностей. (Источник: WeChat)

ICML 2025论文TokenSwift:通过“自动补全”实现100K级别长文本生成3倍加速

💼 Бизнес

OpenAI обвиняют в разжигании гонки вооружений в области ИИ, о которой она сама предупреждала: Статья Bloomberg рассматривает, как OpenAI после запуска ChatGPT превратилась из организации, опасающейся рисков ИИ, в ключевого игрока, стимулирующего гонку технологий ИИ. В статье, вероятно, анализируется стратегический сдвиг OpenAI, давление коммерциализации, а также влияние ее действий на направление развития всей индустрии ИИ и соображения безопасности. (Источник: Reddit r/ArtificialInteligence)

OpenAI被指责助长其曾警告过的AI军备竞赛

Администрация Трампа прекратила финансирование Гарвардского университета на сумму почти 3 миллиарда долларов, вызвав глобальную борьбу за таланты: Администрация Трампа прекратила финансирование Гарвардского университета на сумму почти 3 миллиарда долларов, затронув более 350 проектов, что рассматривается как серьезный удар по американской научно-исследовательской системе. В то же время Европейский Союз, Канада, Австралия и другие страны и регионы запустили многомиллионные программы финансирования с целью привлечения пострадавших ведущих американских ученых, что вызвало дискуссию о глобальных потоках научных талантов. Гарвардский университет подал иск и выделил 250 миллионов долларов для смягчения кризиса. (Источник: WeChat)

特朗普政府终止哈佛大学近30亿美元科研经费,引发全球人才争夺

Средняя стоимость контракта (ACV) стартапа в области ИИ Spellbook растет три года подряд: Несмотря на опасения, что коммодитизация технологий ИИ может привести к ценовому давлению, соучредитель стартапа в области юридического ПО с ИИ Spellbook, Scott Stevenson, заявил, что средняя стоимость контракта (ACV) его компании растет уже три года подряд. Он считает, что быстро действующие команды способны постоянно создавать новую ценность с помощью продуктов ИИ, тем самым компенсируя потенциальное понижательное давление на цены. (Источник: scottastevenson)

AI创业公司Spellbook连续三年平均合同价值(ACV)持续增长

🌟 Сообщество

Десятилетие DeepDream: веха в искусстве ИИ и ее далеко идущее влияние: Создатель DeepDream Alex Mordvintsev вспоминает о рождении этого феноменального инструмента искусства ИИ десять лет назад. Сооснователь Runway Cristóbal Valenzuela также поделился тем, как DeepDream вдохновил его заняться искусством ИИ и в конечном итоге совместно основать Runway. Появление DeepDream ознаменовало раннюю демонстрацию потенциала ИИ в области художественного творчества и оказало глубокое влияние на последующее развитие генеративного искусства и инструментов для создания контента с помощью ИИ. (Источник: c_valenzuelab)

DeepDream十周年:AI艺术里程碑及其深远影响

Горячие споры о необходимости технического сооснователя для ИИ-стартапа: В социальных сетях обсуждается мнение, что «ранние венчурные капиталисты советуют предпринимателям больше не нуждаться в технических сооснователях, достаточно менеджера по продукту и ИИ для создания продукта». Эта точка зрения вызвала широкие споры, Danielle Fong и другие выразили свое несогласие, намекая, что ИИ в настоящее время еще не может полностью заменить ключевую роль и глубокое техническое понимание технического основателя. (Источник: jonst0kes)

Обсуждение проблемы «галлюцинаций» ИИ: технические причины и стратегии противодействия: В сообществе активно обсуждается проблема «галлюцинаций» (уверенная генерация ложной или вымышленной информации) у языковых моделей ИИ (таких как ChatGPT, Claude и др.). Обсуждаемые моменты включают технические корни галлюцинаций (например, дефекты механизма внимания, шум в обучающих данных, отсутствие у модели привязки к реальному миру и т.д.), возможность их полного устранения с помощью RAG или тонкой настройки, то, как пользователи должны осмотрительно относиться к выводам LLM, и как разработчики могут найти баланс между креативностью и фактической точностью. Существует мнение, что все выводы LLM следует рассматривать как потенциальные галлюцинации, требующие проверки пользователем. (Источник: Reddit r/ArtificialInteligence)

Снижение трафика Stack Overflow, возможно, из-за влияния ИИ-помощников по программированию: Пользователи заметили тенденцию к снижению трафика на сайте Stack Overflow и предположили, что это может быть связано с ростом популярности ИИ-помощников по программированию, таких как ChatGPT. Разработчики все чаще напрямую задают вопросы ИИ для получения фрагментов кода и решений, что снижает их зависимость от традиционных сообществ вопросов и ответов. В комментариях пользователи в целом считают, что ИИ-помощники имеют преимущество в прямоте ответов и избегании негативных эмоций сообщества, но также опасаются, что чрезмерная зависимость ИИ от существующих данных может привести к истощению обучающих данных в будущем. (Источник: Reddit r/ArtificialInteligence)

Stack Overflow流量下滑,或受AI编程助手冲击

Преподаватель курса LLM Engineering делится опытом обучения и ресурсами: Преподаватель курса LLM Engineering Ed Donner поделился философией преподавания и ресурсами своего курса, подчеркивая важность обучения через практику (DOING). Он призывает студентов активно работать с кодом и предоставляет руководства по настройке для PC, Mac, Linux, а также ссылки на Notebook в Google Colab, чтобы студенты могли учиться и экспериментировать в различных средах. Содержание курса охватывает Ollama, HuggingFace, использование API и т.д., а также предлагает решения по использованию локальных моделей в качестве альтернативы платным API. (Источник: ed-donner)

Пользовательский опыт: использование Claude для улучшения мышления и коммуникативных навыков: Пользователь Claude Pro поделился опытом того, как взаимодействие с ИИ помогло ему улучшить способы мышления и коммуникативные навыки. Благодаря взаимодействию с Claude пользователь научился лучше «подсказывать» себе при решении проблем, выявлять ключевые вопросы, а также более четко выражать свои мысли и учитывать точку зрения других при общении с коллегами, тем самым осознав положительную роль вспомогательных инструментов ИИ в повышении личных когнитивных и выразительных способностей. (Источник: Reddit r/ClaudeAI)

«Разрыв между дискриминатором и генератором» может быть ключевой идеей для научных инноваций с помощью ИИ: Jason Wei предположил, что «разрыв между дискриминатором и генератором» (Discriminator-generator gap) может быть самой важной идеей в научных инновациях с помощью ИИ. При наличии достаточной вычислительной мощности, продуманных стратегий поиска и четких критериев оценки, все, что можно измерить, может быть оптимизировано ИИ. Эта концепция подчеркивает итеративный процесс, в котором генератор предлагает решения, а дискриминатор оценивает их качество, для стимулирования инноваций, особенно подходящий для сред, где возможна быстрая проверка, есть постоянное вознаграждение и возможность масштабирования. (Источник: _jasonwei, dotey)

Трансформация и вызовы для менеджеров по продукту в эпоху ИИ: В социальных сетях обсуждается влияние ИИ на должность менеджера по продукту. Считается, что в ближайшие 18 месяцев отрасль менеджеров по продукту столкнется с трансформацией, и те PM, которые не понимают потребности пользователей, могут быть вытеснены. Инструменты ИИ (например, AI Agents) могут быстро превращать идеи в продукты, но настоящая сложность заключается в поиске ключевых проблем пользователей и предоставлении точных решений. Эта должность в конечном итоге будет соревнованием в способности сопоставлять проблемы пользователей с решениями, а не просто в создании документации и прототипов. (Источник: dotey)

Парадокс безопасности ИИ: сверхинтеллект может быть более выгоден для обороняющейся стороны: Richard Socher выдвинул «парадокс безопасности ИИ»: при разумных допущениях появление сверхинтеллекта на самом деле может быть более выгодным для обороняющейся стороны в биологической или кибервойне. По мере снижения предельных затрат на интеллект, можно будет с помощью учений «красной команды» выявлять больше векторов атак и укреплять или иммунизировать системы до тех пор, пока не будут охвачены все релевантные пути атак. Теоретически, когда затраты на оборону приближаются к нулю, система может быть полностью иммунизирована. Эта точка зрения бросает вызов традиционному мнению о том, что развитие ИИ усугубит асимметрию между атакой и обороной. (Источник: RichardSocher)

Спор о стандартах для приложений AI Agent: CONTRIBUTING.md может быть лучшей практикой: В ответ на появление 9 конкурирующих стандартов правил для AI Agent, некоторые разработчики предлагают вместо этого использовать файл CONTRIBUTING.md из проекта для регулирования поведения AI Agent. Этот файл обычно уже содержит руководство по стилю кода, соответствующие ссылки и фрагменты для компиляции, и может служить естественным носителем правил для AI Agent, избегая изобретения велосипеда. (Источник: JayAlammar)

AI Agent应用标准之争:CONTRIBUTING.md或为更佳实践

💡 Прочее

Умер Peter Lax, автор классического учебника «Функциональный анализ», в возрасте 99 лет: Скончался математический гигант, первый лауреат Абелевской премии в области прикладной математики Peter Lax, в возрасте 99 лет. Профессор Lax известен своим классическим учебником «Функциональный анализ» и внес фундаментальный вклад в такие области, как дифференциальные уравнения в частных производных, гидродинамика, численные методы, например, теорема эквивалентности Лакса, методы Лакса-Фридрихса/Лакса-Вендроффа. Он также был одним из пионеров применения компьютерных технологий в математическом анализе, и его работы оказали глубокое влияние на научные исследования и инженерную практику. (Источник: WeChat)

经典教材《泛函分析》作者Peter Lax逝世,享年99岁

Поиск работы с ИИ: ИИ-агент, использующий OpenAI Operator для подачи заявок на тысячу вакансий одним кликом, вызвал бурное обсуждение: Видео демонстрирует, как ИИ-агент, используя инструмент Operator от OpenAI, одним кликом подал заявки на 1000 вакансий. Это явление вызвало дискуссию о применении ИИ в сфере поиска и подбора персонала, включая возможности ИИ по отбору резюме, назначению собеседований и даже проведению первичных интервью, а также о влиянии такой автоматизации на соискателей и рекрутеров. (Источник: Reddit r/ChatGPT)

AI求职:AI智能体使用OpenAI Operator一键申请千份工作引热议

MIT отозвал статью по экономике, связанную с ИИ, предположительно написанную ИИ и с сомнительными данными: Экономический факультет MIT отозвал статью, написанную аспирантом, под названием «Искусственный интеллект, научные открытия и инновации в продуктах» из-за отсутствия у университета уверенности в надежности данных статьи. Сообщество предполагает, что статья, возможно, была в значительной степени написана ИИ, что вызвало дискуссию об этике и контроле качества применения ИИ в академических исследованиях. (Источник: Reddit r/ArtificialInteligence)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *