Ключевые слова:Kimi K2, Moonshot AI, Meta AI инвестиции, Open Vision Reasoner, AI этика, генеративный ИИ, AI оборудование, Kimi K2 открытая модель MoE, Meta Hyperion 5GW дата-центр для ИИ, метод визуального рассуждения OVR, споры о функции AI-подруги Grok, провальный кейс Humane AI Pin
🔥 В центре внимания
Выпуск Kimi K2 и оптимизация сообществом: Moonshot AI выпустила Kimi K2, открытую MoE модель с 1T параметрами. В течение 72 часов после выпуска модель была быстро оптимизирована сообществом для работы на одном M4 Max 128GB VRAM (с выгрузкой) или одном M3 Ultra (512GB). Это подчеркивает мощь и скорость реакции сообщества открытого исходного кода, способствуя быстрому развитию и применению больших языковых моделей. (Источник: huggingface, ClementDelangue)
Инвестиции Meta в крупномасштабные AI вычисления: Meta объявила о значительных инвестициях в AI вычисления, строя несколько многогигаваттных кластеров. Это обеспечит вычислительную мощность для построения сверхинтеллекта и будет способствовать дальнейшему развитию области AI. Nvidia, как основной бенефициар, может ожидать дальнейшего роста рыночной капитализации. (Источник: AIatMeta, Yuchenj_UW, scaling01, scaling01)
Выпуск Open Vision Reasoner (OVR): OVR — это новый метод переноса языкового когнитивного поведения в область визуального мышления. Он использует двухэтапный подход: сначала крупномасштабный языковой «холодный старт» на Qwen-2.5-VL-7B, а затем улучшение и расширение с помощью мультимодального обучения с подкреплением. OVR достиг результатов SOTA на MathVision и MathVerse. (Источник: bigeagle_xd)
AISI (Великобритания) ставит под сомнение исследования «обмана» AI: Британская AISI указала на методологические недостатки в исследованиях «обмана» AI, проведенных такими организациями, как Anthropic, и призвала исследователей меньше полагаться на анекдотические данные, разрабатывать более строгие эксперименты и избегать ненужной антропоморфной лексики. (Источник: ClementDelangue)
🎯 Тенденции
Kimi K2 от Moonshot AI становится новым чемпионом в написании коротких рассказов: Kimi K2 превзошла o3-pro в бенчмарке по написанию креативных коротких рассказов, став новым чемпионом. Это демонстрирует потенциал моделей с открытым исходным кодом в области творческого письма. (Источник: scaling01, jeremyphoward, ClementDelangue, huggingface, op7418)
Cognition приобретает Windsurf: Cognition AI официально приобрела Windsurf, включая ее интеллектуальную собственность, продукты, торговые марки, бренд и сильный бизнес, а также команду мирового класса. Это предоставит Cognition более полное AI решение для кодирования, а сотрудникам Windsurf — лучшие условия. (Источник: dotey, Cognition, johannes_hage, russelljkaplan, saranormous, mervenoyann, op7418)
Meta строит 5GW AI дата-центр: Meta строит 5GW AI дата-центр под названием Hyperion, который, как ожидается, будет завершен в течение нескольких лет и станет одним из крупнейших AI дата-центров в мире. Это говорит о том, что Meta полностью включилась в гонку AI. (Источник: scaling01, dylan522p, bookwormengr, op7418)
xAI Grok сотрудничает с Министерством обороны США: xAI объявила о Grok for Government, предоставляя свои передовые модели государственным клиентам США. xAI получила контракт с Министерством обороны США и предлагает продукты всем федеральным ведомствам через программу GSA. (Источник: rpoo, TheGregYang, jpt401, jpt401)
Google представляет Gemini Embedding Model: Google представила Gemini Embedding Model, которая заняла первое место в рейтинге MTEB. Модель стоит $0,15 за миллион токенов и доступна для крупномасштабного производства. (Источник: imjaredz, osanseviero, _philschmid, scaling01, algo_diver, demishassabis)
China Telecom выпускает AI Flow (智传网): China Telecom выпустила AI Flow (智传网), нацеленную на передачу и появление интеллекта посредством многоуровневой сетевой архитектуры и соединения между интеллектуальными агентами, преодолевая трудности «последней мили» в популяризации приложений AI. (Источник: 36氪)
Perplexity выпускает AI браузер Comet: Perplexity представила AI браузер Comet, предназначенный для интеграции изолированных вкладок в единую интеллектуальную интерактивную среду посредством контекстного восприятия и выполнения агентами, решая проблемы «понимания» и «использования» информации. (Источник: 36氪)
🧰 Инструменты
zerank: Zero Entropy AI выпустила zerank, новую модель переранжирования с открытым исходным кодом, которая превосходит по производительности все протестированные модели. (Источник: basetenco)
Динамический 1.8-битный GGUF Kimi K2: Unsloth AI выпустила динамический 1.8-битный GGUF для Kimi K2, уменьшив размер модели с 1.1TB до 245GB. 2-битный XL GGUF отлично показал себя в кодировании. (Источник: TheZachMueller, ImazAngel, huggingface, op7418, karminski3)
Kimi K2 на Fireworks: Kimi K2 теперь доступна на Fireworks Serverless API, став первым агенто-ориентированным инструментом вызова SOTA уровня с открытым исходным кодом. (Источник: _akhaliq, TheZachMueller)
Kimi K2 на GroqCloud: Kimi K2 теперь доступна в предварительной версии на GroqCloud со скоростью 185 токенов в секунду. (Источник: ImazAngel, JonathanRoss321, teortaxesTex)
Kimi K2 на Together AI: Kimi K2 теперь доступна на Together AI по более низкой цене и с более высокой производительностью. (Источник: togethercompute, tri_dao, vipulved)
Amazon Kiro: Amazon выпустила Kiro, новую AI-управляемую IDE, использующую нормативно-ориентированную разработку и автоматизирующую такие задачи, как документирование, тестирование и оптимизация производительности. (Источник: yoheinakajima, dotey, jeremyphoward)
📚 Обучение
Курс «Scratch to Scale» от Zach Mueller: Открыта регистрация на курс «Scratch to Scale» от Zach Mueller, который обучает распределенным методам тренировки, таким как DDP, ZeRO, Pipeline и Tensor Parallelism. (Источник: _akhaliq, TheZachMueller)
Руководство по RAG: LlamaIndex и qdrant выпустили полное руководство по построению RAG-приложений для реального мира, охватывающее весь процесс от исходных данных до готового конвейера, с практическими советами, примерами кода и проектами. (Источник: jerryjliu0, HamelHusain, HamelHusain)
Курс по генеративному AI: Abdullah Abu Hassann опубликовал доступный вводный курс по генеративному AI, избегая сложных математических формул, подходящий для студентов нетехнических специальностей. (Источник: karminski3)
💼 Бизнес
🌟 Сообщество
Функция «AI подруга» в Grok вызвала споры: Функция «AI подруга», представленная xAI для Grok, вызвала дискуссию об этике AI и социальном воздействии. (Источник: teortaxesTex, code_star, teortaxesTex, scaling01, teortaxesTex, teortaxesTex, dotey, ebbyamir, zacharynado, andersonbcdefg)
Общественное влияние DeepSeek: DeepSeek пользуется популярностью у потребителей и студентов благодаря своей бесплатности и простоте использования, в то время как Kimi K2 еще не достигла такого же общественного влияния. (Источник: bigeagle_xd)
Опасения по поводу аудита безопасности AI: Сотрудничество Grok от xAI с Министерством обороны США вызвало опасения по поводу аудита безопасности AI. (Источник: teortaxesTex, zacharynado, nptacek, jd_pressman, eliebakouch)
Снижение производительности Claude Code: Некоторые пользователи сообщают о снижении производительности Claude Code, предполагая, что Anthropic проводит A/B тестирование. (Источник: Reddit r/ClaudeAI)
Влияние AI на рынок труда: Влияние AI на рынок труда вызвало широкое обсуждение, поскольку выпускники вузов в Великобритании сталкиваются с перспективой «безработицы после выпуска», а работодатели жалуются на отсутствие у выпускников базовых навыков. (Источник: 36氪, 36氪)
💡 Другое
Подъем Китая в области AI: Появление таких технологий, как Kimi K2 и AI Flow, свидетельствует о растущей силе Китая в области AI. (Источник: natolambert, teortaxesTex, Yuchenj_UW)
Этика и социальное воздействие AI: Такие приложения, как AI-компаньоны и AI-генерируемые статьи, вызвали дискуссию об этике AI и социальном воздействии. (Источник: mustafasuleyman, teortaxesTex, 36氪, 36氪)
Проблемы AI-оборудования: Неудачный пример Humane AI Pin подчеркивает технические и рыночные проблемы, с которыми сталкивается AI-оборудование. (Источник: 36氪)