Ключевые слова:Gemma 3n, Мультимодальность на устройстве, MatFormer, Послойное внедрение, Низкое потребление ресурсов, Модель Gemma 3n E2B, Модель Gemma 3n E4B, Очки арены LMArena, Работа на 2 ГБ оперативной памяти, Доступно на Hugging Face
🔥 В центре внимания
Google выпустила Gemma 3n, открывая новую эру мультимодальности на устройствах: Google официально выпустила серию моделей Gemma 3n, специально разработанную для работы на устройствах, с нативной поддержкой ввода текста, изображений, аудио и видео. Серия включает две модели: E2B и E4B. Хотя их фактическое количество параметров составляет 5B и 8B, благодаря инновационной архитектуре MatFormer «матрёшка» и технологии послойного встраивания (PLE), занимаемый ими объём видеопамяти эквивалентен моделям на 2B и 4B, и для их работы требуется минимум 2 ГБ RAM. Gemma 3n набрала более 1300 очков на арене LMArena, став первой моделью с менее чем 10B параметрами, достигшей такого результата, что демонстрирует её выдающуюся производительность при низком потреблении ресурсов. В настоящее время модель уже полностью доступна на таких ведущих открытых платформах, как Hugging Face, Ollama и MLX, способствуя дальнейшему развитию локальных AI-приложений (Источник: HuggingFace Blog, karminski3, demishassabis, Reddit r/LocalLLaMA)