Kata Kunci:Gemma 3n, MatFormer, Gemma 3n E2B, Gemma 3n E4B, multimodal di sisi perangkat, embedding per lapisan, konsumsi sumber daya rendah, skor arena LMArena, berjalan dengan RAM 2GB, tersedia di Hugging Face
🔥 Fokus
Google merilis Gemma 3n, membuka era baru multimodalitas on-device: Google secara resmi merilis seri model Gemma 3n, yang dirancang khusus untuk perangkat on-device dan mendukung input teks, gambar, audio, dan video secara native. Seri ini mencakup dua model, E2B dan E4B. Meskipun jumlah parameter sebenarnya adalah 5B dan 8B, berkat arsitektur inovatif MatFormer “matryoshka” dan teknologi Progressive Layered Embeddings (PLE), penggunaan VRAM-nya hanya setara dengan model 2B dan 4B, serta dapat berjalan dengan RAM minimal 2GB. Gemma 3n mencetak skor lebih dari 1300 di arena LMArena, menjadikannya model pertama dengan parameter di bawah 10B yang mencapai skor ini, yang menunjukkan performa luar biasanya dengan konsumsi sumber daya yang rendah. Saat ini, model tersebut telah tersedia secara penuh di platform open-source utama seperti Hugging Face, Ollama, dan MLX, mendorong pengembangan lebih lanjut aplikasi AI on-device (Sumber: HuggingFace Blog, karminski3, demishassabis, Reddit r/LocalLLaMA)