Anahtar Kelimeler:Gemma 3n, çok modelli model, MatFormer, uç cihaz, Transformer, katman katman gömme (PLE), anahtar-değer önbellek paylaşımı (KV Cache Sharing), LMArena değerlendirmesi

🔥 聚焦

谷歌發布Gemma 3n多模態模型: 谷歌正式發布Gemma 3n,一款專為終端裝置設計的開源多模態模型。該模型基於創新的MatFormer(套娃式Transformer)架構,提供E2B(20億有效參數)和E4B(40億有效參數)兩種尺寸,最低僅需2GB記憶體即可運行。Gemma 3n原生支援圖像、音訊、影片和文字輸入,E4B版本在LMArena評測中得分突破1300,成為首個10B參數以下達到此分數的模型。其技術亮點包括大幅提升記憶體效率的逐層嵌入(PLE)和加速長文本處理的鍵值快取共享(KV Cache Sharing)機制,旨在將強大的多模態AI能力帶到手機等邊緣裝置上 (來源: GoogleDeepMind, madiator, reach_vb, 36氪)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir