关键词:Gemma 3n, 多模态模型, MatFormer, 端侧设备, Transformer, 逐层嵌入(PLE), 键值缓存共享(KV Cache Sharing), LMArena评测
🔥 聚焦
谷歌发布Gemma 3n多模态模型: 谷歌正式发布Gemma 3n,一款专为端侧设备设计的开源多模态模型。该模型基于创新的MatFormer(套娃式Transformer)架构,提供E2B(20亿有效参数)和E4B(40亿有效参数)两种尺寸,最低仅需2GB内存即可运行。Gemma 3n原生支持图像、音频、视频和文本输入,E4B版本在LMArena评测中得分突破1300,成为首个10B参数以下达到此分数的模型。其技术亮点包括大幅提升内存效率的逐层嵌入(PLE)和加速长文本处理的键值缓存共享(KV Cache Sharing)机制,旨在将强大的多模态AI能力带到手机等边缘设备上 (来源: GoogleDeepMind, madiator, reach_vb, 36氪)