AI日报 - 2025-06-28(早)

关键词：Gemma 3n, 多模态模型, MatFormer, 端侧设备, Transformer, 逐层嵌入(PLE), 键值缓存共享(KV Cache Sharing), LMArena评测

🔥 聚焦

谷歌发布Gemma 3n多模态模型: 谷歌正式发布Gemma 3n，一款专为端侧设备设计的开源多模态模型。该模型基于创新的MatFormer（套娃式Transformer）架构，提供E2B（20亿有效参数）和E4B（40亿有效参数）两种尺寸，最低仅需2GB内存即可运行。Gemma 3n原生支持图像、音频、视频和文本输入，E4B版本在LMArena评测中得分突破1300，成为首个10B参数以下达到此分数的模型。其技术亮点包括大幅提升内存效率的逐层嵌入（PLE）和加速长文本处理的键值缓存共享（KV Cache Sharing）机制，旨在将强大的多模态AI能力带到手机等边缘设备上 (来源: GoogleDeepMind, madiator, reach_vb, 36氪)

🔥 聚焦

相关标签

Related Posts

AI日报 – 2025-10-29(早)

AI日报 – 2025-10-28(早)

AI日报 – 2025-10-27(晚)