キーワード:Gemma 3n, マルチモーダルモデル, MatFormer, エッジデバイス, Transformer, 階層別埋め込み(PLE), キー・バリューキャッシュ共有(KV Cache Sharing), LMArena評価

🔥 フォーカス

Google、マルチモーダルモデル「Gemma 3n」をリリース: Googleは、オンデバイス向けに設計されたオープンソースのマルチモーダルモデル「Gemma 3n」を正式にリリースしました。このモデルは革新的なMatFormer(マトリョーシカ式Transformer)アーキテクチャをベースにしており、E2B(有効パラメータ数20億)とE4B(有効パラメータ数40億)の2つのサイズが提供され、最小わずか2GBのメモリで実行可能です。Gemma 3nは画像、音声、動画、テキストの入力をネイティブにサポートし、E4BバージョンはLMArenaの評価でスコア1300を突破し、10Bパラメータ以下のモデルとして初めてこのスコアを達成しました。その技術的な特徴には、メモリ効率を大幅に向上させるPLE (Per-Layer Embedding)や、長いテキスト処理を高速化するKV Cache Sharingメカニズムが含まれており、強力なマルチモーダルAI機能をスマートフォンなどのエッジデバイスにもたらすことを目指しています。(ソース: GoogleDeepMind, madiator, reach_vb, 36氪)