키워드:Gemma 3n, 다중 모달 모델, MatFormer, 엣지 디바이스, Transformer, 계층별 임베딩(PLE), 키-값 캐시 공유(KV Cache Sharing), LMArena 평가

🔥 포커스

Google, Gemma 3n 멀티모달 모델 출시: Google이 온디바이스용으로 특별히 설계된 오픈소스 멀티모달 모델 Gemma 3n을 공식 출시했습니다. 이 모델은 혁신적인 MatFormer(마트료시카 스타일 Transformer) 아키텍처를 기반으로 하며, E2B(유효 파라미터 20억 개)와 E4B(유효 파라미터 40억 개) 두 가지 크기로 제공되고 최소 2GB 메모리만으로도 실행할 수 있습니다. Gemma 3n은 이미지, 오디오, 비디오, 텍스트 입력을 기본적으로 지원하며, E4B 버전은 LMArena 평가에서 1300점을 돌파하여 10B 파라미터 미만 모델 중 최초로 이 점수를 달성했습니다. 기술적 하이라이트로는 메모리 효율을 크게 향상시키는 PLE(Progressive Layer Embedding)와 긴 텍스트 처리를 가속화하는 KV Cache Sharing 메커니즘이 있으며, 이는 휴대폰과 같은 엣지 디바이스에 강력한 멀티모달 AI 기능을 제공하는 것을 목표로 합니다 (출처: GoogleDeepMind, madiator, reach_vb, 36氪)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다