[샌프란시스코] 구글이 현지시간 7일, 자사의 최신 AI 기술력을 집약한 오픈 모델 시리즈 ‘Gemma 4(젬마 4)’를 전격 발표했다. 이번 신모델은 구글의 최첨단 AI인 ‘Gemini 3(제미나이 3)’와 동일한 기술 아키텍처를 기반으로 설계되어, 오픈 모델 중 역대급 성능을 자랑한다.
■ “더 작지만 더 똑똑하게”… 지능의 효율성 극대화
Gemma 4의 핵심 키워드는 ‘파라미터당 지능(Intelligence-per-parameter)’이다. 모델의 덩치를 키우는 대신, 제한된 크기 안에서 얼마나 더 깊은 추론이 가능한지에 초점을 맞췄다.
구글은 사용자 환경에 맞춰 네 가지 라인업을 선보였다.
• 초경량 2B(Effective 2B): 모바일 기기에서 기존보다 3배 빠른 속도로 구동된다.
• 고성능 4B(Effective 4B): 복잡한 온디바이스 추론 작업에 최적화되었다.
• 효율적 26B(A4B MoE): 전문가 혼합(MoE) 구조를 통해 연산 자원을 아끼면서 성능을 높였다.
• 플래그십 31B(Dense): 서버급 성능을 제공하며 오픈 모델 중 가장 강력한 연산 능력을 보여준다.
■ 텍스트 넘어 이미지·영상까지… ‘네이티브 멀티모달’ 구현
Gemma 4는 오픈 모델임에도 불구하고 텍스트, 이미지, 오디오, 비디오를 동시에 처리하는 ‘네이티브 멀티모달’ 능력을 갖췄다. 이를 통해 사용자는 스마트폰이나 노트북에서 오프라인 상태로 사진 속 차트를 분석하거나, 긴 영상을 요약해달라는 요청을 처리할 수 있게 되었다.
특히 최대 256K 토큰에 달하는 확장된 컨텍스트 윈도우는 수백 페이지의 기술 문서나 긴 코드 베이스를 한 번에 파악하는 데 결정적인 역할을 한다.
■ ‘AI 에이전트’ 시대의 가속화
구글은 이번 발표에서 Gemma 4가 ‘에이전틱 워크플로우(Agentic Workflow)’에 최적화되었음을 강조했다. 외부 API를 스스로 호출하는 함수 호출(Function Calling) 기능과 정교한 시스템 프롬프트 제어 기능을 통해, 개발자는 특정 작업(코딩, 데이터 분석 등)을 스스로 수행하는 개인용 AI 비서를 손쉽게 구축할 수 있다.
■ 개발자 친화적 생태계 구축… ‘Apache 2.0’ 라이선스 채택
개발자들의 가장 큰 환영을 받는 지점은 Apache 2.0 라이선스 채택이다. 이로써 기업과 개인 개발자들은 상업적 목적의 서비스 개발 및 배포에 있어 제약 없이 Gemma 4를 활용할 수 있게 되었다.
구글 관계자는 “Gemma 4는 온디바이스 AI의 한계를 다시 한번 뛰어넘은 모델”이라며, “차세대 ‘Gemini Nano 4’의 기반이 되는 이 모델이 전 세계 개발자들의 혁신을 가속화할 것으로 기대한다”고 밝혔다.
이번 Gemma 4 출시로 인해 클라우드 연결 없이 기기 자체에서 구동되는 ‘엣지 AI’ 시장의 주도권을 잡기 위한 빅테크 기업 간의 경쟁은 더욱 치열해질 전망이다.










