본문 바로가기
AI 오픈소스

[AI 오픈소스] Gemma3 : 차세대 경량 멀티모달 AI 모델의 혁신

by 앨런튜링1 2025. 3. 13.
반응형

안녕하세요.

최근 AI 모델은 빠르게 발전하며 점점 더 강력한 성능을 제공하고 있습니다. 하지만 고성능 모델들은 많은 계산 자원을 요구하며, 이를 실행하려면 강력한 하드웨어가 필요합니다. 이러한 문제를 해결하기 위해, Google DeepMind에서 가벼우면서도 상대적으로 높은 성능을 제공하는 새로운 AI 모델 Gemma 3를 공개했습니다.

오늘은 구글의 Gemma 3에 대해서 소개드립니다.

 

 

Gemma 3란 무엇인가?

Gemma 3는 Google DeepMind가 개발한 최신 경량 AI 모델로, Gemini 2.0의 기술을 기반으로 만들어졌습니다. 이 모델은 다양한 크기로 제공되며, 단일 GPU에서도 실행할 수 있도록 설계되었습니다. 즉, 고성능 서버가 없어도 누구나 AI 모델을 활용할 수 있도록 만든 것이 특징입니다.

Gemma 3의 모델 크기별 비교

Gemma 3는 사용자의 하드웨어 환경에 맞춰 선택할 수 있도록 네 가지 크기로 제공됩니다.

모델 크기 컨텍스트 길이 멀티모달 지원 주요 특징
1B 32K ❌ (텍스트 전용) 초경량 모델, 빠른 처리 속도
4B 128K ✅ (텍스트 + 이미지) 중간 규모, 멀티모달 지원
12B 128K ✅ (텍스트 + 이미지) 고성능 모델, 다양한 작업 지원
27B 128K ✅ (텍스트 + 이미지) 최상위 모델, 최적의 성능 제공


이처럼 다양한 모델 크기로 제공되기 때문에 로컬 장치, 클라우드, 엣지 디바이스 등 다양한 환경에서 활용할 수 있습니다.


Gemma 3의 주요 특징

  • 긴 컨텍스트 윈도우
    Gemma 3는 최대 128K 토큰을 처리할 수 있습니다. 이는 문서 요약, 코드 생성, 대화형 AI 모델 개발 등에서 강력한 성능을 제공합니다.
  • 멀티모달 지원
    이전 모델과 달리, Gemma 3는 이미지까지 이해할 수 있는 멀티모달 기능을 갖추고 있습니다. 즉, 사용자가 텍스트뿐만 아니라 이미지를 업로드하면 이를 분석하고 정보를 제공할 수 있습니다.
  • 다국어 기능
    Gemma 3는 140개 이상의 언어를 지원하며, 다양한 언어 데이터를 학습하여 보다 자연스럽고 정확한 번역 및 대화를 제공합니다.


Gemma 3의 성능 평가

Gemma 3는 최신 AI 벤치마크 테스트에서 높은 점수를 기록했습니다.

  • LMSys Chatbot Arena 평가에서 o1-preview 및 기타 AI 모델과 동급 또는 더 높은 성능을 기록
  • Llama 405B, DeepSeek-V3, o3-mini 모델보다 뛰어난 성능

주요 AI 모델 성능 비교

순위 모델 Elo 점수 오픈소스 여부 파라미터 수
1 Grok-3-Preview-02-24 1412 -
2 GPT-4.5-Preview 1411 -
3 Gemini-2.0-Pro-Exp-02-05 1380 -
6 DeepSeek-R1 1363 671B/37B
9 Gemma-3-27B-IT 1338 27B
12 DeepSeek-V3 1318 671B/37B
28 Meta-Llama-3.1-405B-Instruct 1269 405B
38 Llama-3.3-70B-Instruct 1257 70B


개발자 친화적 기능

1. 다양한 개발 환경 지원

  • PyTorch, TensorFlow, JAX, Hugging Face Transformers 등 다양한 프레임워크 지원
  • 로컬 및 클라우드 배포 가능 (Vertex AI, Cloud Run, Kaggle 등)
  • Google AI Studio에서 바로 실행 가능

2. 최적화된 GPU 지원

  • NVIDIA GPU (Jetson Nano부터 최신 Blackwell 칩까지 지원)
  • Google Cloud TPU
  • AMD GPU (ROCm™ 스택을 활용한 호환성 제공)


안전성과 책임 있는 AI 개발

1. 데이터 검증 및 안전성 테스트

  • 철저한 데이터 검증 및 안전성 테스트 진행
  • AI 모델이 부적절한 콘텐츠를 생성하지 않도록 설계

2. ShieldGemma 2 – 이미지 안전 검출 기능

  • 이미지 데이터를 분석하여 유해 콘텐츠 자동 감지 기능 제공
  • AI 모델이 보다 책임감 있게 활용될 수 있도록 지원


Gemma 3의 실전 활용 사례

1️⃣ 온디바이스 AI

모바일, 태블릿, 엣지 디바이스에서도 실행 가능

2️⃣ 기업용 AI 서비스

챗봇, 고객 지원 시스템, 데이터 분석 도구 등 적용 가능

3️⃣ 학술 연구 및 번역

140개 이상의 언어 지원으로 연구 및 번역 서비스 활용 가능



Gemma 3는 누구나 쉽게 사용할 수 있으며, 강력한 성능과 효율성을 갖춘 AI 모델입니다. 앞으로 AI 기술이 더욱 발전하면서, Gemma 3와 같은 모델이 다양한 분야에서 핵심 역할을 하게 될 것입니다.

출처

https://blog.google/technology/developers/gemma-3/

 

Introducing Gemma 3: The most capable model you can run on a single GPU or TPU

Today, we're introducing Gemma 3, our most capable, portable and responsible open model yet.

blog.google

https://huggingface.co/blog/gemma3

 

Welcome Gemma 3: Google's all new multimodal, multilingual, long context open LLM

At last, this is the poetic return I long awaited from Google.

huggingface.co

 

반응형