목차
텍스트·이미지·코드 등 각 모달리티가 별도 AI 서비스로 분산되어 있던 시대, Google DeepMind는 이를 단일 모델로 통합한 Gemini를 개발했다. 텍스트·이미지·오디오·비디오·코드를 네이티브로 이해하고 생성하며, Google Workspace·Android·검색·교육 등 Google 핵심 서비스에 깊이 통합된 AI 모델 패밀리다. Gemini 앱 월간 활성 사용자 3억 5천만 명(2025년 기준).
모델 라인업
- Gemini Ultra: 최고 성능의 모델, 복잡한 작업에 특화
- Gemini Pro: 균형 잡힌 성능, 다양한 작업
- Gemini Nano: 온디바이스 실행을 위한 경량 모델
- Gemini Flash: 빠른 응답에 최적화
주요 기능
Gemini 앱
- 텍스트·이미지·음성으로 대화
- 파일 업로드 및 분석
- Gemini Live: 실시간 음성 대화
Gemini Notebooks (2026년 출시)
구글 Docs와 NotebookLM의 기능을 결합한 학습·연구 환경:
- 여러 소스(PDF, 이미지, 노트) 한 곳에 통합
- 세션 간 진행 상황 유지
- Audio Overviews: AI 진행자 2명의 팟캐스트 스타일 대화
- 자동 스터디 가이드 및 플래시카드 생성
Guided Learning
소크라테스 방식의 학습 지원:
- 답을 바로 주지 않고 열린 질문으로 이해도 구축
- 손으로 쓴 수식 사진 분석 및 설명
Interactive Visualizations
복잡한 개념을 3D 모델, 인터랙티브 차트로 시각화 (Pro 모델 사용):
- 분자 회전
- 물리 시뮬레이션
경쟁 서비스와의 비교
| 항목 | Gemini 2.5 Pro | GPT-4o | Claude Sonnet |
|---|---|---|---|
| 멀티모달 지원 | 텍스트·이미지·오디오·비디오 | 텍스트·이미지·오디오 | 텍스트·이미지 |
| 컨텍스트 윈도우 | 1M 토큰 | 128K | 200K |
| Google 서비스 통합 | 깊은 통합 (Docs, Gmail 등) | 제한적 | 없음 |
| 온디바이스 경량 모델 | Gemini Nano | 없음 | 없음 |
| 무료 티어 | 있음 | 있음 (mini) | 있음 |
언제 사용하면 좋은가?
| 사용 사례 | 적합한 Gemini 기능 |
|---|---|
| 복잡한 문서 다수를 분석·정리 | Gemini Notebooks |
| 노트를 오디오로 변환해 학습 | Audio Overviews |
| 어려운 개념 단계적 학습 | Guided Learning |
| 추상적 개념 시각적 이해 | Interactive Visualizations |
| 지식 자가 점검 | 커스텀 퀴즈/연습 시험 생성 |
라이선스 및 요금제
Google의 독점 서비스로 오픈소스가 아니다. Gemini 앱은 무료로 제공되며, 고급 기능(Gemini Advanced)은 Google One AI Premium 구독이 필요하다. Gemini API는 무료 티어와 유료 요금제로 제공된다.
관련 문서
- gemma — Google의 경량 오픈 모델 계열
- gemini-tips-study — Gemini로 시험 준비하는 6가지 방법
- gemini-31-flash-tts — Gemini 3.1 Flash TTS: 프롬프트로 음색·감정 제어
- google-ai-studio — Gemini 파라미터를 직접 제어하는 개발자용 환경
- notebooklm — Google NotebookLM
관련 자료
- 6 easy ways to study for finals with Gemini — Google Blog (2026-04-10)