Gemini 3.5는 Google DeepMind가 2026년 Google I/O에서 공개한 Gemini 모델 패밀리다. 첫 공개 모델인 3.5 Flash는 빠른 응답 속도와 장기 에이전트 작업 수행 능력을 결합해, 코딩·문서 처리·멀티모달 분석 같은 실제 업무 자동화에 초점을 맞춘다.
핵심 포지션
Gemini 3.5의 메시지는 단순한 채팅 성능보다 행동(action) 이다. 모델이 정보를 요약하는 데 그치지 않고, 도구를 호출하고, 하위 에이전트를 나누고, 긴 작업을 계획·실행하는 흐름에 맞춰 설계됐다는 뜻이다.
Google은 3.5 Flash를 Gemini 앱, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform에 배포했다. 3.5 Pro는 내부 사용 후 다음 달 공개 예정이라고 밝혔다.
3.5 Flash의 특징
| 영역 | 내용 |
|---|---|
| 에이전트 작업 | Google Antigravity 하네스와 결합해 장기 워크플로와 서브에이전트 병렬 작업을 수행 |
| 코딩 | 레거시 코드베이스 이전, 게임 제작, UI 생성처럼 다단계 구현 작업을 겨냥 |
| 멀티모달 | 차트·문서·이미지·인터랙티브 UI 이해와 생성 강화 |
| 속도 | Google은 프런티어 모델 대비 높은 output tokens/sec를 강조 |
| 안전성 | Frontier Safety Framework 기반 사이버·CBRN 안전 완화와 해석 가능성 도구를 적용 |
벤치마크와 해석
Google은 3.5 Flash가 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo, MCP Atlas 83.6%, CharXiv Reasoning 84.2%를 기록했다고 밝혔다. 이 수치는 특히 에이전트 하네스와 도구 사용 능력을 보여주는 지표로 읽어야 한다.
다만 벤치마크만으로 실제 제품 선택을 끝내면 안 된다. 장기 작업 모델은 모델 성능뿐 아니라 파일 접근 권한, 도구 실패 처리, 검증 루프, 비용 상한, 사람이 개입하는 지점이 함께 설계돼야 한다.
사용 대상
- 코딩 에이전트 사용자: Google Antigravity나 Gemini API로 장기 코드 작업을 자동화하려는 개발자
- 기업 자동화 팀: 수십~수백 페이지 문서 검토, 고객 온보딩, 재무 문서 준비 같은 반복 지식 업무를 에이전트화하려는 팀
- 멀티모달 앱 개발자: 문서·이미지·차트·UI를 한 흐름에서 처리하는 앱을 만드는 개발자
관련 문서
- gemini — Google의 멀티모달 AI 모델 및 서비스 생태계
- gemini-omni — 영상 생성·편집을 위한 Gemini 기반 멀티모달 생성 모델
- google-agents-cli — Google Cloud 에이전트 빌더와 코딩 에이전트 연결
- agent-harness — 장기 에이전트 성능을 좌우하는 하네스 설계
- ai-agent-evaluation — 긴 작업과 도구 사용을 검증하는 평가 하네스
참고 자료
- Gemini 3.5: frontier intelligence with action — Google Blog (2026-05-19)