Gemini 3.5는 Google DeepMind가 2026년 Google I/O에서 공개한 Gemini 모델 패밀리다. 첫 공개 모델인 3.5 Flash는 빠른 응답 속도와 장기 에이전트 작업 수행 능력을 결합해, 코딩·문서 처리·멀티모달 분석 같은 실제 업무 자동화에 초점을 맞춘다.
핵심 포지션
Gemini 3.5의 메시지는 단순한 채팅 성능보다 행동(action) 이다. 모델이 정보를 요약하는 데 그치지 않고, 도구를 호출하고, 하위 에이전트를 나누고, 긴 작업을 계획·실행하는 흐름에 맞춰 설계됐다는 뜻이다.
Google은 3.5 Flash를 Gemini 앱, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform에 배포했다. TechCrunch 보도에 따르면 Google은 3.5 Flash를 Antigravity와 함께 개발해 에이전트가 “살고, 일하고, 실행하는” 네이티브 환경을 겨냥했고, 3.5 Pro는 오케스트레이터·플래너로, Flash는 하위 에이전트로 쓰는 조합을 염두에 두고 있다. 3.5 Pro는 내부 사용 후 다음 달 공개 예정이라고 밝혔다.
3.5 Flash의 특징
| 영역 | 내용 |
|---|---|
| 에이전트 작업 | Google Antigravity 하네스와 결합해 장기 워크플로와 서브에이전트 병렬 작업을 수행 |
| 코딩 | 레거시 코드베이스 이전, 게임 제작, UI 생성처럼 다단계 구현 작업을 겨냥 |
| 멀티모달 | 차트·문서·이미지·인터랙티브 UI 이해와 생성 강화 |
| 속도 | Google은 프런티어 모델 대비 높은 output tokens/sec를 강조 |
| 안전성 | Frontier Safety Framework 기반 사이버·CBRN 안전 완화와 해석 가능성 도구를 적용 |
개발자 관점에서 중요한 세부값은 다음과 같다.
| 항목 | 값 |
|---|---|
| 모델 ID | gemini-3.5-flash |
| 컨텍스트 | 1,048,576 입력 토큰 |
| 최대 출력 | 65,536 토큰 |
| 지식 컷오프 | 2025년 1월 |
| 사고 수준 | minimal, low, medium(기본), high |
| 가격 | 입력 $1.50/100만 토큰, 출력 $9.00/100만 토큰 |
| 캐시 입력 할인 | 90% |
벤치마크와 해석
Google은 3.5 Flash가 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo, MCP Atlas 83.6%, CharXiv Reasoning 84.2%를 기록했다고 밝혔다. Artificial Analysis도 GDPval-AA 1656 Elo, 280 output tokens/s 이상, Intelligence Index 55점을 보고했다. 이 수치는 특히 에이전트 하네스와 도구 사용 능력을 보여주는 지표로 읽어야 한다.
다만 “Flash = 저렴한 모델”이라는 기존 인식은 약해졌다. Simon Willison과 Artificial Analysis 모두 3.5 Flash가 이전 Flash 계열 대비 3배 높은 토큰 단가를 갖고, 실제 벤치마크 실행 비용은 Gemini 3 Flash 대비 5배 이상 높아졌다고 지적했다. 긴 에이전트 작업은 반복 턴과 도구 호출 때문에 입력 토큰이 크게 늘 수 있으므로, 모델 단가뿐 아니라 전체 작업당 비용으로 평가해야 한다.
다만 벤치마크만으로 실제 제품 선택을 끝내면 안 된다. 장기 작업 모델은 모델 성능뿐 아니라 파일 접근 권한, 도구 실패 처리, 검증 루프, 비용 상한, 사람이 개입하는 지점이 함께 설계돼야 한다.
사용 대상
- 코딩 에이전트 사용자: Google Antigravity나 Gemini API로 장기 코드 작업을 자동화하려는 개발자
- 기업 자동화 팀: 수십~수백 페이지 문서 검토, 고객 온보딩, 재무 문서 준비 같은 반복 지식 업무를 에이전트화하려는 팀
- 멀티모달 앱 개발자: 문서·이미지·차트·UI를 한 흐름에서 처리하는 앱을 만드는 개발자
관련 문서
- gemini — Google의 멀티모달 AI 모델 및 서비스 생태계
- gemini-omni — 영상 생성·편집을 위한 Gemini 기반 멀티모달 생성 모델
- google-agents-cli — Google Cloud 에이전트 빌더와 코딩 에이전트 연결
- agent-harness — 장기 에이전트 성능을 좌우하는 하네스 설계
- ai-agent-evaluation — 긴 작업과 도구 사용을 검증하는 평가 하네스
- google-antigravity — Gemini 3.5 Flash를 기본 모델로 사용하는 에이전트 개발 플랫폼
참고 자료
- Gemini 3.5: frontier intelligence with action — Google Blog (2026-05-19)
- With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots — TechCrunch (2026-05-19)
- Gemini 3.5 Flash: more expensive, but Google plan to use it for everything — Simon Willison (2026-05-19)
- Gemini 3.5 Flash: Frontier Intelligence with Speed — Analytics Vidhya (2026-05-20)
- Gemini 3.5 Flash: The new leader in intelligence versus speed — Artificial Analysis (2026-05-19)