AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Gemini 3.5 – 에이전트 실행과 코딩에 초점을 맞춘 Google 차세대 모델

Gemini 3.5는 Google DeepMind가 2026년 Google I/O에서 공개한 Gemini 모델 패밀리다. 첫 공개 모델인 3.5 Flash는 빠른 응답 속도와 장기 에이전트 작업 수행 능력을 결합해, 코딩·문서 처리·멀티모달 분석 같은 실제 업무 자동화에 초점을 맞춘다.

핵심 포지션

Gemini 3.5의 메시지는 단순한 채팅 성능보다 행동(action) 이다. 모델이 정보를 요약하는 데 그치지 않고, 도구를 호출하고, 하위 에이전트를 나누고, 긴 작업을 계획·실행하는 흐름에 맞춰 설계됐다는 뜻이다.

Google은 3.5 Flash를 Gemini 앱, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform에 배포했다. TechCrunch 보도에 따르면 Google은 3.5 Flash를 Antigravity와 함께 개발해 에이전트가 “살고, 일하고, 실행하는” 네이티브 환경을 겨냥했고, 3.5 Pro는 오케스트레이터·플래너로, Flash는 하위 에이전트로 쓰는 조합을 염두에 두고 있다. 3.5 Pro는 내부 사용 후 다음 달 공개 예정이라고 밝혔다.

3.5 Flash의 특징

영역내용
에이전트 작업Google Antigravity 하네스와 결합해 장기 워크플로와 서브에이전트 병렬 작업을 수행
코딩레거시 코드베이스 이전, 게임 제작, UI 생성처럼 다단계 구현 작업을 겨냥
멀티모달차트·문서·이미지·인터랙티브 UI 이해와 생성 강화
속도Google은 프런티어 모델 대비 높은 output tokens/sec를 강조
안전성Frontier Safety Framework 기반 사이버·CBRN 안전 완화와 해석 가능성 도구를 적용

개발자 관점에서 중요한 세부값은 다음과 같다.

항목
모델 IDgemini-3.5-flash
컨텍스트1,048,576 입력 토큰
최대 출력65,536 토큰
지식 컷오프2025년 1월
사고 수준minimal, low, medium(기본), high
가격입력 $1.50/100만 토큰, 출력 $9.00/100만 토큰
캐시 입력 할인90%

벤치마크와 해석

Google은 3.5 Flash가 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo, MCP Atlas 83.6%, CharXiv Reasoning 84.2%를 기록했다고 밝혔다. Artificial Analysis도 GDPval-AA 1656 Elo, 280 output tokens/s 이상, Intelligence Index 55점을 보고했다. 이 수치는 특히 에이전트 하네스와 도구 사용 능력을 보여주는 지표로 읽어야 한다.

다만 “Flash = 저렴한 모델”이라는 기존 인식은 약해졌다. Simon Willison과 Artificial Analysis 모두 3.5 Flash가 이전 Flash 계열 대비 3배 높은 토큰 단가를 갖고, 실제 벤치마크 실행 비용은 Gemini 3 Flash 대비 5배 이상 높아졌다고 지적했다. 긴 에이전트 작업은 반복 턴과 도구 호출 때문에 입력 토큰이 크게 늘 수 있으므로, 모델 단가뿐 아니라 전체 작업당 비용으로 평가해야 한다.

다만 벤치마크만으로 실제 제품 선택을 끝내면 안 된다. 장기 작업 모델은 모델 성능뿐 아니라 파일 접근 권한, 도구 실패 처리, 검증 루프, 비용 상한, 사람이 개입하는 지점이 함께 설계돼야 한다.

사용 대상

  • 코딩 에이전트 사용자: Google Antigravity나 Gemini API로 장기 코드 작업을 자동화하려는 개발자
  • 기업 자동화 팀: 수십~수백 페이지 문서 검토, 고객 온보딩, 재무 문서 준비 같은 반복 지식 업무를 에이전트화하려는 팀
  • 멀티모달 앱 개발자: 문서·이미지·차트·UI를 한 흐름에서 처리하는 앱을 만드는 개발자

관련 문서

  • gemini — Google의 멀티모달 AI 모델 및 서비스 생태계
  • gemini-omni — 영상 생성·편집을 위한 Gemini 기반 멀티모달 생성 모델
  • google-agents-cli — Google Cloud 에이전트 빌더와 코딩 에이전트 연결
  • agent-harness — 장기 에이전트 성능을 좌우하는 하네스 설계
  • ai-agent-evaluation — 긴 작업과 도구 사용을 검증하는 평가 하네스
  • google-antigravity — Gemini 3.5 Flash를 기본 모델로 사용하는 에이전트 개발 플랫폼

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)