AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Gemini 3.5 – 에이전트 실행과 코딩에 초점을 맞춘 Google 차세대 모델

Gemini 3.5는 Google DeepMind가 2026년 Google I/O에서 공개한 Gemini 모델 패밀리다. 첫 공개 모델인 3.5 Flash는 빠른 응답 속도와 장기 에이전트 작업 수행 능력을 결합해, 코딩·문서 처리·멀티모달 분석 같은 실제 업무 자동화에 초점을 맞춘다.

핵심 포지션

Gemini 3.5의 메시지는 단순한 채팅 성능보다 행동(action) 이다. 모델이 정보를 요약하는 데 그치지 않고, 도구를 호출하고, 하위 에이전트를 나누고, 긴 작업을 계획·실행하는 흐름에 맞춰 설계됐다는 뜻이다.

Google은 3.5 Flash를 Gemini 앱, AI Mode in Search, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise Agent Platform에 배포했다. 3.5 Pro는 내부 사용 후 다음 달 공개 예정이라고 밝혔다.

3.5 Flash의 특징

영역내용
에이전트 작업Google Antigravity 하네스와 결합해 장기 워크플로와 서브에이전트 병렬 작업을 수행
코딩레거시 코드베이스 이전, 게임 제작, UI 생성처럼 다단계 구현 작업을 겨냥
멀티모달차트·문서·이미지·인터랙티브 UI 이해와 생성 강화
속도Google은 프런티어 모델 대비 높은 output tokens/sec를 강조
안전성Frontier Safety Framework 기반 사이버·CBRN 안전 완화와 해석 가능성 도구를 적용

벤치마크와 해석

Google은 3.5 Flash가 Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo, MCP Atlas 83.6%, CharXiv Reasoning 84.2%를 기록했다고 밝혔다. 이 수치는 특히 에이전트 하네스와 도구 사용 능력을 보여주는 지표로 읽어야 한다.

다만 벤치마크만으로 실제 제품 선택을 끝내면 안 된다. 장기 작업 모델은 모델 성능뿐 아니라 파일 접근 권한, 도구 실패 처리, 검증 루프, 비용 상한, 사람이 개입하는 지점이 함께 설계돼야 한다.

사용 대상

  • 코딩 에이전트 사용자: Google Antigravity나 Gemini API로 장기 코드 작업을 자동화하려는 개발자
  • 기업 자동화 팀: 수십~수백 페이지 문서 검토, 고객 온보딩, 재무 문서 준비 같은 반복 지식 업무를 에이전트화하려는 팀
  • 멀티모달 앱 개발자: 문서·이미지·차트·UI를 한 흐름에서 처리하는 앱을 만드는 개발자

관련 문서

  • gemini — Google의 멀티모달 AI 모델 및 서비스 생태계
  • gemini-omni — 영상 생성·편집을 위한 Gemini 기반 멀티모달 생성 모델
  • google-agents-cli — Google Cloud 에이전트 빌더와 코딩 에이전트 연결
  • agent-harness — 장기 에이전트 성능을 좌우하는 하네스 설계
  • ai-agent-evaluation — 긴 작업과 도구 사용을 검증하는 평가 하네스

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)