AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

구글 Nano Banana 3종 비교, NB2가 대부분 프로젝트에 최선인 이유

Pro 수준의 이미지를 Pro 가격 없이 원한다면 선택지가 생겼습니다. Google이 공개한 공식 가이드에 따르면, Nano Banana 2(NB2)는 Pro 모델 성능의 약 95%를 내면서 비용은 절반 수준입니다. 게다가 이미지 생성 전에 웹에서 실제 사진을 검색해 참조하는 기능까지 더해졌습니다.

사진 출처: The Decoder

Google이 이미지 생성 모델 패밀리 Nano Banana 3종의 차이점과 권장 사용 시점을 담은 공식 가이드를 발표했습니다. 최근 출시된 Nano Banana 2가 Gemini 3.1 Flash Image를 기반으로 한다는 점을 포함해, 세 모델의 포지셔닝을 명확히 정리한 내용입니다.

출처: Build with Nano Banana 2, our best image generation and editing model – Google Blog

세 모델, 각자의 자리가 있다

Nano Banana 패밀리는 현재 NB1, NB2, Pro 세 가지입니다. Google이 제시한 기준은 단순합니다. 새 프로젝트에는 NB2를 기본값으로 쓰고, Pro는 NB2가 부족할 때만 고려하며, NB1은 이미 돌아가고 있는 워크플로우에만 남겨두라는 것입니다.

Pro 모델이 여전히 라인업 최상위지만, Google 스스로 NB2면 대부분의 케이스를 커버한다고 말합니다. Pro가 의미 있는 경우는 다층적이고 논리적으로 복잡한 프롬프트일 때뿐입니다. NB1은 thinking 모델이 아니기 때문에 속도는 가장 빠르고 비용도 최저이지만, 더 이상 신규 프로젝트에는 권장되지 않습니다. 다만 강제 마이그레이션은 없으니 기존 파이프라인은 그대로 유지됩니다.

가격 차이를 보면 선택이 더 선명해집니다. 1K 해상도 기준으로 NB2는 0.067달러, Pro는 0.134달러입니다. 4K에서도 NB2는 0.151달러 대 Pro의 0.240달러로, NB2가 일관되게 절반 안팎 수준입니다.

이미지 생성 전에 웹 이미지를 직접 검색한다

NB2의 가장 주목할 만한 신기능은 이미지 그라운딩(Image Grounding)입니다. Nano Banana Pro도 웹에서 텍스트 정보를 가져올 수 있었지만, NB2는 한 단계 더 나아가 실제 이미지를 검색해 시각적 참조로 활용합니다.

작동 흐름은 이렇습니다. ① 프롬프트에서 특정 장소나 생물 종 등 참조가 필요한 대상을 파악하고 → ② Google 이미지 검색으로 실제 사진을 수집한 뒤 → ③ 그 시각 정보를 바탕으로 이미지를 생성합니다. 덕분에 모델이 학습 데이터에서만 참조하는 것이 아니라, 실제로 존재하는 건물이나 희귀 동식물의 생김새를 정확히 반영할 수 있습니다.

Google이 제시한 사례는 프랑스 부아롱의 특정 교회와 두 나비 종의 시각적 차이입니다. 단, 인물에 대해서는 이미지 검색이 작동하지 않습니다. 현재는 API 전용 기능이며 Gemini 앱에서는 아직 지원하지 않습니다.

사진 출처: Google

512px 해상도와 Thinking Mode 활용 기준

NB2는 512px 해상도 옵션도 추가됐습니다. 이 해상도에서의 비용은 NB1과 비슷한 수준(0.045달러)으로 내려갑니다. Google이 권장하는 워크플로우는 먼저 배치 API(50% 할인 적용)로 512px 버전을 여러 장 생성해 구도를 고른 뒤, 선택된 결과물만 1K~4K로 업스케일하는 방식입니다.

종횡비도 확장됐습니다. NB2는 1:8, 1:4 같은 극단적 비율을 지원해 웹 배너나 세로 스크롤 콘텐츠, 프랑코-벨기에 스타일의 만화 레이아웃 같은 용도에 쓸 수 있습니다.

Thinking Mode에 대해서는 기본적으로 꺼두라는 것이 Google의 권고입니다. 일반적인 이미지 생성에서는 시간과 비용만 늘릴 뿐 효과가 미미하다고 합니다. 켜는 게 의미 있는 경우는 세 가지로, 결과가 뒤죽박죽일 때, 복잡한 인포그래픽을 만들 때, 이미지 그라운딩에 공간 추론이 함께 필요할 때입니다.

이미지 생성 모델 경쟁의 새 기준점

이번 가이드가 흥미로운 이유는 단순한 모델 스펙 비교를 넘어, Google이 직접 “어느 경우에 Pro가 필요하고 어느 경우에 필요 없는지”를 공식화했다는 점입니다. 고성능 모델을 무조건 써야 한다는 인식 대신, 비용과 성능의 균형점을 개발자들이 실무에서 판단할 수 있도록 기준을 제시한 셈입니다.

이미지 그라운딩은 특히 실사 기반 콘텐츠에서 AI 이미지 생성의 한계였던 ‘정확한 외관 재현’ 문제를 건드립니다. 텍스트 기반 설명만으로는 특정 건물이나 희귀 종의 생김새를 정확히 반영하기 어려웠는데, 실제 이미지를 참조로 끌어오는 방식은 그 간극을 줄이는 방향입니다. 기술적 세부 사항과 전체 비교 표는 Google 공식 블로그에서 확인할 수 있습니다.

참고자료: Google explains the differences between its three Nano Banana image generation models – The Decoder


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다