텍스트를 이미지로 바꾸는 데 4초, 비용은 장당 0.034달러. 구글이 이번 주 공개한 나노바나나 2 라이트는 속도와 가격에서 기존 이미지 생성 모델들과 확실히 다른 자리를 노리고 있습니다.

구글 딥마인드가 나노바나나 2 라이트(Gemini 3.1 Flash Lite Image)와 제미나이 옴니 플래시(Gemini Omni Flash)를 개발자용 API로 공개했습니다. 나노바나나 2 라이트는 기존 나노바나나 2보다 훨씬 빠르고 저렴한 이미지 생성 모델이고, 옴니 플래시는 텍스트·이미지·영상을 섞어 대화형으로 영상을 편집하는 모델입니다. 두 모델을 이어 붙이면 이미지 생성부터 영상 제작까지 한 번에 이어갈 수 있다는 점이 이번 발표의 핵심입니다.
출처: Start building with Nano Banana 2 Lite and Gemini Omni Flash – Google Blog
속도와 비용에 올인한 이미지 모델
나노바나나 2 라이트는 나노바나나 패밀리에서 가장 가벼운 모델입니다. 일반 나노바나나 2가 이미지 한 장을 만드는 데 약 20초 걸리는 반면, 라이트 버전은 기본 저사고(low-thinking) 모드에서 4초면 끝납니다. 가격도 1K 해상도 이미지 기준 장당 0.034달러로, 나노바나나 2(0.067달러)의 절반, 나노바나나 프로(0.134달러)의 4분의 1 수준입니다.
구글은 이 모델을 대량으로 이미지를 뽑아내야 하는 개발자 파이프라인, 즉 빠른 아이디어 검증이나 실시간에 가까운 프로토타이핑에 맞춰 설계했다고 설명합니다. 기존 첫 세대 나노바나나(Gemini 2.5 Flash Image)를 쓰던 개발자에게는 이 라이트 버전이 사실상 대체재로 제시됩니다.
빠른 대신 포기한 것들
속도를 얻은 자리에는 품질 손실이 있습니다. 구글 스스로도 나노바나나 2 라이트가 작은 글씨 렌더링에서 실수가 잦고, 인포그래픽처럼 정확한 데이터를 담아야 하는 이미지에서는 오류가 나올 수 있다고 인정했습니다. 여러 장을 이어서 생성할 때 인물이나 캐릭터의 생김새가 조금씩 달라지는 일관성 문제도 남아 있습니다.
Arena.ai의 사용자 평가(Elo 점수)에서는 라이트 버전이 일반 나노바나나 2와 거의 비슷한 점수를 받았지만, 이런 사용자 선호도 평가는 이미지를 자세히 뜯어봤을 때 드러나는 디테일까지 잡아내지는 못합니다. 결국 나노바나나 2 라이트는 “빠르게 여러 번 시도해보고 괜찮은 결과가 나오면 채택하는” 워크플로우에 맞는 모델이지, 한 장의 완성도가 중요한 작업에는 여전히 나노바나나 2나 프로 버전이 낫다는 뜻입니다.
이미지에서 영상으로, 옴니 플래시가 잇는 자리
제미나이 옴니 플래시는 지난 5월 구글 I/O에서 처음 공개됐던 모델로, 이번에 API와 AI 스튜디오를 통해 처음 개발자에게 개방됐습니다. 텍스트 프롬프트로 영상을 만들거나 기존 영상을 대화하듯 수정할 수 있고, 이미지·텍스트·영상을 함께 입력해 장면의 일관성을 유지하는 것이 특징입니다. 가격은 초당 0.10달러로, 구글의 기존 영상 모델 베오 3.1 패스트와 같습니다.
구글이 제시하는 조합은 이렇습니다. 나노바나나 2 라이트로 빠르게 이미지를 여러 장 뽑고, 그중 마음에 드는 이미지를 옴니 플래시에 레퍼런스로 넘겨 영상으로 살려내는 방식입니다. Interactions API를 쓰면 세션 맥락이 유지돼 최대 세 번까지 연속으로 수정을 이어갈 수 있습니다. 다만 옴니 플래시는 아직 10초짜리 영상만 만들 수 있고, 오디오 레퍼런스 업로드나 장면 확장 기능은 지원하지 않습니다.
실제로 써본 개발자들의 반응도 나쁘지 않습니다. 프로그래머 사이먼 윌리슨은 “월리를 찾아라” 스타일로 무전기를 든 너구리를 숨겨놓은 이미지를 나노바나나 2 라이트로 생성해봤는데, 지난 4월 다른 나노바나나 모델로 같은 프롬프트를 시도했을 때보다 결과물이 마음에 들었다고 전했습니다. 다만 이미지 속 텍스트 철자는 두 군데나 틀렸다고 덧붙였습니다.
참고자료:

답글 남기기