AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

Wan 2.2로 이미지를 동영상으로 변환하기: 개인용 AI 비디오 생성의 새로운 가능성

개인 PC에서 정지 이미지를 고품질 동영상으로 변환할 수 있는 Wan 2.2 AI 모델이 출시되었습니다. 14B와 5B 두 가지 버전으로 제공되어 다양한 하드웨어 환경에서 활용 가능하며, 최신 업데이트로 메모리 효율성까지 개선되었습니다.

Wan 2.2로 생성된 동영상 예시
Wan 2.2를 사용한 이미지-투-비디오 변환 예시 (출처: Stable Diffusion Art)

Wan 2.2의 핵심 특징

알리바바 DAMO Academy에서 개발한 Wan 2.2는 이전 버전 대비 상당한 성능 향상을 이뤘습니다. 가장 눈에 띄는 변화는 네이티브 1080p 해상도 지원과 향상된 모션 제어 기능입니다.

주요 개선사항:

  • 고해상도 출력: 1080p 네이티브 렌더링으로 시네마급 품질 구현
  • 모션 제어: VACE 2.0 엔진을 통한 정밀한 카메라 움직임 제어
  • Mixture of Experts 아키텍처: 노이즈 레벨별 전문 모델로 더욱 선명한 영상 생성
  • 오픈소스 라이선스: Apache 2.0 라이선스로 상업적 이용 가능

이전 모델들이 주로 720p 출력에 머물렀던 것과 비교하면, Wan 2.2는 개인 사용자도 프로페셔널급 비디오 콘텐츠를 제작할 수 있는 기반을 마련했습니다.

하드웨어 사양별 모델 선택 가이드

Wan 2.2는 사용자의 하드웨어 환경에 맞춰 두 가지 버전을 제공합니다.

14B 모델 (고품질 버전)

  • VRAM 요구사항: 20GB
  • 생성 시간: RTX 4090 기준 약 1시간 20분
  • 권장 용도: 최고 품질이 필요한 전문 작업

5B 모델 (효율성 버전)

  • VRAM 요구사항: 8GB
  • 생성 시간: RTX 4090 기준 약 6분
  • 권장 용도: 빠른 프로토타이핑 및 일반적인 콘텐츠 제작

대부분의 개인 사용자에게는 5B 모델이 더 실용적인 선택입니다. 8GB VRAM은 RTX 3070Ti, RTX 4060Ti 급 그래픽카드로도 충분히 구동 가능한 수준입니다.

ComfyUI Manager 업데이트 인터페이스
ComfyUI Manager를 통한 업데이트 과정 (출처: Stable Diffusion Art)

ComfyUI를 통한 설치 및 설정

Wan 2.2를 활용하기 위해서는 ComfyUI 환경이 필요합니다. 설치 과정은 다음과 같습니다.

1단계: ComfyUI 업데이트
ComfyUI Manager를 통해 최신 버전으로 업데이트합니다. 상단 툴바의 Manager 버튼을 클릭하고 ‘Update ComfyUI’를 선택한 후 재시작하면 됩니다.

2단계: 워크플로우 다운로드
사용하려는 모델 버전에 맞는 워크플로우 JSON 파일을 다운로드합니다. ComfyUI는 워크플로우를 로드할 때 필요한 모델 파일들을 자동으로 안내해줍니다.

3단계: 모델 파일 설치
14B 모델의 경우 다음 파일들이 필요합니다:

  • wan2.2_i2v_high_noise_14B_fp8_scaled.safetensors
  • wan2.2_i2v_low_noise_14B_fp8_scaled.safetensors
  • umt5_xxl_fp8_e4m3fn_scaled.safetensors
  • wan_2.1_vae.safetensors

5B 모델은 더 간단한 구성으로 wan2.2_ti2v_5B_fp16.safetensors 등 3개 파일만 필요합니다.

4단계: 이미지 업로드 및 프롬프트 작성
시작 프레임으로 사용할 이미지를 업로드하고, 원하는 비디오의 움직임과 내용을 텍스트로 기술합니다. 특히 카메라 움직임 키워드(zoom out, pan right 등)를 활용하면 더 역동적인 영상을 만들 수 있습니다.

카메라 움직임 제어 성능 분석

Wan 2.2의 주요 개선점 중 하나는 카메라 움직임 제어 기능입니다. 실제 테스트 결과를 살펴보면 다음과 같습니다.

줌 기능 성능:
‘Zoom out’ 명령은 비교적 안정적으로 작동하며 자연스러운 줌아웃 효과를 구현합니다. 다만 ‘Zoom in’의 경우 때때로 반대 방향으로 동작하는 경우가 있어 여러 번 생성 후 최적의 결과를 선택하는 것이 권장됩니다.

팬 기능 성능:
‘Pan right’ 명령은 예상대로 잘 작동하지만, ‘Pan left’는 여전히 우측으로 패닝되는 경우가 많습니다. 이는 모델이 초기 이미지의 자연스러운 흐름을 프롬프트보다 우선시하는 경향 때문으로 보입니다.

이러한 한계에도 불구하고, 기존 비디오 생성 모델 대비 카메라 제어 정확도는 상당히 개선된 상태입니다.

Wan 2.2 AI 비디오 생성 예시 (출처: ComfyUI Blog)

최신 메모리 최적화 업데이트

2025년 7월, ComfyUI팀은 Wan 2.2의 메모리 효율성을 크게 개선한 업데이트를 발표했습니다.

주요 개선사항:

  • VAE 디코딩 과정에서 약 10% VRAM 절약
  • 5B 이미지-투-비디오 모델의 대폭적인 성능 개선
  • 14B 모델용 새로운 템플릿 워크플로우 제공

이 업데이트로 인해 기존에 VRAM 부족으로 어려움을 겪던 사용자들도 더 원활하게 Wan 2.2를 활용할 수 있게 되었습니다. 특히 8GB VRAM 환경에서 5B 모델을 사용하는 경우 안정성이 크게 향상되었습니다.

실제 활용 시나리오

Wan 2.2는 다양한 창작 영역에서 활용 가능합니다.

콘텐츠 크리에이터:
YouTube 썸네일이나 소셜미디어용 짧은 영상 제작에 활용할 수 있습니다. 정적인 이미지에 생동감을 더해 시청자의 관심을 끌 수 있습니다.

마케팅 및 광고:
제품 이미지를 동적인 광고 영상으로 변환하여 더 매력적인 마케팅 자료를 제작할 수 있습니다.

교육 및 프레젠테이션:
정적인 도표나 이미지에 움직임을 추가해 더 효과적인 교육 자료를 만들 수 있습니다.

예술 및 창작:
아티스트들은 자신의 작품에 새로운 차원을 추가하여 독특한 디지털 아트를 창조할 수 있습니다.

기존 솔루션과의 차별점

현재 시장에는 Runway ML, Pika Labs 같은 클라우드 기반 AI 비디오 생성 서비스들이 있지만, Wan 2.2는 몇 가지 중요한 차별점을 가집니다.

가장 큰 장점은 완전한 로컬 실행이 가능하다는 점입니다. 이는 데이터 프라이버시를 중시하는 사용자들에게 매우 중요한 요소입니다. 또한 사용량 제한이나 월 구독료 없이 무제한으로 이용할 수 있어 장기적으로 비용 효율적입니다.

오픈소스 특성상 커뮤니티의 지속적인 개선과 확장이 가능하며, 상업적 이용도 자유롭다는 점도 큰 메리트입니다.

Wan 2.2는 AI 비디오 생성 기술의 민주화를 이끌고 있습니다. 고가의 클라우드 서비스에 의존하지 않고도 개인 PC에서 고품질 비디오를 생성할 수 있게 된 것은 창작자들에게 새로운 가능성을 열어주고 있습니다. 메모리 최적화 업데이트와 함께 더욱 접근하기 쉬워진 Wan 2.2를 통해 누구나 쉽게 AI 비디오 창작에 도전해볼 수 있습니다.


참고자료:


AI Sparkup 구독하기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Comments