AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Sora가 망한 진짜 이유, AI 영상 생성의 수익 불가능 구조

요리 한 접시를 만드는 데 8만 5천 원이 들고, 판매 가격은 2만 7천 원입니다. 식당 앞에 줄이 길게 늘어서 있고, 리뷰는 별 다섯 개입니다. 그런데 손님이 한 명 올 때마다 적자가 쌓입니다. 마케팅 문제도, 셰프 문제도 아닙니다. 이건 산수 문제입니다.

사진 출처: Delanoe Pirard / Substack

AI 연구자 Delanoe Pirard가 OpenAI의 영상 생성 서비스 Sora 종료를 수치로 해부한 분석을 발표했습니다. 지난 3월 24일 OpenAI는 Sora 앱을 6개월 만에 종료한다고 발표했는데, 그 이유가 품질 문제가 아닌 구조적 경제학의 실패였다는 것이 핵심입니다.

출처: I Did the Math on Sora. AI Video Is a Money Furnace. – Delanoe Pirard / Substack

성장할수록 더 빨리 망하는 구조

Sora의 수치는 논쟁의 여지가 없을 만큼 명확합니다. 분석가 Deepak Mathivanan(Cantor Fitzgerald)의 추정에 따르면 Sora의 최대 추론 비용은 하루 $1,500만에 달했습니다. 10초짜리 영상 한 편을 만드는 데 H100 GPU 4대가 40분씩 돌아가며, GPU 비용만 $1.30이 듭니다. 반면 6개월 동안 Sora 앱이 올린 총 매출은 $210만이었습니다. 월이 아니라 전체 기간입니다.

월 $20을 내는 구독자가 영상 50개를 만들면 OpenAI가 부담하는 GPU 비용은 $65입니다. 구독자가 늘수록 손실이 비례해서 커지는 구조입니다. 즉, 성장이 해결책이 아니라 적이었던 셈입니다.

더 근본적인 문제는 이것이 Sora만의 문제가 아니라는 점입니다. AI 영상 생성과 텍스트 생성의 비용 차이는 약 160배인데, 이는 기술적 선택이 아닌 물리적 특성에서 비롯됩니다.

왜 영상이 텍스트보다 160배 비싼가

모델이 10초짜리 720p 영상을 볼 때, “영상”으로 인식하는 게 아닙니다. 시간과 공간에 걸쳐 분산된 약 8만 개의 픽셀 패치로 인식합니다. 일반적인 ChatGPT 대화가 수백 토큰인 것과 비교됩니다. 그리고 이 패치들 사이의 관계를 계산하는 데 필요한 연산량은 패치 수의 제곱에 비례합니다. 해상도를 두 배 높이면 비용은 네 배가 됩니다.

거기에 더해, 모델은 영상을 한 번에 만들지 않습니다. TV 화면 잡음 같은 노이즈에서 시작해 20~50번의 정제 과정을 거치며 전체 프레임을 동시에 처리합니다. 움직임과 조명이 모든 프레임에서 일관되게 유지되도록 하기 위해서입니다. 이 어텐션(Attention) 연산만으로도 추론 시간의 85% 이상이 소모됩니다.

비교가 되는 건 이미지 생성입니다. Midjourney는 창업 첫 달부터 흑자였고, 직원 40명으로 2025년 기준 연매출 $5억에 달합니다. 이미지 한 장의 생성 비용은 $0.03~0.05로, 월정액 구독 모델에 충분히 흡수됩니다. 영상은 이미지보다 20~40배 비싸면서, 사용자가 체감하는 가치는 그에 비례하지 않습니다.

1% 리텐션과 Disney 딜의 파국

제품 측면에서도 문제가 겹쳤습니다. a16z의 Olivia Moore가 공개한 데이터에 따르면 Sora의 30일 리텐션은 약 1%였습니다. TikTok의 32%와 대비됩니다. OpenAI는 TikTok식 세로 스크롤 피드를 만들어 재방문을 유도하려 했지만, 피드는 “AI 마법이 아닌 AI 쓰레기”(TechCrunch)로 묘사됐습니다. 사람들은 영상 몇 개를 만들고, 공유하고, 돌아오지 않았습니다. 아이러니하게도, 만약 사용자가 계속 돌아왔다면 OpenAI는 더 빠르게 파산했을 겁니다.

12월에 체결된 Disney와의 10억 달러 계약도 결말이 황당합니다. Marvel, Pixar, Star Wars 등 200개 이상의 IP 라이선스를 포함한 대형 계약이었지만, WSJ 보도에 따르면 돈은 한 번도 이체되지 않았고 계약은 끝내 완결되지 않았습니다. Disney 기술팀이 서비스 종료 사실을 안 건 공개 발표 1시간도 채 안 됐을 때였습니다.

IPO를 위한 정리, 그리고 남겨진 질문

OpenAI가 Sora 종료를 발표한 같은 날, 총 $1,220억 규모의 투자 유치도 발표했습니다. 기업 가치는 $8,520억. CFO Sarah Friar의 말이 솔직합니다: “컴퓨팅이 부족합니다. 정말 어려운 결정을 내려야 합니다.” Sora가 쓰던 GPU는 곧 출시될 코딩·에이전트 특화 모델 ‘Spud’로 재배치됐습니다.

경쟁사 사정도 다르지 않습니다. Runway는 2024년 EBITDA 기준 -$1억 5,500만 적자, Pika는 $760만 매출에 $8,000만 투자 유치. 유일하게 연 $2억 4,000만 ARR을 기록한 Kling AI조차 수익성 데이터를 공개하지 않고 있습니다. AI 영상 생성 분야에서 순이익을 낸 회사는 아직 단 한 곳도 없습니다.

현재 10초 영상 생성 비용 $1.30을 소비자 가격에 맞추려면 100~300배 절감이 필요합니다. NVIDIA의 Rubin 아키텍처 GPU와 새로운 알고리즘 개선이 결합되면 2027년 말쯤 클립당 $0.01 수준이 가능할 수 있다고 분석은 전망합니다. 하지만 그건 최소 18개월 후의 이야기이고, 일정대로 진행된다는 보장도 없습니다.

원문은 각 경쟁사의 재무 데이터 비교, 비용 절감 기술 상세, OpenAI 내부 의사결정 경위 등을 추가로 다룹니다.

참고자료:

Fediverse reactions

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다