요리 한 접시를 만드는 데 8만 5천 원이 들고, 판매 가격은 2만 7천 원입니다. 식당 앞에 줄이 길게 늘어서 있고, 리뷰는 별 다섯 개입니다. 그런데 손님이 한 명 올 때마다 적자가 쌓입니다. 마케팅 문제도, 셰프 문제도 아닙니다. 이건 산수 문제입니다.

AI 연구자 Delanoe Pirard가 OpenAI의 영상 생성 서비스 Sora 종료를 수치로 해부한 분석을 발표했습니다. 지난 3월 24일 OpenAI는 Sora 앱을 6개월 만에 종료한다고 발표했는데, 그 이유가 품질 문제가 아닌 구조적 경제학의 실패였다는 것이 핵심입니다.
출처: I Did the Math on Sora. AI Video Is a Money Furnace. – Delanoe Pirard / Substack
성장할수록 더 빨리 망하는 구조
Sora의 수치는 논쟁의 여지가 없을 만큼 명확합니다. 분석가 Deepak Mathivanan(Cantor Fitzgerald)의 추정에 따르면 Sora의 최대 추론 비용은 하루 $1,500만에 달했습니다. 10초짜리 영상 한 편을 만드는 데 H100 GPU 4대가 40분씩 돌아가며, GPU 비용만 $1.30이 듭니다. 반면 6개월 동안 Sora 앱이 올린 총 매출은 $210만이었습니다. 월이 아니라 전체 기간입니다.
월 $20을 내는 구독자가 영상 50개를 만들면 OpenAI가 부담하는 GPU 비용은 $65입니다. 구독자가 늘수록 손실이 비례해서 커지는 구조입니다. 즉, 성장이 해결책이 아니라 적이었던 셈입니다.
더 근본적인 문제는 이것이 Sora만의 문제가 아니라는 점입니다. AI 영상 생성과 텍스트 생성의 비용 차이는 약 160배인데, 이는 기술적 선택이 아닌 물리적 특성에서 비롯됩니다.
왜 영상이 텍스트보다 160배 비싼가
모델이 10초짜리 720p 영상을 볼 때, “영상”으로 인식하는 게 아닙니다. 시간과 공간에 걸쳐 분산된 약 8만 개의 픽셀 패치로 인식합니다. 일반적인 ChatGPT 대화가 수백 토큰인 것과 비교됩니다. 그리고 이 패치들 사이의 관계를 계산하는 데 필요한 연산량은 패치 수의 제곱에 비례합니다. 해상도를 두 배 높이면 비용은 네 배가 됩니다.
거기에 더해, 모델은 영상을 한 번에 만들지 않습니다. TV 화면 잡음 같은 노이즈에서 시작해 20~50번의 정제 과정을 거치며 전체 프레임을 동시에 처리합니다. 움직임과 조명이 모든 프레임에서 일관되게 유지되도록 하기 위해서입니다. 이 어텐션(Attention) 연산만으로도 추론 시간의 85% 이상이 소모됩니다.
비교가 되는 건 이미지 생성입니다. Midjourney는 창업 첫 달부터 흑자였고, 직원 40명으로 2025년 기준 연매출 $5억에 달합니다. 이미지 한 장의 생성 비용은 $0.03~0.05로, 월정액 구독 모델에 충분히 흡수됩니다. 영상은 이미지보다 20~40배 비싸면서, 사용자가 체감하는 가치는 그에 비례하지 않습니다.
1% 리텐션과 Disney 딜의 파국
제품 측면에서도 문제가 겹쳤습니다. a16z의 Olivia Moore가 공개한 데이터에 따르면 Sora의 30일 리텐션은 약 1%였습니다. TikTok의 32%와 대비됩니다. OpenAI는 TikTok식 세로 스크롤 피드를 만들어 재방문을 유도하려 했지만, 피드는 “AI 마법이 아닌 AI 쓰레기”(TechCrunch)로 묘사됐습니다. 사람들은 영상 몇 개를 만들고, 공유하고, 돌아오지 않았습니다. 아이러니하게도, 만약 사용자가 계속 돌아왔다면 OpenAI는 더 빠르게 파산했을 겁니다.
12월에 체결된 Disney와의 10억 달러 계약도 결말이 황당합니다. Marvel, Pixar, Star Wars 등 200개 이상의 IP 라이선스를 포함한 대형 계약이었지만, WSJ 보도에 따르면 돈은 한 번도 이체되지 않았고 계약은 끝내 완결되지 않았습니다. Disney 기술팀이 서비스 종료 사실을 안 건 공개 발표 1시간도 채 안 됐을 때였습니다.
IPO를 위한 정리, 그리고 남겨진 질문
OpenAI가 Sora 종료를 발표한 같은 날, 총 $1,220억 규모의 투자 유치도 발표했습니다. 기업 가치는 $8,520억. CFO Sarah Friar의 말이 솔직합니다: “컴퓨팅이 부족합니다. 정말 어려운 결정을 내려야 합니다.” Sora가 쓰던 GPU는 곧 출시될 코딩·에이전트 특화 모델 ‘Spud’로 재배치됐습니다.
경쟁사 사정도 다르지 않습니다. Runway는 2024년 EBITDA 기준 -$1억 5,500만 적자, Pika는 $760만 매출에 $8,000만 투자 유치. 유일하게 연 $2억 4,000만 ARR을 기록한 Kling AI조차 수익성 데이터를 공개하지 않고 있습니다. AI 영상 생성 분야에서 순이익을 낸 회사는 아직 단 한 곳도 없습니다.
현재 10초 영상 생성 비용 $1.30을 소비자 가격에 맞추려면 100~300배 절감이 필요합니다. NVIDIA의 Rubin 아키텍처 GPU와 새로운 알고리즘 개선이 결합되면 2027년 말쯤 클립당 $0.01 수준이 가능할 수 있다고 분석은 전망합니다. 하지만 그건 최소 18개월 후의 이야기이고, 일정대로 진행된다는 보장도 없습니다.
원문은 각 경쟁사의 재무 데이터 비교, 비용 절감 기술 상세, OpenAI 내부 의사결정 경위 등을 추가로 다룹니다.
참고자료:

답글 남기기