새벽 2시, 한 개발자가 웹훅 통합을 디버깅하다가 이상한 걸 발견했습니다. “독자적 딥러닝 인프라”를 개발했다며 430만 달러를 투자받은 회사가 몇 초마다 OpenAI API를 호출하고 있었던 거죠. 그 순간부터 200개 AI 스타트업을 리버스 엔지니어링하는 프로젝트가 시작됐습니다.

개발자 Teja Kusireddy가 네트워크 트래픽 모니터링, 코드 디컴파일, API 호출 추적으로 200개 펀딩 받은 AI 스타트업을 분석한 결과, 73%가 자체 AI 기술 없이 OpenAI나 Claude API를 래핑한 서비스였다는 사실을 밝혀냈습니다. 그런데 더 흥미로운 건 수요 측면입니다. VentureBeat에 실린 Runway CEO의 글에 따르면, “AI-퍼스트”를 외치는 기업들 대부분이 실제로는 ChatGPT 탭 하나만 열어두고 있다고 하죠.
출처:
- I Reverse-Engineered 200 AI Startups. 73% Are Lying – Towards AI
- How to avoid becoming an “AI-first” company with zero real AI usage – VentureBeat
공급 측면: 스타트업들의 ‘가짜 AI’
Kusireddy는 크롬 개발자 도구로 네트워크 트래픽을 모니터링하고, 웹팩 번들을 디컴파일하고, API 엔드포인트를 추적했습니다. 결과는 충격적이었죠. 200개 중 146개가 OpenAI나 Claude의 API를 그대로 쓰면서 새로운 UI만 입힌 서비스였습니다.
더 놀라운 건 마케팅과 실제의 격차입니다. “우리만의 모델 아키텍처”, “독자적 AI 엔진”, “특허받은 알고리즘” 같은 표현들이 난무하지만, 뚜껑을 열어보면 OpenAI API 호출이 전부였죠. 한 회사는 “on-device processing”을 강조했는데, 실제로는 모든 요청이 Claude API로 향하고 있었습니다.
OpenAI가 압도적으로 많이 쓰였고, Claude는 예상보다 훨씬 많은 곳에서 발견됐습니다. 일부는 두 개를 동시에 쓰면서 “앙상블 모델”이라고 표현하기도 했고요.
수요 측면: 기업들의 ‘가짜 AI 도입’
이제 반대편을 볼까요. Runway의 CEO Siqi Chen은 기업들이 AI를 도입하는 방식에 대해 날카로운 관찰을 내놓습니다.
경쟁사가 “AI로 40% 효율 향상”이라는 보도자료를 내면, 다음 날 아침 긴급 회의가 소집됩니다. CEO는 “AI 전략이 필요하다, 어제부터”라고 말하죠. 그렇게 메시지가 조직 계층을 타고 내려가면서 변질됩니다.
- C레벨: “경쟁력을 위해 AI 전략이 필요하다”
- VP급: “모든 팀이 AI 이니셔티브를 만들어야 한다”
- 매니저급: “금요일까지 계획서가 필요하다”
- 실무자급: “AI처럼 보이는 뭔가를 찾아야 한다”
결국 재무나 운영 담당자에게 물어보면 답은 하나입니다. “솔직히? 그냥 ChatGPT요.” 지난 분기에 도입한 5만 달러짜리 엔터프라이즈 플랫폼도, 이사회 보고서에 나온 값비싼 소프트웨어도 아닙니다. 대학생이 에세이 쓸 때 쓰는 것과 똑같은 브라우저 탭이죠.
진짜 문제는 무엇인가
공급과 수요, 양쪽 모두 극장을 운영하고 있습니다. 스타트업은 “독자적 AI”를 팔고, 기업은 “AI 혁신”을 연기합니다.
API 래핑 자체가 문제는 아닙니다. 좋은 UX와 워크플로우 최적화는 충분히 가치 있는 일이죠. 진짜 문제는 독자적 기술이 있는 척하며 투자를 받는 거짓말입니다. 그리고 기업 측 문제는 더 아이러니합니다. “AI-퍼스트”를 외치지만 정작 실무자들은 ChatGPT 탭 하나로 버티고 있으니까요.
그 사이, 진짜 혁신은 전혀 다른 곳에서 일어납니다. 늦은 밤 혼자 남아 고객 피드백 요약 스크립트를 짜는 직원, 일찍 퇴근하려고 Cursor로 디버깅하는 개발자, 더 자려고 스프레드시트를 자동화하는 매니저. 이들은 “전략적 임팩트”를 목표로 한 게 아닙니다. 그냥 당장의 문제를 해결했을 뿐이죠.
Chen이 발견한 패턴은 명확합니다. 진짜 효과적인 AI 활용은 하향식 명령이 아니라 상향식 필요에서 시작됩니다. 그런데 경영진이 이를 알아차리고 “모든 팀이 AI를 써야 한다”고 의무화하는 순간, 자발성이 사라지고 효과는 떨어지기 시작합니다. 자유롭고 자연스러웠던 실험이 측정 대상이 되는 순간 죽어버리는 거죠.
고객 지원 1차 티켓이나 코드 디버깅처럼 실제로 작동하는 영역은 분명 있습니다. 하지만 AI 기반 영업 운영이나 완전 자동화 예측? 데모는 멋있지만 파일럿이 시작되면 열정이 식습니다.
6개월 후 대시보드는 녹색이고 이사회 자료에는 AI 슬라이드가 가득하겠지만, 실제 업무 현장에서 의미 있게 바뀐 건 뭘까요? 아마 조용히 실험을 멈추지 않았던 사람들만이 진짜 변화를 만들어낼 겁니다.

답글 남기기