“AI가 내 일자리를 빼앗을까?” 많은 프리랜서와 지식노동자들이 품는 질문입니다. 챗봇이 글을 쓰고, AI가 코드를 짜고, 이미지를 만드는 시대니까요. 그런데 정말 AI가 당신의 일을 처음부터 끝까지 완수할 수 있을까요?

Scale AI와 AI 안전 연구 기관 CAIS가 공동으로 개발한 Remote Labor Index(RLI)가 이 질문에 명확한 답을 내놓았습니다. 소프트웨어 개발, 디자인, 건축, 데이터 분석 등 23개 분야의 실제 프리랜서 프로젝트 240개를 AI 에이전트에게 맡긴 결과, 최고 성능 AI의 성공률은 단 2.5%였습니다.
RLI는 단순히 “AI가 이 작업을 도울 수 있나?”를 묻지 않습니다. “AI가 프리랜서를 완전히 대체해서 프로젝트를 처음부터 끝까지 완수할 수 있나?”를 묻죠. 각 프로젝트는 평균 11.5시간이 소요되고 평균 $200의 가치를 지닌 실제 의뢰입니다. 명확한 요구사항과 납품 기준이 있는 완결된 과제예요.
출처: The Remote Labor Index: Measuring the Automation of Work – Scale AI
충격적인 숫자의 의미
240개 프로젝트에서 인간 프리랜서들은 총 \$143,991을 벌어들였습니다. 반면 최고 성능 AI 에이전트 ‘Manus’는 $1,720만 벌었어요. 97.5%의 프로젝트에서 실패한 겁니다.
왜 이렇게 참담한 결과가 나왔을까요? Scale 연구팀이 수백 건의 실패 사례를 분석한 결과, AI의 실패는 무작위가 아니라 명확한 패턴을 보였습니다.
- 45.6%: 품질 문제 – 클라이언트가 받아들일 수 없는 수준의 결과물
- 35.7%: 불완전한 납품 – 잘린 영상, 누락된 소스 파일, 빈 디렉토리
- 17.6%: 기술적 오류 – 손상되거나 사용 불가능한 파일
- 14.8%: 일관성 부족 – 같은 프로젝트 내 파일들 간 시각적/논리적 일관성 결여
한 프로젝트에서 여러 문제가 동시에 나타나기도 했습니다. 예를 들어 보석 디자인 프로젝트에서 AI는 제공된 반지 이미지의 다이아몬드 컷을 수정하라는 지시를 받았는데, 원본 파일을 무시하고 전혀 새로운 AI 생성 이미지 두 개를 제출했어요. 품질도 아마추어 수준이었고, 요구사항도 무시했으며, 두 반지 이미지조차 서로 일치하지 않았습니다.
AI가 잘하는 것, 못하는 것
그렇다면 성공한 2.5%는 어떤 프로젝트였을까요? 흥미롭게도 성공 사례는 무작위가 아니었습니다. 주로 오디오나 이미지 생성(효과음, 로고 제작), 데이터 분석이나 리포트 작성처럼 “무에서 유를 창조하는” 작업이었어요.
이는 중요한 패턴을 보여줍니다. AI 에이전트는 간단한 프롬프트로부터 무언가를 생성하는 데는 뛰어나지만, 복잡한 편집 작업이나 정밀한 다단계 지시를 따르는 데는 형편없습니다. 생성 능력은 높지만, 꼼꼼하고 신뢰할 수 있는 전문가로서 행동하는 능력은 낮은 거죠.
대체가 아니라 증강
RLI의 발견은 명확합니다. 당장의 광범위한 일자리 자동화는 데이터가 뒷받침하지 않습니다. 97.5%의 실패율은 AI가 아직 복잡한 전문 작업을 자율적으로 수행할 능력이 없다는 걸 보여주죠.
하지만 2.5%의 성공도 중요한 의미가 있습니다. AI가 특정 생성 작업에서는 이미 전문가 수준에 도달했다는 증거니까요. 문제는 복잡한 편집, 도구 사용, 정밀한 다단계 사양을 따르는 능력입니다.
이것이 시사하는 바는 분명합니다. 당장의 영향은 대량 자동화가 아니라 증강입니다. AI는 프리랜서를 대체하는 게 아니라, 특정 작업을 빠르게 처리하는 보조 도구로 먼저 자리잡을 거예요. 로고 초안을 만들거나, 코드 템플릿을 생성하거나, 기초 데이터 분석을 하는 식으로요.
다음 단계의 과제는 명확합니다. 단순한 프롬프트가 아니라 복잡한 프로젝트 실행으로 나아가는 것, 능력과 신뢰성, 그리고 확장성을 동시에 갖추는 것이죠. Remote Labor Index는 이 여정을 측정하고 안내할 경제적 근거를 제공하는 도구가 될 겁니다. 추측이 아닌 데이터로 말이죠.

답글 남기기