“AI가 일자리를 빼앗는다”는 주장이 넘쳐납니다. 그런데 그 근거가 되는 수치들이 실제로 어떻게 만들어졌는지 아는 사람은 많지 않죠. 최근 온라인에 떠도는 한 그래프가 그 질문을 정면으로 건드렸습니다.

Anthropic이 2026년 3월 발표한 노동시장 영향 보고서에 담긴 이 차트는 22개 직업군에 걸쳐 LLM의 “이론적 역량(파란 영역)”이 얼마나 넓은지를 보여줍니다. 예술·미디어, 사무관리, 법률·금융, 심지어 경영직까지, 직업별 세부 업무의 80% 이상을 AI가 이론적으로 처리할 수 있다는 인상을 줍니다. 그런데 그 파란 영역의 출처를 파고들면, 이야기가 달라집니다.
출처: Labor market impacts of AI: A new measure and early evidence – Anthropic
“이론적 역량”의 실제 출처
파란 영역의 수치는 Anthropic이 직접 측정한 것이 아닙니다. 2023년 8월 OpenAI, OpenResearch, 펜실베이니아대 연구진이 공동 발표한 논문 “GPTs are GPTs”에서 가져온 것입니다.
연구팀은 O*NET 직업 데이터베이스에서 800여 개 직종의 세부 업무를 뽑아낸 뒤, GPT-4가 해당 업무를 50% 이상 빠르게 처리할 수 있는지 평가했습니다. 직접 평가한 사람은 그 업무를 실제로 하는 사람들이 아니라, AI 기술에 익숙한 전문가들이었습니다. 연구팀 스스로도 “평가자 대부분이 평가 대상 직종에 대해 잘 모르는 상태였다”고 인정했고, 이를 “방법론의 근본적 한계”라고 표현했습니다.
더 결정적인 것은 “anticipated LLM-powered software(예상되는 LLM 기반 소프트웨어)”라는 개념입니다. 당시 GPT-4만으로는 전체 업무의 약 15%만 50% 이상 효율화 가능했는데, 미래에 개발될 LLM 기반 도구를 함께 가정했을 때 그 수치가 47~56%까지 올라갔습니다. 파란 영역이 그토록 넓어 보이는 이유입니다. 연구팀은 이 미래 소프트웨어의 개발 시점에 대해 아무런 기간도 설정하지 않았습니다.
2023년은 AI 과대기대가 정점에 달했던 시기이기도 합니다. GPT-4가 막 출시됐고, AI로 인한 “문명 통제 상실”을 우려하는 목소리가 쏟아지던 때였습니다. 그런 분위기 속에서 AI 전문가들에게 미래 소프트웨어의 잠재력을 추정하게 한 셈입니다. Ars Technica는 이 점을 짚으며 파란 영역이 “오래된, 그리고 상당히 투기적인 추측”에 가깝다고 평가했습니다.
Anthropic이 새로 제안한 지표: “관찰된 노출도”
Anthropic의 보고서에서 더 주목할 부분은 비판의 대상이 된 파란 영역보다, 그 한계를 인정하며 내놓은 새 지표입니다. 바로 “observed exposure(관찰된 노출도)”입니다.
이론적 역량만으로는 실제 노동시장 변화를 예측하기 어렵다는 문제의식에서 출발했습니다. Anthropic은 세 가지 데이터를 결합했습니다.
- O*NET 직업 데이터베이스의 세부 업무 목록
- Anthropic 자체 Claude 사용 데이터(실제로 어떤 업무에 AI가 쓰이는지)
- Eloundou et al.의 이론적 역량 추정치
단순히 “AI가 이 업무를 할 수 있는가”에 그치지 않고, 실제로 업무 환경에서 AI가 쓰이고 있는지, 그것이 보조 용도인지 자동화 용도인지까지 반영합니다. 자동화 비중이 높은 직종일수록 더 높은 노출도를 부여합니다.
결과를 보면, 차트의 빨간 영역(실제 노출도)은 파란 영역(이론적 역량)보다 훨씬 좁습니다. 예를 들어 컴퓨터·수학 직군은 이론적으로는 업무의 94%가 LLM 적용 가능하지만, 실제 관찰된 노출도는 33%에 그칩니다. 가장 노출도가 높은 직종은 컴퓨터 프로그래머(75%), 고객 서비스 담당자, 데이터 입력 직종 순이었습니다.
지금까지 실업률엔 영향 없지만, 청년 채용엔 신호가
현재 데이터로 보면 AI 노출도가 높은 직종의 실업률은 낮은 직종과 별다른 차이가 없습니다. 그러나 22~25세 청년층에서는 다른 신호가 나타납니다. ChatGPT 출시 이후 고노출 직종으로의 신규 채용이 이전 대비 약 14% 감소했습니다(통계적으로 유의미한 수준). 실업률 증가가 아닌 “채용 둔화”의 형태로 나타나고 있다는 점이 특징입니다.
Anthropic은 AI의 노동시장 영향이 과거 인터넷이나 중국 제조업 충격처럼 느리게, 그리고 다른 경제 변수들과 뒤섞여 나타날 수 있다고 봅니다. 지금 당장 통계에 잡히지 않는다고 해서 영향이 없다고 결론 내리기는 이르다는 뜻입니다.
측정 자체가 어렵다는 것, 그리고 지금 쓰는 숫자가 어디서 왔는지 아는 것—이 두 가지가 AI와 일자리를 둘러싼 논의에서 먼저 챙겨야 할 감각인지도 모릅니다. 보고서 전문과 함께 부록의 수식 및 7개 벤치마크 분석도 원문에서 확인할 수 있습니다.
참고자료: How did Anthropic measure AI’s “theoretical capabilities” in the job market? – Ars Technica

답글 남기기