지금까지 AI를 쓰는 방식은 챗봇에게 한 걸음씩 지시하고, 결과를 확인하고, 다음 단계를 다시 요청하는 것이었습니다. 이제는 에이전트에게 작업을 통째로 맡기고, 관리자처럼 결과만 검수하는 방식으로 바뀌고 있습니다.

펜실베이니아대 와튼스쿨 교수 Ethan Mollick이 AI 능력이 기하급수적으로 늘어나면서 일하는 방식 자체가 바뀌고 있다는 글을 발표했습니다. OpenAI 내부 연구와 Claude Code 사용자 연구를 근거로 들며, 에이전트를 얼마나 잘 쓰는지를 가르는 건 직군이 아니라 해당 분야에 대한 전문성이라는 점을 짚었습니다.
출처: The twilight of the chatbots – One Useful Thing (Ethan Mollick)
AI가 혼자 처리하는 작업 시간이 계속 늘어난다
METR과 영국 정부 AI Security Institute는 AI가 프롬프트 한 번으로 처리할 수 있는 ‘인간 작업 시간’을 꾸준히 측정해왔습니다. GDPval은 여러 분야 전문가와 AI의 결과물을 사람 심사위원이 비교합니다. 이 지표들이 공통적으로 가리키는 방향은 하나입니다. 증가 속도가 단순 지수함수보다도 빠르다는 것이죠.
Epoch의 실험 하나가 이 변화를 체감하게 해줍니다. Opus 4.7이 14시간 동안 혼자 작업해서 만든 소프트웨어 패키지는, 사람 엔지니어라면 2주에서 17주가 걸릴 분량이었습니다. 들어간 비용은 토큰값 251달러였습니다. Mollick 본인도 Fable로 9시간 동안 자율 작업을 시켜, 팀 단위로 일주일 넘게 걸릴 복잡한 소프트웨어 프로젝트를 완료한 경험을 공유했습니다. 몇 달 전만 해도 프롬프트 한 번에 몇 시간 분량의 일, 그것도 오류가 잦은 결과물을 받는 게 보통이었습니다. 지금은 같은 방식으로 열여섯 시간 이상의 작업 결과를 받을 수 있는 겁니다.
코딩만이 아니라 법무와 인사도 에이전트를 쓴다
OpenAI와 경제학자들이 함께 진행한 연구는 이 흐름이 조직 내부에서 얼마나 빠르게 자리잡고 있는지를 보여줍니다. 눈에 띄는 대목은 에이전트 채택 속도가 개발자에게만 국한되지 않는다는 점입니다. 법무, 인사 같은 비개발 부서도 비슷한 속도로 에이전트를 도입하고 있었습니다. OpenAI 직원 넷 중 한 명은 매주 에이전트 네 개 이상을 동시에 돌리고 있다는 수치도 함께 나왔습니다. 일하는 방식 자체가 ‘AI에게 물어보기’에서 ‘AI를 관리하기’로 옮겨가고 있다는 뜻입니다.
성패를 가르는 건 직군이 아니라 전문성이다
여기서 이 글의 핵심 발견이 나옵니다. Claude Code 사용자를 대상으로 한 별도 연구에 따르면, 소프트웨어 엔지니어와 다른 직군 사용자의 성공률에는 큰 차이가 없었습니다. 대신 결과를 가른 변수는 사용자가 해당 분야에 얼마나 깊은 경험을 갖고 있느냐였습니다. 도메인 전문성이 높을수록 에이전트를 더 성공적으로 활용했고, 프롬프트 하나에서 뽑아내는 결과물의 유용성도 더 높았습니다.
챗봇 시절에는 비전문가가 지식의 빈틈을 메우려고 AI에게 묻는 경우가 많았습니다. 지금은 반대에 가깝습니다. 전문가가 에이전트에게 일을 맡기고, 관리자가 부하 직원의 결과물을 판단하듯 검수하는 쪽이 더 나은 성과를 냅니다.
이 변화는 왜 AI 관련 뉴스가 늘 갑작스러운 도약처럼 느껴지는지도 설명해줍니다. 지수 곡선 위에서는 일정 기간마다 나타나는 변화의 폭이 이전보다 항상 더 큽니다. 그런데 사람은 곡선 안에서 그 변화를 매끄러운 증가가 아니라 연속된 충격으로 경험합니다. 사이버 보안 위협이든 시장을 흔드는 이슈든, 어느 순간까지 괜찮아 보이다가 갑자기 문제가 되는 식으로 나타나는 이유이기도 합니다. 사람과 조직이 움직이는 속도와 능력 곡선이 움직이는 속도가 다르기 때문입니다.
직군이 아니라 전문성이 변수라는 점은, 이 전환이 개발자만의 이야기가 아니라는 걸 보여줍니다. 자기 분야를 깊이 아는 사람일수록 에이전트라는 새 도구 앞에서 유리한 자리에 서게 되는 셈입니다.

답글 남기기