에이전트 4개를 동시에 돌렸더니 오전 11시에 기진맥진했다. 하루 종일 혼자 코딩하던 때보다 더 빨리, 더 많이 지쳐버렸다.

Datasette 창시자이자 25년 경력의 개발자 Simon Willison이 Lenny Rachitsky의 팟캐스트에 출연해 AI 코딩 에이전트 시대의 실제 개발자 경험을 솔직하게 털어놨습니다. 생산성이 극적으로 높아졌는데 왜 개발자는 오히려 더 지쳐가는지, 어떤 역할은 사라지고 어떤 역할은 새로 생겨나는지를 다룬 대화입니다.
출처: Highlights from my conversation about agentic engineering on Lenny’s Podcast – simonwillison.net
변곡점: 2025년 11월에 무슨 일이 있었나
GPT 5.1과 Claude Opus 4.5가 나오기 이전까지, 코딩 에이전트가 만든 코드는 ‘대부분 작동하지만 꼼꼼히 봐야 하는’ 수준이었습니다. 그런데 이 두 모델이 등장하면서 상황이 달라졌습니다. Willison은 이것을 “임계점을 넘었다”고 표현합니다. 시키는 대로 거의 대부분 해내는 수준이 된 것입니다.
그 이후로 그는 하루에 코드 1만 줄을 쏟아낼 수 있게 됐고, 해변을 걷다가 스마트폰으로 코드를 작성하는 게 가능해졌습니다. 예전이라면 2주 걸릴 거라고 판단해 포기했을 작업이 20분 만에 끝나는 일도 생겼습니다. 10년 넘게 쌓아둔 사이드 프로젝트 미완성 목록을 한 달 만에 전부 끝낸 개발자들 이야기도 전했습니다.
그런데 왜 더 피곤한가
역설이 여기에 있습니다. 에이전트가 많은 것을 대신 해줄수록, 개발자의 역할은 ‘만들기’에서 ‘감독하기’로 이동합니다. Willison은 이것이 25년 경력을 통째로 요구하는 작업이라고 말합니다.
에이전트 4개가 병렬로 서로 다른 문제를 풀고 있을 때, 개발자는 각각의 진행 상황을 추적하고, 결과물을 검토하고, 다음 지시를 내려야 합니다. 코드를 직접 짤 때의 집중력과는 다른 종류의 인지 부하가 걸립니다. 마치 혼자 요리하는 대신 4명의 요리사를 동시에 지휘하는 것과 비슷합니다.
여기에 또 다른 문제가 더해집니다. 에이전트는 24시간 멈추지 않고 돌아갈 수 있기 때문에, 밤에 에이전트를 켜두고 잠을 자지 못하는 개발자들이 생겨나고 있다는 겁니다. 그는 이것을 “일종의 도박이나 중독과 비슷한 심리”라고 표현했습니다.
새로운 병목, 새로운 기준
코드를 빠르게 만드는 것이 더 이상 병목이 아니게 되자, 병목은 다른 곳으로 이동했습니다.
테스팅과 검증이 새로운 핵심 과제가 됐습니다. 3주 걸리던 구현이 3시간으로 줄었는데, 그 결과물이 정말 맞는 것인지 확인하는 데는 여전히 시간이 걸립니다. Willison은 하나의 기능을 설계할 때 이제 세 가지 방식으로 프로토타입을 만들어본다고 했습니다. 예전이라면 엄두도 못 낼 일인데, 지금은 시간적으로 가능해졌습니다.
소프트웨어 평가도 어려워졌습니다. AI가 문서화와 테스트까지 갖춘 라이브러리를 한 시간 만에 만들어낼 수 있게 되자, 어떤 프로젝트가 진짜 신뢰할 수 있는지 판단하기가 더 어려워졌습니다. Willison 스스로도 직접 써보지도 못한 라이브러리를 만들어둔 상태라고 고백했습니다. 만드는 것이 써보는 것보다 빨라진 세계입니다.
공수 추정 능력도 사실상 무너졌습니다. 25년의 경험으로 쌓은 “이건 2주짜리 작업”이라는 감각이 더 이상 작동하지 않습니다. 그래서 그는 이제 안 될 것 같아도 일단 에이전트에게 던져본다고 합니다. 가끔은 해내거든요.
반면, 한 가지가 극적으로 좋아졌습니다. 중단 비용입니다. 예전엔 개발자가 2~4시간의 집중 블록을 확보해야 의미 있는 작업이 가능했습니다. 지금은 2분마다 끊겨도 됩니다. 에이전트에게 다음 지시를 내리고 다른 일을 하다 돌아오면 되기 때문입니다.
가장 위험한 건 중간 경력자
ThoughtWorks가 여러 기업의 엔지니어링 VP들을 모아 분석한 결과, 흥미로운 패턴이 나왔습니다. AI 코딩 도구는 시니어 엔지니어에게도, 신입 엔지니어에게도 유리하게 작동합니다. 시니어는 AI의 결과물을 빠르게 판단하는 능력이 있고, 신입은 온보딩 장벽이 낮아집니다. 그런데 그 중간, 슈퍼 시니어까지는 아직 못 됐지만 신입도 아닌 중간 경력자들이 가장 취약한 위치에 놓이게 됐다는 것입니다.
Willison은 이에 대한 해법으로 특정 기술보다 agency(주체성)를 꼽았습니다. AI는 인간의 동기를 가질 수 없기 때문에, 무엇을 왜 만들지를 스스로 결정하는 능력이 대체 불가능한 역량으로 남는다는 이야기입니다.
프로토타이핑은 쓸모없어졌고, 그 자리엔 다른 능력이
한 가지 개인적인 고백이 인상적입니다. Willison은 자신의 25년 커리어 내내 강점이 “빠른 프로토타이핑”이었다고 했습니다. 회의에 들어가서 바로 작동하는 프로토타입을 보여줄 수 있는 사람이 자신이었고, 그게 차별점이었는데, 이제는 누구나 할 수 있게 됐다고요.
그 능력의 가치가 사라진 자리에는 무엇이 올까요? 이 글과 팟캐스트 전반에서 Willison이 반복하는 단어는 하나입니다. 검증. 만들어진 것이 실제로 작동하는지, 믿을 수 있는지를 판단하는 능력.
팟캐스트 원문에는 이외에도 ‘dark factory’ 패턴, 보안 연구에서의 에이전트 활용, prompt injection 리스크 등 다양한 주제가 담겨 있습니다.

답글 남기기