
에이전트를 더 많이 띄우면 더 많은 일이 된다고 생각하지만, 그건 컴퓨터 얘기입니다. 인간은 다릅니다. 에이전트가 일하는 동안 사람의 머릿속은 쉬지 않습니다.
구글 엔지니어 Addy Osmani가 자신의 블로그에 병렬 AI 에이전트를 운영할 때 인간에게 발생하는 인지 부하를 분석한 글을 발표했습니다. 에이전트를 많이 실행할수록 생산성이 비례해서 늘지 않는 이유, 그리고 그 병목이 어디에 있는지를 다룹니다.
출처: Your parallel Agent limit – Addy Osmani
에이전트를 4개 켜면 무슨 일이 일어나는가
에이전트 하나와 작업할 때는 인지 부담이 비교적 깔끔합니다. 하나의 컨텍스트, 하나의 판단 흐름. 집중해서 흐름을 따라갈 수 있죠.
동시에 네 개를 실행하면 질적으로 다른 상황이 됩니다. 네 개의 코드베이스, 네 개의 문제 설정, 네 개의 신뢰 캘리브레이션을 머릿속에 동시에 유지해야 합니다.
Osmani가 가장 과소평가되는 부담으로 꼽는 것은 배경 불안(ambient anxiety tax)입니다. 20분째 확인 못 한 스레드에서 무언가 조용히 잘못되고 있을지도 모른다는 감각. 그게 태스크 목록에는 안 보이지만 집중력 저수지에서는 계속 뭔가를 끌어가고 있다는 겁니다.
인지 부하가 실제로 발생하는 세 지점
컨텍스트 전환 비용. 에이전트 사이를 오갈 때마다 멘털 모델을 재로드해야 합니다. “30분 전에 내가 어떤 결정을 내렸더라?” 심리학 연구들은 일관되게 전환 비용이 전환 자체가 아닌 회복 시간에서 발생한다고 말합니다. 네 개의 스레드를 오가면 회복이 완료되기 전에 또 전환이 일어납니다.
판단 요구의 연속성. 에이전트가 뒤에서 일하는 동안 내 여유가 생기리라 기대하지만, 실제로는 판단을 요구하는 순간들이 끊임없이 밀려옵니다. 이 접근 방식이 아키텍처 원칙과 맞는가? 이 에러는 방향을 바꿔야 한다는 신호인가? 이런 결정들은 이메일처럼 쌓아뒀다 한꺼번에 처리할 수 없습니다.
신뢰 캘리브레이션 오버헤드. 각 에이전트 세션에는 암묵적인 신뢰도 눈금이 있습니다. 초반엔 촘촘히 감시하다가, 잘 진행되면 고삐를 늘립니다. 그 눈금을 스레드마다 따로 유지해야 하고, 확인을 못 하면 신뢰도가 어느 지점에 있는지 잃어버립니다. 그 순간 결국 처음부터 다시 읽게 됩니다.
4개 돌리면 4배 빠른 게 아닌 이유
“에이전트 하나가 기능 하나를 40분에 완성한다. 넷이면 같은 시간에 네 개 완성이다.” 이 계산은 처리량에는 맞지만 인간에겐 틀립니다.
에이전트가 생성하는 동안, 사람은 여전히 평가·결정·신뢰·통합을 모두 혼자 합니다. 이 과정은 단일 스레드입니다. 늘어나는 건 감독의 처리량이지 이해의 처리량이 아닙니다. 이해 없이 감독만 하는 것이 Osmani가 ‘이해 부채(comprehension debt)’라 부른 상태입니다. 코드는 나왔지만 내가 무엇을 만들었는지에 대한 멘털 모델은 스레드가 늘수록 더 빠르게 뒤처집니다.
개인 한계를 파악하는 것 자체가 기술이다
대부분은 한계를 넘어선 뒤에야 알게 됩니다. 에이전트 두 개로 잘 시작해서 세 개, 네 개로 늘리다가 정오쯤 되면 결과물을 제대로 검토하지 않고 그냥 수락하고 있습니다. 생산적이라고 느끼지만 실제로는 아닌 상태입니다.
한계는 고정된 숫자가 아닙니다. 스레드의 복잡도, 사전 작업 명세의 완성도, 세션 길이, 그날의 컨디션에 따라 달라집니다. 새로운 아키텍처 문제 두 개는 단순한 마이그레이션 네 개보다 훨씬 빨리 지칩니다.
에이전트 AI 담론에서 빠진 절반
에이전트 코딩 도구를 둘러싼 대화는 거의 전부 에이전트가 무엇을 할 수 있는지에 집중되어 있습니다. 인간이 무엇을 감당할 수 있는지는 거의 다뤄지지 않죠.
Osmani의 핵심 주장은 이겁니다. 장기적으로 병렬 에이전트에서 가장 많은 것을 얻는 엔지니어는 동시에 가장 많이 실행하는 사람이 아닐 겁니다. 처리량과 이해 사이의 차이를 알고, 그 차이를 극복해야 할 약점이 아니라 설계해야 할 제약으로 다루는 사람이 될 겁니다.
원문에는 Osmani가 실제로 자신의 세션 운영 방식을 어떻게 바꿨는지, 그리고 한계를 의도적으로 파악하는 방법도 구체적으로 담겨 있습니다.

답글 남기기