AI 에이전트에게 도구를 많이 줄수록 정작 일할 공간이 줄어든다면, 어떻게 해야 할까요?

Cloudflare가 2월 20일 자사 전체 API를 커버하는 새로운 MCP 서버를 공개했습니다. 핵심은 “Code Mode”라는 기법으로, 기존 방식이라면 117만 토큰을 소비할 2,500개 이상의 API 엔드포인트를 단 두 개의 도구와 약 1,000 토큰으로 압축했습니다. 99.9% 절감입니다.
출처: Code Mode: give agents an entire API in 1,000 tokens – Cloudflare Blog
MCP의 구조적 딜레마
MCP(Model Context Protocol)는 AI 에이전트가 외부 도구를 쓸 수 있게 해주는 표준 방식입니다. 그런데 여기엔 태생적인 긴장이 있습니다. 에이전트가 유용하게 일하려면 도구가 많이 필요하지만, 도구를 추가할수록 모델의 컨텍스트 창을 채워버립니다. 정작 실제 작업에 쓸 공간이 줄어드는 거죠.
Cloudflare API만 해도 엔드포인트가 2,500개를 넘습니다. 이를 전통적인 MCP 방식으로 서버에 올리면 117만 토큰이 필요한데, 이는 현존하는 가장 고급 모델의 전체 컨텍스트 창보다 큰 수치입니다.
도구 대신 코드를 “계획서”로
Code Mode의 발상은 단순합니다. 수천 개의 도구를 일일이 정의하는 대신, 에이전트에게 코드를 작성하게 하자는 것입니다.
새 MCP 서버가 노출하는 도구는 딱 두 개입니다. search()와 execute()입니다.
에이전트가 작업을 받으면 먼저 search()를 호출합니다. 전체 OpenAPI 스펙을 컨텍스트에 직접 올리는 게 아니라, 에이전트가 JavaScript 코드를 작성해 스펙을 탐색합니다. 예를 들어 “WAF 관련 엔드포인트만 보여줘”라는 코드를 실행하면 수천 개 중 딱 필요한 10여 개만 돌아옵니다. 전체 스펙은 모델 컨텍스트에 들어오지 않습니다.
필요한 엔드포인트를 파악하면 execute()로 넘어갑니다. 에이전트는 API 호출, 페이지네이션 처리, 응답 확인, 여러 작업 연쇄 실행을 하나의 코드 블록으로 묶어 처리할 수 있습니다. “DDoS 보호 설정해줘” 같은 요청이 단 4번의 도구 호출로 완료됩니다.
두 도구 모두 Cloudflare의 Dynamic Worker 샌드박스 안에서 실행됩니다. 파일시스템 접근도, 환경 변수 노출도 없는 격리된 V8 환경으로, 프롬프트 인젝션 공격 경로를 원천 차단합니다.

다른 접근들과 뭐가 다른가
컨텍스트 문제를 푸는 방법이 Code Mode만 있는 건 아닙니다. Cloudflare는 세 가지를 비교합니다.
클라이언트 측 Code Mode는 에이전트 쪽에 샌드박스 실행 환경이 필요합니다. CLI 기반 접근은 에이전트에게 셸 접근 권한을 줘야 해서 공격 면적이 넓어집니다. Claude Code가 사용하는 동적 도구 검색은 관련 도구를 그때그때 골라 올리지만, 매칭된 도구들이 여전히 토큰을 씁니다.
서버 측 Code Mode의 차별점은 API 크기와 무관하게 토큰 비용이 고정된다는 점입니다. 에이전트 쪽에는 아무 수정도 필요 없고, 탐색과 실행이 모두 서버에서 격리된 채 이뤄집니다.
Skills와는 무엇이 다른가
비슷해 보이는 개념으로 Agent Skills가 있습니다. Skills는 SKILL.md 같은 마크다운 파일로 구성된 에이전트용 참조 문서로, “Wrangler 명령어는 이렇게 쓴다”, “Workers를 배포할 때는 이 절차를 따른다”처럼 에이전트에게 지식을 주입하는 역할입니다. Code Mode가 API를 어떻게 실행할지의 문제라면, Skills는 무엇을 해야 하는지의 문제입니다. 실제로 원문의 DDoS 보호 예시에서도 에이전트는 먼저 Skills나 Docs MCP로 어떤 설정이 필요한지 파악한 뒤, Code Mode로 실제 API를 실행하는 순서로 동작합니다. 지식 레이어와 실행 레이어가 각자 역할을 맡는 구조입니다.
단일 API를 넘어서
Cloudflare는 이 접근을 자사 API 하나에 그치지 않으려 합니다. 개발자 에이전트는 보통 GitHub, 데이터베이스, 내부 문서 서버까지 여러 서비스를 동시에 씁니다. MCP 서버가 하나씩 늘어날수록 컨텍스트 압박은 다시 쌓이죠.
Cloudflare는 여러 MCP 서버를 단일 게이트웨이 뒤에 묶는 “MCP Server Portals”에 Code Mode를 통합하는 작업을 진행 중이라고 밝혔습니다. Code Mode SDK는 오픈소스로 공개되어 있어 다른 서비스도 같은 방식을 적용할 수 있습니다.
참고자료:

답글 남기기