AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI 에이전트 MCP 토큰 비용 94% 줄이는 CLI 전환 방법

AI 에이전트를 운영하다 보면 API 비용이 예상보다 높게 나오는 경우가 있습니다. 실제 작업에 쓰인 토큰보다 훨씬 많이 청구될 때, 범인은 도구 호출 자체가 아닐 수 있습니다.

사진 출처: kanyilmaz.me

개발자 Kan Yilmaz가 MCP(Model Context Protocol)와 CLI(Command Line Interface) 방식의 토큰 사용량을 직접 측정해 비교한 결과를 공개했습니다. 6개 MCP 서버, 총 84개 도구를 기준으로 했을 때, CLI 방식이 MCP 대비 토큰을 약 94% 덜 사용한다는 수치가 나왔습니다.

출처: I Made MCP 94% Cheaper (And It Only Took One Command) – kanyilmaz.me

MCP의 숨겨진 비용 구조

MCP를 사용하는 AI 에이전트는 세션이 시작되는 순간, 연결된 모든 서버의 도구 스키마를 한꺼번에 컨텍스트에 로드합니다. 각 도구의 이름, 설명, 파라미터 타입, 옵션값까지 JSON Schema 형태로 전부 밀어 넣는 방식입니다.

도구 하나당 약 185토큰, 84개 도구 기준으로는 세션 시작만으로 약 15,540토큰이 소비됩니다. 에이전트가 실제로 그 도구들을 쓰든 쓰지 않든, 매 세션마다 이 비용은 고정으로 발생합니다.

CLI가 다른 이유

CLI 방식은 시작 시점에 도구의 이름과 위치 정보만 로드합니다. 에이전트가 특정 도구를 쓰고 싶을 때 비로소 --help로 해당 도구의 상세 정보를 조회하는 구조입니다. 필요한 것만, 필요할 때 가져오는 지연 로딩(lazy loading) 방식이죠.

세션 시작 토큰은 6개 서버 기준 약 300토큰으로 줄어듭니다. 도구 1개를 실제로 호출하는 시나리오 전체(세션 시작 + 도구 탐색 + 실행)를 합산해도 약 910토큰으로, MCP의 15,570토큰과 비교하면 94% 절감입니다. 10개, 100개 도구를 사용해도 절감율은 92~94% 수준을 유지합니다.

Anthropic의 Tool Search와 비교하면

Anthropic도 같은 문제를 인식하고 ‘Tool Search’ 기능을 출시했습니다. 모든 스키마 대신 검색 인덱스를 먼저 로드하고, 필요한 도구만 on-demand로 가져오는 방식으로 MCP 대비 약 85% 토큰을 절감합니다.

방향은 CLI와 같지만, 도구를 가져올 때 여전히 전체 JSON Schema를 로드한다는 차이가 있습니다. 수치로 보면 도구 10개 사용 기준 Tool Search는 약 3,800토큰, CLI는 약 964토큰입니다. 또한 Tool Search는 Anthropic 모델 전용인 반면, CLI 방식은 어떤 모델에서든 동작합니다.

구조적 문제, 구조적 해결

MCP의 비용 문제는 프로토콜의 설계 방식에서 비롯됩니다. 에이전트가 알아야 할 것을 미리 전부 알려주는 방식은 직관적이지만, 도구가 많아질수록 낭비도 선형으로 늘어납니다. CLI는 같은 도구를 다른 방식으로 감싸는 것만으로 이 구조를 뒤집습니다.

저자는 MCP 서버를 CLI로 변환하는 오픈소스 도구 CLIHub도 공개했습니다. 구체적인 변환 과정과 토큰 측정 방법은 원문에서 확인할 수 있습니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다