AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Headroom – AI 에이전트 도구 출력과 로그를 60~95% 줄이는 컨텍스트 압축 레이어

Headroom은 AI 에이전트가 LLM에 보내기 전 도구 출력, 로그, 파일, RAG 청크, 대화 이력을 압축하는 로컬 우선 컨텍스트 레이어다. 라이브러리, 프록시, 에이전트 래퍼, MCP 서버 형태로 제공되며 원문은 로컬 캐시에 남겨 필요할 때 되찾을 수 있다.

핵심 기능

기능설명
libraryPython/TypeScript에서 compress(messages)로 직접 사용
proxy기존 앱 앞에 프록시로 붙여 코드 변경 없이 압축
agent wrapClaude, Codex, Cursor, OpenCode 등 CLI 에이전트 래핑
MCPheadroom_compress, headroom_retrieve, headroom_stats 제공
cross-agent memory여러 에이전트 간 공유 저장소와 중복 제거
reversible compression원문을 캐시하고 필요 시 검색·복원

압축 방식

Headroom은 콘텐츠 유형을 판별해 JSON, 코드 AST, 일반 텍스트에 다른 압축기를 적용한다. 또한 provider KV cache가 잘 맞도록 prefix를 안정화하는 CacheAligner를 포함한다. 원문 기준 실제 에이전트 workload에서 47~92% 수준의 입력 토큰 절감 사례를 제시한다.

언제 쓰면 좋은가

코딩 에이전트가 rg, 테스트 로그, 대형 JSON, RAG 검색 결과를 반복해서 읽는 환경에 적합하다. 반대로 짧고 정확성이 중요한 법률·재무 원문처럼 압축 손실이 위험한 데이터는 원문 검색과 출처 보존 정책을 함께 둬야 한다.

관련 문서

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)