auto-memory는 AI 코딩 에이전트의 “기억 상실” 문제를 해결하는 제로 의존성 Python CLI 도구다. Copilot CLI가 로컬에 저장하는 SQLite DB를 읽기 전용으로 조회해 새 세션이 시작될 때 에이전트가 이전 작업 맥락을 즉시 파악할 수 있게 해준다. 코드 약 1,900줄, 외부 라이브러리 의존성 0개로 pip install만으로 동작한다.
문제: 컨텍스트 창의 실제 한계
200K 토큰 컨텍스트 창이라고 해도 실제 가용 토큰은 훨씬 적다:
200,000 토큰 — 이론적 최대치
120,000 토큰 — 컨텍스트 로트 시작 한계 (~60%)
-65,000 토큰 — MCP 도구
-10,000 토큰 — 인스트럭션 파일
=========
~45,000 토큰 — 실제 가용 토큰LLM은 컨텍스트 창 60% 초과 시점부터 “중간에서 길을 잃는(lost in the middle)” 현상이 발생한다. 세션이 압축(compact)될 때마다 에이전트는 작업 맥락을 잃고, 사용자는 다시 설명해야 하는 악순환이 반복된다.
실측 결과: 세션 재시작·압축으로 인한 재오리엔테이션에 하루 평균 68분 손실.
해결: 50 토큰으로 10,000 토큰을 대체
| 방식 | 토큰 소모 | 결과 |
|---|---|---|
grep -r "auth" src/ | ~5,000–10,000 | 500개 결과, 대부분 무관 |
| 에이전트 재오리엔테이션 | ~2,000 | 어제 한 작업 재설명 |
**auto-memory files --json --limit 10** | ~50 | 어제 건드린 파일 정확히 10개 |
주요 기능
session-recallCLI로 직전 세션 파일·컨텍스트 즉시 조회- 읽기 전용: Copilot CLI의 SQLite DB를 수정하지 않음
- 스키마 검증으로 DB 구조 변경 시 안전하게 실패
- 에이전트 인스트럭션 파일 방식으로 통합 (
deploy/install.md지정만으로 적용) - ~50 토큰/프롬프트의 경량 오버헤드
빠른 시작
pip install auto-memory
# 또는 로컬 설치
git clone https://github.com/dezgit2025/auto-memory && ./install.sh
# 동작 확인
session-recall health에이전트에 적용하려면 deploy/install.md를 인스트럭션 파일로 지정하면 자동으로 세션 리콜이 활성화된다.
다른 접근 방식과 비교
| 방식 | 의존성 | DB 수정 | 설정 | 에이전트 네이티브 |
|---|---|---|---|---|
| auto-memory | 없음 (stdlib) | ❌ 읽기 전용 | pip install | ✅ 인스트럭션 파일 |
| MCP 서버 | Node.js 런타임 | 경우에 따라 | 서버 설정 | ❌ 프로토콜 레이어 |
| 커스텀 훅 | 다양 | 주로 있음 | 훅 스크립트 | ❌ 이벤트 기반 |
지원 환경
- 현재: GitHub Copilot CLI
- 예정: Claude Code, Cursor, Codex
관련 문서
- claude-code — Claude Code 코딩 에이전트
- ai-agent-tips-memory — AI 에이전트 메모리 아키텍처 가이드
- inference-caching — LLM 추론 캐시 전략
참고 자료
- dezgit2025/auto-memory — GitHub 공식 저장소