에이전틱 메모리(agentic memory)는 AI 에이전트가 단순 QA를 넘어 장기 작업·멀티스텝 추론·개인화된 상호작용을 수행하기 위해 필요한 지식 저장·검색·갱신 체계다. “에이전트의 시대”에서 기존 LLM의 고정 컨텍스트 창은 실세계 복잡도를 감당하지 못한다. 에이전틱 메모리는 이 한계를 보완하는 새로운 검색 계층(retrieval layer)으로 부상하고 있다.
왜 에이전틱 메모리가 필요한가
기존 LLM은 두 가지 방식으로 “기억”한다.
- 암묵적 메모리(implicit memory): 파라미터에 학습된 세계 지식 — 업데이트 불가, 할루시네이션 위험
- 컨텍스트 내 메모리(in-context memory): 프롬프트에 직접 넣는 방식 — 컨텍스트 창 상한에 제약
에이전틱 메모리는 이 두 방식 외에 외부 영속 메모리 계층을 추가한다. 에이전트가 도구를 호출해 읽고 쓰는 방식으로 동작하며, 세션이 끊겨도 정보가 유지된다.
메모리 유형 분류
연구들은 에이전틱 메모리를 크게 네 가지로 분류한다.
| 유형 | 설명 | 구현 예시 |
|---|---|---|
| 작업 메모리(working memory) | 현재 작업 컨텍스트, 단기 계획 | 컨텍스트 창, 스크래치패드 |
| 에피소딕 메모리(episodic memory) | 과거 상호작용·경험 기록 | 벡터 데이터베이스, 로그 |
| 의미 메모리(semantic memory) | 사실·개념·관계 지식 | 지식 그래프, RAG |
| 절차 메모리(procedural memory) | 작업 수행 방법, 스킬 | 도구 정의, 파인튜닝 |
주요 아키텍처 패턴
벡터 기반 메모리
임베딩 모델로 경험을 벡터화해 저장하고, 유사도 검색으로 관련 기억을 불러온다. mem0, agentmemory, mempalace 등이 이 방식을 택한다.
그래프 기반 메모리
엔티티와 관계를 그래프 구조로 표현한다. 다중 홉(multi-hop) 추론, 계층적 지식 표현, 지속 갱신에 강점을 보인다. graphiti, gbrain이 대표적이다.
하이브리드 아키텍처
벡터 검색과 그래프 추론을 결합하거나, 단기 컨텍스트 + 장기 외부 저장소를 함께 활용한다. graph-rag 참조.
보안 위협
2026년 논문 “A Survey on the Security of Long-Term Memory in LLM Agents”는 메모리 수명주기 전반에 걸친 위협을 정리한다.
- 쓰기 단계: 악의적 입력으로 편향된 기억 주입
- 저장 단계: 메모리 데이터베이스 탈취·변조
- 검색 단계: 관련도 조작으로 의도치 않은 기억 호출
- 공유 단계: 멀티 에이전트 간 메모리 전파를 통한 오염 확산
이 위협들은 “메모리 거버넌스(mnemonic sovereignty)” 개념을 요구한다.
평가와 벤치마크
- MemEvolve: 에이전트 경험과 메모리 아키텍처를 함께 최적화하는 메타 진화 프레임워크
- EvolveLab: 메모리 설계 비교용 모듈형 코드베이스
- 주요 평가 지표: recall@k, 레이턴시, 유지 비용, 크로스 태스크 전이
관련 도구
- mem0 — 범용 AI 에이전트 메모리 레이어 (★54k, YC S24)
- agentmemory — 하이브리드 검색 기반 영구 메모리 엔진 (recall@5 95.2%)
- mempalace — 계층적 장기 기억 시스템 (recall@5 96.6%)
- supermemory — 단일 API 메모리·컨텍스트 엔진 (LongMemEval 1위)
- graphiti — 시간 인식 컨텍스트 그래프 엔진
- gbrain — 자가 배선 지식 그래프 메모리
- openchronicle — AX 트리 기반 로컬 퍼스트 에이전트 메모리
- stash — Postgres + pgvector 기반 셀프호스팅 메모리 레이어
- reasoning-bank — 성공·실패 경험에서 추론 전략을 학습하는 메모리 프레임워크
관련 문서
- agentic-memory-tips-10-resources — 에이전틱 메모리 설계와 구현을 이해하는 핵심 자료 10선
- ai-agent-tips-memory — 메모리 아키텍처 3단계 완전 정복 (작업·외부·대규모)