AI 에이전트는 세션이 끊기면 이전 대화 맥락과 사용자 선호도를 잃는다. 챗봇이 같은 질문을 반복하고, 에이전트가 이전에 합의한 결정을 무시하는 것은 모두 장기 메모리 부재에서 비롯된다. mem0(“mem-zero”)는 이 문제를 해결하는 지능형 메모리 레이어로, 사용자 선호도를 학습하고, 개인의 필요에 적응하며, 시간이 지날수록 개인화된 경험을 제공한다. GitHub ★54,773, Y Combinator S24 투자사.
2026년 4월 새 알고리즘 성능
| 벤치마크 | 이전 | 신규 | 토큰 | 지연 p50 |
|---|---|---|---|---|
| LoCoMo | 71.4 | 91.6 | 7.0K | 0.88s |
| LongMemEval | 67.8 | 93.4 | 6.8K | 1.09s |
| BEAM (1M) | — | 64.1 | 6.7K | 1.00s |
| BEAM (10M) | — | 48.6 | 6.9K | 1.05s |
단일 LLM 호출, 에이전틱 루프 없음. supermemory, mempalace 등 경쟁 메모리 시스템 대비 LongMemEval·LoCoMo에서 1위.
알고리즘 변경 사항:
- 단일 패스 ADD 전용 추출: LLM 호출 한 번, UPDATE/DELETE 없음. 메모리가 누적되고 덮어씌워지지 않는다.
- 에이전트 생성 사실 1등급 처리: 에이전트가 행동을 확인하면 해당 정보가 동등한 가중치로 저장된다.
- 엔티티 링킹: 엔티티 추출·임베딩·연결로 검색 정확도 향상.
- 멀티 시그널 검색: 시맨틱, BM25 키워드, 엔티티 매칭을 병렬 처리 후 퓨전.
다층 메모리 구조
| 레이어 | 범위 | 예시 |
|---|---|---|
| 사용자 메모리 | 특정 사용자의 영속 선호도 | “다크 모드 선호”, “Python 3.12 사용” |
| 세션 메모리 | 대화 세션 컨텍스트 | “현재 회의: 데이터베이스 마이그레이션” |
| 에이전트 메모리 | 에이전트 작업 상태 | “PR #123 검토 완료, 리팩터링 예정” |
빠른 시작
pip install mem0aifrom mem0 import Memory
m = Memory()
# 메모리 추가
m.add("사용자는 Python을 선호한다", user_id="alice")
# 검색
results = m.search("프로그래밍 언어", user_id="alice")
# 전체 조회
all_memories = m.get_all(user_id="alice")셀프호스팅 (Docker):
docker compose up클라우드: app.mem0.ai에서 제로 설정 사용
사용 사례
- 고객 지원 챗봇: 이전 티켓·사용자 히스토리를 기억해 맞춤형 응답 제공
- AI 어시스턴트: 세션을 넘나드는 일관된 컨텍스트 보존
- 헬스케어: 환자 선호도·히스토리 추적
- 생산성 도구: 사용자 행동 패턴에 기반한 적응형 워크플로우
배포 옵션
| 방식 | 최적 케이스 |
|---|---|
| pip/npm 라이브러리 | 테스트, 프로토타이핑 |
| 셀프호스팅 서버 | 자체 인프라 운영 팀 |
| 클라우드 플랫폼 | 제로 운영 프로덕션 |
라이선스
Apache 2.0 (오픈소스 코어) + 클라우드 SaaS
관련 도구
- claude-mem — Claude Code 전용 세션 간 기억 플러그인
- auto-memory — AI 코딩 에이전트용 제로 의존성 메모리 CLI
- stash — Postgres + pgvector 셀프호스팅 메모리 레이어
- supermemory — LongMemEval·LoCoMo·ConvoMem 상위권 AI 메모리 엔진
- mempalace — 계층적 장기 기억 시스템 (recall@5 96.6%)
- reasoning-bank — 성공·실패 경험에서 추론 전략을 학습하는 에이전트 메모리
참고 자료
- mem0ai/mem0 — GitHub 공식 저장소
- Benchmarking Mem0’s token-efficient memory algorithm — mem0 Research