AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

GateMem – 공유 메모리 에이전트의 기억 거버넌스를 평가하는 벤치마크

GateMem은 메모리 증강 LLM 에이전트가 “잘 기억하는가”를 넘어, 여러 principal이 함께 쓰는 공유 메모리에서 권한과 삭제 요청을 올바르게 지키는지 평가하는 벤치마크다.

평가 축

질문
Utility권한이 있는 요청에는 필요한 정보를 정확히 답하는가
Access Control권한이 없거나 범위를 벗어난 요청에는 보호 정보를 누출하지 않는가
Active Forgetting삭제 요청 이후 정보를 복구하거나 확인해주지 않는가

이 셋은 서로 충돌한다. 너무 보수적으로 만들면 유용성이 떨어지고, 너무 잘 기억하게 만들면 접근 제어와 삭제가 깨진다.

왜 중요한가

개인 비서의 메모리는 개인 캐시처럼 보일 수 있지만, 실제 조직 에이전트는 고객, 팀원, 부서, 프로젝트가 섞인 공유 메모리를 다룬다. 이 환경에서는 “누가 말했는가”, “누가 볼 수 있는가”, “누가 지웠는가”가 모델 응답 품질만큼 중요하다.

관련 문서

  • mosaicleaks — 리서치 에이전트의 웹 검색 쿼리에서 새는 기업 비밀 벤치마크
  • information-flow-control — AI 에이전트의 데이터 유출을 막는 결정론적 보안 모델
  • agentspace — 사람과 AI 에이전트가 함께 일하는 팀 워크스페이스

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)