AI 에이전트는 모델 하나가 아니라 여러 계층의 시스템이다. 기술 선택을 모델 비교로만 시작하면 메모리, 도구 권한, 평가, 배포 관측성이 뒤늦게 붙어 운영 리스크가 커진다.
7계층 지도
| 계층 | 역할 | 대표 질문 |
|---|---|---|
| 기반 모델 | 추론·언어·멀티모달 능력 제공 | 어떤 작업에 어떤 모델을 쓸 것인가 |
| 오케스트레이션 | 계획, 툴 호출, 상태 전이 관리 | LangGraph, Pydantic AI, 자체 루프 중 무엇이 맞는가 |
| 메모리 | 단기/장기 기억 저장·검색 | 무엇을 기억하고 언제 지울 것인가 |
| 검색/RAG | 외부 지식 연결 | 검색 품질과 출처 검증은 어떻게 할 것인가 |
| 도구 통합 | API, DB, 브라우저, 파일 접근 | 권한과 감사 로그를 어떻게 제한할 것인가 |
| 관찰·평가 | 품질, 비용, 실패 원인 추적 | 어떤 eval이 배포 차단 기준인가 |
| 배포 인프라 | 런타임, 큐, 샌드박스, 보안 | 실패·비용 폭주·비밀 유출을 어떻게 막는가 |
실무 포인트
처음부터 모든 계층을 무겁게 만들 필요는 없다. 하지만 각 계층의 “나중에 결정할 것”을 명시해야 한다. 특히 도구 권한, 평가 기준, 로그 보존 정책은 출시 직전에 붙이면 설계가 꼬이기 쉽다.
관련 문서
- agentic-stack — 코딩 에이전트 간 기억과 스킬을 이식하는 레이어
- agent-harness — 에이전트 하네스 설계 방법론
- agentops — 프로덕션 에이전트 운영 관찰·제어
참고 자료
- The AI Agent Tech Stack Explained — Machine Learning Mastery (2026-06)