로컬 코딩 에이전트는 Claude Code나 Codex 같은 상용 구독형 하네스를 완전히 대체하기보다, 비용·개인정보·반복 실험 제약이 큰 작업을 오픈 가중치 모델로 분리하는 접근에 가깝다. 핵심은 모델보다 하네스와 평가 루프다.
볼 것
| 항목 | 확인 질문 |
|---|---|
| 하네스 | 파일 읽기, 패치 적용, 테스트 실행, 복구 루프가 안정적인가 |
| 모델 | 코드 이해, 지시 준수, 긴 컨텍스트 처리, 도구 호출을 버티는가 |
| 속도 | 긴 repo 탐색에서 토큰 처리량과 지연 시간이 허용 가능한가 |
| 보안 | 소스 코드가 외부 API로 나가지 않아야 하는가 |
| 평가 | 실제 repo 태스크로 pass/fail을 측정하고 있는가 |
실전 전략
작은 모델은 repo 전체 설계 변경보다 정형 작업에 먼저 붙인다. 예를 들어 로그 요약, 단순 리팩터링 후보 찾기, 테스트 실패 원인 후보 정리, 문서 초안 생성은 로컬 모델로도 충분히 가치가 있다. 반면 아키텍처 변경, 복잡한 디버깅, 보안 패치는 고성능 모델과 사람 리뷰가 필요하다.
관련 문서
- local-slm — 로컬 소형 언어 모델 개요
- smallcode — 소형 로컬 LLM에 최적화된 터미널 코딩 에이전트
- qwen — Qwen 모델 계열
- codex — OpenAI Codex 코딩 에이전트
참고 자료
- Using Local Coding Agents — Sebastian Raschka (2026-06)