uditgoenka/autoresearch는 Karpathy의 autoresearch에서 영감을 받아 Claude Code 스킬로 구현한 자율 반복 개선 루프다. 목표와 검증 명령을 정의하면 Claude가 수정→검증→유지/롤백을 반복하며 목표를 달성한다.
핵심 루프
목표 정의 → [수정(Modify) → 검증(Verify) → 유지/롤백(Keep/Discard)] × N회- 이터레이션당 단일 원자적 변경: 실패하면 무엇이 문제인지 정확히 파악 가능
- 자동 git 롤백: 검증 실패 시 즉시 이전 상태로 되돌림
- 도메인 무관: 코드, ML, 콘텐츠, 성능 최적화, 리팩터링 모두 적용 가능
명령어 레퍼런스
| 명령어 | 설명 | 버전 |
|---|---|---|
/autoresearch | 자율 반복 루프 실행 (무제한) | v1.0.0 |
/loop N /autoresearch | 정확히 N회 반복 후 종료 | v1.0.1 |
/autoresearch:plan | 대화형 목표 설정 마법사 | v1.0.2 |
/autoresearch:security | STRIDE + OWASP + 레드팀 보안 감사 | v1.0.3 |
/autoresearch:security --diff | 변경된 파일만 감사 (델타 모드) | v1.0.3 |
/autoresearch:security --fix | Critical/High 취약점 자동 수정 | v1.0.3 |
/autoresearch:security --fail-on | CI/CD 심각도 게이트 설정 | v1.0.3 |
시작하기
# 스킬 설치
/autoresearch:plan
# 목표 설정 예시
Goal: 테스트 커버리지를 95%로 올리기
Metric: npm test -- --coverage | grep "All files"
Scope: src/**/*.ts
Direction: higher_is_better보안 감사 활용 (v1.0.3)
STRIDE 위협 모델링과 OWASP Top 10을 기반으로 코드베이스를 자동 감사한다:
# 전체 코드베이스 보안 감사
/autoresearch:security
# CI/CD 파이프라인 통합 (High 이상 발견 시 실패)
/autoresearch:security --diff --fail-on high감사 출력 구조:
- STRIDE 위협 모델
- OWASP Top 10 체크 (70개 이상)
- 4개 레드팀 페르소나 관점 분석
- 구조화된 리포트 폴더
어떤 경우에 쓰면 좋을까
- 테스트 커버리지 자동 향상: 커버리지 목표를 설정하면 Claude가 스스로 테스트를 추가한다.
- 성능 벤치마크 개선: 응답 시간, 메모리 사용량 등 수치 지표를 목표로 설정한다.
- 반복 리팩터링: 린트 규칙 준수, 코드 스타일 통일 등 기준을 검증 명령으로 정의한다.
- 코드베이스 보안 감사: PR 전 자동 보안 체크 또는 주기적 감사에 활용한다.
Karpathy autoresearch와의 차이
| 항목 | Karpathy autoresearch | uditgoenka autoresearch |
|---|---|---|
| 목적 | LLM 연구 자동화 | 범용 Claude Code 스킬 |
| 환경 | Python, GPU 필요 | Claude Code (어느 프로젝트나) |
| 도메인 | ML 연구 특화 | 도메인 무관 |
| 보안 감사 | 없음 | STRIDE + OWASP 지원 |
참고 자료
- uditgoenka/autoresearch — GitHub 공식 저장소
- Autoresearch — Autonomous Iteration for Any Task — 프로젝트 페이지
관련 문서
- autoresearch — Karpathy의 원본 autoresearch 프레임워크
- awesome-autoresearch — autoresearch 에코시스템 파생 구현체 큐레이션
- claude-code — Claude Code 기본 개념 및 기능
- claude-code-tips-dynamic-workflows — Claude Code 동적 워크플로 패턴