Autoresearch 팁 – Claude Code에서 자율 반복 루프 스킬 사용하기

핵심 루프
명령어 레퍼런스
시작하기
보안 감사 활용 (v1.0.3)
어떤 경우에 쓰면 좋을까
Karpathy autoresearch와의 차이
참고 자료
관련 문서

uditgoenka/autoresearch는 Karpathy의 autoresearch에서 영감을 받아 Claude Code 스킬로 구현한 자율 반복 개선 루프다. 목표와 검증 명령을 정의하면 Claude가 수정→검증→유지/롤백을 반복하며 목표를 달성한다.

핵심 루프

목표 정의 → [수정(Modify) → 검증(Verify) → 유지/롤백(Keep/Discard)] × N회

이터레이션당 단일 원자적 변경: 실패하면 무엇이 문제인지 정확히 파악 가능
자동 git 롤백: 검증 실패 시 즉시 이전 상태로 되돌림
도메인 무관: 코드, ML, 콘텐츠, 성능 최적화, 리팩터링 모두 적용 가능

명령어 레퍼런스

명령어	설명	버전
`/autoresearch`	자율 반복 루프 실행 (무제한)	v1.0.0
`/loop N /autoresearch`	정확히 N회 반복 후 종료	v1.0.1
`/autoresearch:plan`	대화형 목표 설정 마법사	v1.0.2
`/autoresearch:security`	STRIDE + OWASP + 레드팀 보안 감사	v1.0.3
`/autoresearch:security --diff`	변경된 파일만 감사 (델타 모드)	v1.0.3
`/autoresearch:security --fix`	Critical/High 취약점 자동 수정	v1.0.3
`/autoresearch:security --fail-on`	CI/CD 심각도 게이트 설정	v1.0.3

시작하기

# 스킬 설치
/autoresearch:plan

# 목표 설정 예시
Goal: 테스트 커버리지를 95%로 올리기
Metric: npm test -- --coverage | grep "All files"
Scope: src/**/*.ts
Direction: higher_is_better

보안 감사 활용 (v1.0.3)

STRIDE 위협 모델링과 OWASP Top 10을 기반으로 코드베이스를 자동 감사한다:

# 전체 코드베이스 보안 감사
/autoresearch:security

# CI/CD 파이프라인 통합 (High 이상 발견 시 실패)
/autoresearch:security --diff --fail-on high

감사 출력 구조:

STRIDE 위협 모델
OWASP Top 10 체크 (70개 이상)
4개 레드팀 페르소나 관점 분석
구조화된 리포트 폴더

어떤 경우에 쓰면 좋을까

테스트 커버리지 자동 향상: 커버리지 목표를 설정하면 Claude가 스스로 테스트를 추가한다.
성능 벤치마크 개선: 응답 시간, 메모리 사용량 등 수치 지표를 목표로 설정한다.
반복 리팩터링: 린트 규칙 준수, 코드 스타일 통일 등 기준을 검증 명령으로 정의한다.
코드베이스 보안 감사: PR 전 자동 보안 체크 또는 주기적 감사에 활용한다.

Karpathy autoresearch와의 차이

항목	Karpathy autoresearch	uditgoenka autoresearch
목적	LLM 연구 자동화	범용 Claude Code 스킬
환경	Python, GPU 필요	Claude Code (어느 프로젝트나)
도메인	ML 연구 특화	도메인 무관
보안 감사	없음	STRIDE + OWASP 지원

참고 자료

uditgoenka/autoresearch — GitHub 공식 저장소
Autoresearch — Autonomous Iteration for Any Task — 프로젝트 페이지

AI Sparkup