AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Autoresearch 팁 – Claude Code에서 자율 반복 루프 스킬 사용하기

uditgoenka/autoresearch는 Karpathy의 autoresearch에서 영감을 받아 Claude Code 스킬로 구현한 자율 반복 개선 루프다. 목표와 검증 명령을 정의하면 Claude가 수정→검증→유지/롤백을 반복하며 목표를 달성한다.

핵심 루프

목표 정의 → [수정(Modify) → 검증(Verify) → 유지/롤백(Keep/Discard)] × N회
  • 이터레이션당 단일 원자적 변경: 실패하면 무엇이 문제인지 정확히 파악 가능
  • 자동 git 롤백: 검증 실패 시 즉시 이전 상태로 되돌림
  • 도메인 무관: 코드, ML, 콘텐츠, 성능 최적화, 리팩터링 모두 적용 가능

명령어 레퍼런스

명령어설명버전
/autoresearch자율 반복 루프 실행 (무제한)v1.0.0
/loop N /autoresearch정확히 N회 반복 후 종료v1.0.1
/autoresearch:plan대화형 목표 설정 마법사v1.0.2
/autoresearch:securitySTRIDE + OWASP + 레드팀 보안 감사v1.0.3
/autoresearch:security --diff변경된 파일만 감사 (델타 모드)v1.0.3
/autoresearch:security --fixCritical/High 취약점 자동 수정v1.0.3
/autoresearch:security --fail-onCI/CD 심각도 게이트 설정v1.0.3

시작하기

# 스킬 설치
/autoresearch:plan

# 목표 설정 예시
Goal: 테스트 커버리지를 95%로 올리기
Metric: npm test -- --coverage | grep "All files"
Scope: src/**/*.ts
Direction: higher_is_better

보안 감사 활용 (v1.0.3)

STRIDE 위협 모델링과 OWASP Top 10을 기반으로 코드베이스를 자동 감사한다:

# 전체 코드베이스 보안 감사
/autoresearch:security

# CI/CD 파이프라인 통합 (High 이상 발견 시 실패)
/autoresearch:security --diff --fail-on high

감사 출력 구조:

  • STRIDE 위협 모델
  • OWASP Top 10 체크 (70개 이상)
  • 4개 레드팀 페르소나 관점 분석
  • 구조화된 리포트 폴더

어떤 경우에 쓰면 좋을까

  • 테스트 커버리지 자동 향상: 커버리지 목표를 설정하면 Claude가 스스로 테스트를 추가한다.
  • 성능 벤치마크 개선: 응답 시간, 메모리 사용량 등 수치 지표를 목표로 설정한다.
  • 반복 리팩터링: 린트 규칙 준수, 코드 스타일 통일 등 기준을 검증 명령으로 정의한다.
  • 코드베이스 보안 감사: PR 전 자동 보안 체크 또는 주기적 감사에 활용한다.

Karpathy autoresearch와의 차이

항목Karpathy autoresearchuditgoenka autoresearch
목적LLM 연구 자동화범용 Claude Code 스킬
환경Python, GPU 필요Claude Code (어느 프로젝트나)
도메인ML 연구 특화도메인 무관
보안 감사없음STRIDE + OWASP 지원

참고 자료

관련 문서



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)