장기실행에이전트
에이전트 혼자 두면 안 되는 이유, Anthropic의 하네스 설계 실험
솔로 에이전트 $9 vs 하네스 $200, 같은 모델도 시스템 설계에 따라 결과가 달라집니다. Anthropic이 컨텍스트 불안과 자기평가 편향을 구조적으로 해결한 하네스 설계 실험을 소개합니다.
Written by

AI 에이전트가 며칠 걸리는 작업을 혼자 완수하는 법: Anthropic의 2단계 해법
AI 에이전트가 여러 세션에 걸친 긴 작업을 일관되게 수행하지 못하는 문제를 Anthropic이 Git과 체크리스트로 해결한 방법을 소개합니다.
Written by
