AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Code as Agent Harness – 코드가 에이전트 실행 기반이 되는 관점

Code as Agent Harness는 코드가 LLM의 산출물에 머무르지 않고, 에이전트의 reasoning, acting, environment modeling, execution-based verification을 떠받치는 operational substrate가 된다는 관점을 정리한 서베이 논문이다. 즉 코드 자체가 에이전트 하네스의 핵심 매체가 된다는 주장이다.

세 층위

논문은 code-as-harness를 세 층으로 나눠 본다.

층위설명
Harness interface코드가 에이전트의 추론, 행동, 환경 모델링을 연결하는 접점
Harness mechanismsplanning, memory, tool use, feedback-driven control로 장기 실행을 안정화하는 메커니즘
Harness scaling단일 에이전트에서 멀티에이전트 협업, 리뷰, 검증으로 확장되는 구조

이 관점에서는 코드가 “모델이 작성해야 할 답”이 아니라, 에이전트가 세계를 조작하고 검증하는 실행 가능한 표현이다.

왜 중요한가

코딩 에이전트, GUI/OS 자동화, 과학 발견, DevOps, 엔터프라이즈 워크플로는 모두 실행 가능한 중간 산출물이 필요하다. 자연어 계획만으로는 상태 추적, 검증, 재사용, 회귀 방지가 어렵다. 코드는 실행되고, 테스트되고, diff로 비교되고, 다른 에이전트가 이어받을 수 있다는 점에서 하네스의 공통 언어가 된다.

열린 과제

  • 최종 성공률을 넘어 하네스 행동 자체를 평가하는 지표
  • 불완전한 피드백 아래에서의 검증
  • 하네스 개선이 기존 능력을 깨지 않게 하는 회귀 방지
  • 여러 에이전트가 공유 상태를 일관되게 다루는 방법
  • 안전 중요 행동에 대한 사람의 감독
  • 멀티모달 환경으로의 확장

관련 문서

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)