AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Sonnet이 막히면 Opus가 나선다, Anthropic의 어드바이저 전략

사진 출처: Anthropic

AI 에이전트를 구축할 때 항상 마주치는 딜레마가 있습니다. 성능 좋은 모델을 쓰자니 비용이 부담스럽고, 저렴한 모델만 쓰자니 어려운 판단이 필요한 순간에 한계가 드러납니다. Anthropic이 이 문제를 푸는 새로운 접근법을 공식 API 기능으로 출시했습니다.

출처: The advisor strategy: Give Sonnet an intelligence boost with Opus – Anthropic

작은 모델이 주도하고, 큰 모델이 조언한다

기존 에이전트 아키텍처에서는 보통 큰 모델이 오케스트레이터 역할을 맡았습니다. Opus 같은 고성능 모델이 전체 작업을 분해하고, 각 하위 작업을 Sonnet이나 Haiku에 위임하는 방식이죠.

어드바이저 전략은 이 구조를 뒤집습니다. Sonnet 또는 Haiku가 실행자(executor)로서 작업을 처음부터 끝까지 직접 수행합니다. 도구를 호출하고, 결과를 읽고, 해결책을 찾아가는 전 과정을 작은 모델이 주도합니다. Opus는 대기 중입니다. 실행자가 스스로 해결하기 어려운 판단에 부딪혔을 때만 Opus를 어드바이저로 호출합니다. Opus는 맥락을 파악하고 계획이나 수정 방향, 또는 중단 신호를 돌려보냅니다. 그 이상은 하지 않습니다. 도구를 직접 호출하거나 최종 결과물을 생성하는 일은 없습니다.

결과적으로 비싼 추론 능력은 꼭 필요한 순간에만 투입되고, 나머지 실행 과정은 저렴한 모델 비용으로 처리됩니다.

실제 성능은 어떻게 나왔나

Anthropic의 내부 평가에서 Sonnet 4.6 단독과 Sonnet + Opus 어드바이저 조합을 비교했습니다.

SWE-bench Multilingual(다국어 소프트웨어 엔지니어링 벤치마크)에서는 어드바이저 조합이 2.7%p 더 높은 점수를 기록하면서도, 에이전트 작업당 비용은 11.9% 더 낮았습니다. 성능과 비용이 동시에 개선된 셈입니다.

Haiku를 실행자로 썼을 때 수치 차이는 더 극적입니다. BrowseComp 벤치마크에서 Haiku 단독은 19.7%였는데, Opus를 어드바이저로 붙이자 41.2%로 두 배 이상 뛰었습니다. Sonnet 단독(70.1%) 대비 점수는 낮지만, 비용은 85%나 저렴합니다. 대량 처리가 필요한 작업에서 비용 대비 성능을 최적화하는 유력한 선택지가 됩니다.

한 줄로 적용하는 어드바이저 툴

이번 발표의 핵심은 이 전략을 API 수준에서 공식 지원한다는 점입니다. advisor_20260301 툴을 Messages API 요청에 추가하면 됩니다. 별도 라우팅 로직이나 컨텍스트 관리 코드를 따로 구현할 필요가 없습니다. 실행자 모델이 스스로 판단해서 Opus를 호출하고, 응답을 받아 작업을 이어가는 과정이 단일 /v1/messages 요청 안에서 처리됩니다.

비용 제어도 내장되어 있습니다. max_uses로 어드바이저 호출 횟수를 제한할 수 있고, 어드바이저 토큰은 사용량 블록에 별도로 리포트됩니다. Opus가 생성하는 결과물은 짧은 계획 텍스트(보통 400~700토큰)에 그치기 때문에, 전체 실행을 Opus로 돌리는 것보다 비용이 훨씬 낮게 유지됩니다.

에이전트 비용 구조가 달라진다

이 접근이 주목받는 이유는 단순히 “싸게 쓰는 방법”이 아니라는 데 있습니다. 어드바이저 전략은 에이전트의 비용 구조를 근본적으로 바꾸는 설계 패턴입니다. 지금까지 고성능 에이전트를 만들려면 고성능 모델을 전면에 세우는 수밖에 없었습니다. 이제는 작은 모델이 대부분의 실행을 담당하고, 판단이 필요한 순간에만 비싼 추론 능력을 빌려오는 구조가 가능해졌습니다.

실무 적용을 검토한다면, Anthropic은 기존 평가 스위트를 Sonnet 단독, Sonnet + Opus 어드바이저, Opus 단독 세 가지 조건으로 비교해볼 것을 권장합니다. 자세한 시스템 프롬프트 설정과 벤치마크 전체 결과는 원문에서 확인할 수 있습니다.


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다