Claude Code에서 모델이 스스로 코드 결함을 잡아내지 못하고 그냥 넘어가는 상황, 한 번쯤 겪어보셨을 겁니다. Anthropic이 오늘 공개한 Opus 4.8은 이 문제를 정면으로 건드립니다.

Anthropic이 Claude Opus 4.7의 후속 모델인 Claude Opus 4.8을 오늘 공개했습니다. 코딩·에이전트·추론 전반에서 성능이 향상됐고, 가격은 Opus 4.7과 동일합니다. 함께 출시된 Claude Code 동적 워크플로, Effort Control 기능도 주목할 만합니다.
출처: Introducing Claude Opus 4.8 – Anthropic
더 솔직해진 모델
이번 업데이트에서 Anthropic이 가장 강조하는 변화는 성능 수치가 아니라 정직성(honesty) 입니다.
AI 에이전트의 고질적인 문제 중 하나는 근거가 부족한데도 자신 있게 결론을 내리거나, 작업이 잘 됐다고 보고하면서 실제 결함을 그냥 넘기는 것입니다. Opus 4.8은 이런 경향이 전작 대비 4배 줄었습니다. 구체적으로는, 자신이 작성한 코드에서 결함을 발견했을 때 이를 사용자에게 알리지 않고 지나치는 비율이 크게 낮아졌습니다.
Devin을 만드는 Cognition의 피드백도 같은 방향을 가리킵니다. Opus 4.7에서 문제가 됐던 과도한 주석과 불필요한 툴 호출이 개선됐다고 밝혔습니다. 에이전트가 스스로 판단하고 오래 실행되는 환경일수록, 이런 신뢰성 차이가 실제 결과에 직결됩니다.
정렬(Alignment) 평가에서도 의미 있는 결과가 나왔습니다. Anthropic 내부 평가에 따르면, Opus 4.8은 사용자 자율성 지원과 사용자 이익을 위한 행동에서 역대 최고 수치를 기록했고, 기만이나 오용 협력 같은 비정렬 행동 비율은 Opus 4.7보다 크게 낮아졌습니다.
Claude Code에 수백 개의 서브에이전트가 붙는다
오늘 함께 공개된 동적 워크플로(Dynamic Workflows) 는 Claude Code가 다룰 수 있는 작업의 규모를 한 단계 끌어올립니다.
기존에는 하나의 Claude Code 세션이 순차적으로 작업을 처리했다면, 이제는 수백 개의 서브에이전트를 병렬로 실행할 수 있습니다. 작동 흐름은 이렇습니다:
- Claude가 전체 작업을 분석하고 계획을 세웁니다
- 수백 개의 서브에이전트가 각자 할당된 부분을 동시에 처리합니다
- Claude가 결과를 검증한 뒤 사용자에게 보고합니다
Anthropic은 “수십만 줄 코드베이스 전체를 킥오프부터 머지까지 한 번에 마이그레이션할 수 있다”고 설명합니다. Enterprise·Team·Max 플랜의 Claude Code에서 리서치 프리뷰로 사용할 수 있습니다.
응답 품질과 속도, 이제 직접 선택
Effort Control은 claude.ai와 Cowork에 새로 추가된 컨트롤입니다. 모델 선택 옆에 위치하며, Claude가 응답에 얼마나 많은 노력을 쏟을지 직접 조절할 수 있습니다.
높은 설정일수록 더 깊이 생각하고, 낮은 설정일수록 빠르게 응답하면서 사용 한도를 덜 소모합니다. Opus 4.8은 기본값이 High로 설정돼 있고, Extra와 Max 설정으로 올리면 더 많은 토큰을 써서 더 나은 결과를 냅니다. 어렵고 긴 비동기 작업에는 Extra를 권장한다고 Anthropic은 밝혔습니다.
API 쪽에서도 업데이트가 있습니다. Messages API가 이제 대화 배열 안에서 시스템 항목을 직접 받을 수 있게 됐습니다. 에이전트가 실행 중에 권한이나 토큰 예산, 환경 컨텍스트를 업데이트해야 할 때, 프롬프트 캐시를 깨지 않고도 반영할 수 있습니다.
Opus를 넘는 모델이 온다
글 말미에 Anthropic은 짧지만 주목할 만한 예고를 남겼습니다. Opus보다 높은 수준의 지능을 갖춘 새로운 클래스의 모델, Claude Mythos입니다. 현재는 Project Glasswing의 일환으로 소수 조직이 사이버보안 분야에서 제한적으로 사용하고 있습니다. 사이버 안전 장치 개발을 마무리하는 대로 일반 공개할 계획이라고 밝혔습니다.
Claude Opus 4.8은 오늘부터 사용 가능하며, API 모델 문자열은 claude-opus-4-8입니다. 가격은 입력 토큰 백만 개당 $5, 출력 토큰 백만 개당 $25로 Opus 4.7과 동일합니다. Fast mode는 입력 $10, 출력 $50이며, 이전 모델 대비 3배 저렴해졌습니다.

답글 남기기