지금까지 Claude API에서 200K 토큰을 넘기면 요금이 최대 2배까지 뛰었습니다. 긴 컨텍스트를 써야 하는 작업일수록, 요금 폭탄을 피하려고 어쩔 수 없이 컨텍스트를 잘라내거나 요약으로 대체해야 했죠. 그 할증 구조가 이번에 완전히 사라졌습니다.

Anthropic이 Claude Opus 4.6·Sonnet 4.6의 100만 토큰 컨텍스트 윈도우를 추가 요금 없이 정식 출시했습니다. 이제 9K 토큰 요청이든 900K 토큰 요청이든 동일한 단가가 적용됩니다. Opus 4.6은 입력/출력 기준 100만 토큰당 $5/$25, Sonnet 4.6은 $3/$15입니다.
출처: 1M context is now generally available for Opus 4.6 and Sonnet 4.6 – Anthropic
무엇이 달라졌나
이전까지 200K를 초과하는 요청에는 최대 100%의 할증료가 붙었습니다. 즉 긴 컨텍스트를 쓸수록 단가 자체가 올라가는 구조였죠. 이번 변경으로 요금 체계가 단순해졌습니다. 길이에 관계없이 하나의 단가만 존재합니다.
함께 바뀐 것이 있습니다. 요청당 처리 가능한 미디어 수가 기존 100개에서 600개로 늘었습니다. 이미지나 PDF 페이지 600장을 한 번의 요청에 넣을 수 있게 된 겁니다. 베타 헤더도 더 이상 필요 없습니다. 200K를 초과하는 요청은 자동으로 처리됩니다.
Claude Code 사용자에게도 적용됩니다. Max·Team·Enterprise 플랜의 Opus 4.6 세션은 기본으로 100만 토큰 컨텍스트가 활성화되어, 긴 작업 중 강제로 컨텍스트가 압축되는 빈도가 줄어듭니다. 실제로 한 팀은 Opus 컨텍스트를 200K에서 500K로 늘렸더니 오히려 전체 토큰 사용량이 줄었다고 밝히기도 했습니다.
성능은 받쳐주나
컨텍스트 창이 커져도 끝부분 내용을 제대로 처리하지 못한다면 의미가 없습니다. Anthropic에 따르면 Opus 4.6은 MRCR v2 벤치마크에서 78.3%를 기록했으며, 이는 동급 프론티어 모델 중 가장 높은 수치입니다. 다만 컨텍스트가 늘어날수록 정밀도가 떨어지는 문제는 아직 업계 전반의 과제로 남아있습니다.
실제 사용 사례도 구체적입니다. 법률 분야에서는 100페이지짜리 계약서 협상 이력 전체를 한 세션에 올려 전체 흐름을 추적하는 데 쓰이고 있습니다. 코드베이스 리뷰에서는 파일 간 의존성이 끊기지 않게 전체 diff를 한 번에 넣어 품질을 끌어올렸다는 사례도 있습니다. 사고 대응(incident response)처럼 맥락이 복잡하게 얽히는 작업에서도 중간에 컨텍스트를 초기화하지 않고 처음부터 끝까지 유지할 수 있게 되었습니다.
어떤 의미인가
이번 변경은 단순한 가격 조정이 아닙니다. 긴 컨텍스트가 “쓸 수는 있지만 비싼” 기능에서 “기본으로 쓰는” 기능으로 위상이 바뀐 겁니다. 지금까지 요금 때문에 컨텍스트를 의도적으로 줄여왔던 에이전트 파이프라인이라면, 이 변화가 설계 방식 자체에 영향을 줄 수 있습니다.
현재 Claude Platform(네이티브), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 사용 가능합니다. 구체적인 사용 현황과 벤치마크 세부 내용은 원문에서 확인할 수 있습니다.
참고자료:

답글 남기기