Claude Opus 4.5, AI 코딩 벤치마크 1위 달성하고 가격은 80% 내렸다

2025-11-26

﹒

2 minutes

AI 모델이 더 똑똑해지면 가격도 올라가는 게 당연하다고 생각했다면, Anthropic이 그 공식을 깼습니다. 11월 24일 출시된 Claude Opus 4.5는 AI 코딩 벤치마크에서 업계 최고 성능을 기록하면서도 API 가격을 대폭 인하했거든요.

사진 출처: Anthropic

Anthropic이 발표한 Claude Opus 4.5는 현존하는 가장 강력한 Claude 모델입니다. 특히 실제 깃허브 이슈를 해결하는 능력을 측정하는 SWE-bench Verified에서 80.9%를 기록하며 업계 1위에 올랐죠. 동시에 API 가격은 입력 토큰 50%, 출력 토큰 80%를 인하했고, 무료 사용자도 Opus에 접근할 수 있게 했습니다. Pro 구독자($20/월)는 아예 무제한 대화가 가능해졌고요.

출처: Introducing Claude Opus 4.5 – Anthropic

코딩 능력이 얼마나 좋길래

SWE-bench는 실제 오픈소스 프로젝트의 깃허브 이슈를 AI가 해결할 수 있는지 측정하는 벤치마크입니다. Opus 4.5의 80.9%는 구글의 Gemini 3.0 Pro(75.1%)를 크게 앞선 수치예요. 실제 소프트웨어 엔지니어링 작업에서 10건 중 8건을 제대로 처리한다는 뜻이죠.

코딩만 잘하는 건 아닙니다. 대학원 수준의 수학 문제(MATH-500)에서 94.5%를 기록했고, 복잡한 추론 태스크인 GPQA Diamond에서는 76.4%를 달성했어요. 멀티모달 능력도 강화돼서 차트나 그래프 같은 시각 자료를 분석하는 MMMU-Pro에서 73.8%를 기록했습니다.

가격 인하의 파급효과

놀라운 건 가격입니다. Opus 4.5의 API 비용은 입력 100만 토큰당 $5, 출력 100만 토큰당 $15예요. 이전 Opus 4 대비 입력은 50%, 출력은 무려 80%나 내려갔죠. 이 정도 성능의 모델을 이 가격에 쓸 수 있다는 건 AI 활용의 경제성을 완전히 바꿔놓는 변화입니다.

개인 사용자에게도 혜택이 돌아갑니다. 무료 플랜 사용자도 이제 Opus 모델에 접근할 수 있어요. Pro 구독자($20/월)는 Opus 4.5를 무제한으로 사용할 수 있고, 대화 길이 제한도 사라졌습니다. 200K 토큰 컨텍스트 윈도우를 지원하니 긴 문서나 복잡한 프로젝트도 한 번에 처리할 수 있죠.

Chrome과 Excel을 직접 제어한다

실용성도 대폭 강화됐습니다. Claude가 이제 Chrome 브라우저와 Excel을 직접 제어할 수 있거든요. 예를 들어 “이 웹사이트에서 데이터 수집해서 스프레드시트로 정리해줘”라고 하면 Claude가 브라우저를 열고, 데이터를 추출하고, Excel에 정리하는 전 과정을 자동으로 처리합니다.

특히 Microsoft Excel과의 통합은 데이터 분석 작업에 큰 변화를 가져올 것으로 보입니다. 복잡한 스프레드시트를 분석하고, 패턴을 찾아내고, 시각화까지 Claude가 알아서 처리하죠. 데이터 분석가나 리서처들에게는 강력한 보조 도구가 될 겁니다.

AI 모델 경쟁의 새 국면

Opus 4.5가 던지는 메시지는 명확합니다. 더 이상 성능과 가격이 트레이드오프 관계가 아니라는 거예요. Anthropic은 최고 성능을 달성하면서도 가격을 대폭 낮춰 접근성을 높였습니다.

이는 AI 업계 전체에 압력으로 작용할 겁니다. OpenAI, Google, Mistral 같은 경쟁사들도 비슷한 가격 인하나 성능 개선으로 대응해야 할 테니까요. 결국 사용자 입장에서는 더 좋은 AI를 더 저렴하게 쓸 수 있게 되는 거죠. 2025년은 AI가 정말 모두의 도구가 되는 해가 될지도 모르겠습니다.

참고자료:

Anthropic’s Claude Opus 4.5 is here: Cheaper AI, infinite chats and coding – VentureBeat
Anthropic introduces Opus 4.5, cuts API pricing, and enables much longer Claude chats – Ars Technica
Claude Opus 4.5 scores 80.9% on SWE-bench, what does this mean? – The Unwind
Anthropic Claude 4.5 Opus Beats Gemini 3 Pro in Coding, Agentic Tasks – Analytics India Magazine
Anthropic releases Opus 4.5 with new Chrome and Excel integrations – TechCrunch

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

Claude Opus 4.5, AI 코딩 벤치마크 1위 달성하고 가격은 80% 내렸다

코딩 능력이 얼마나 좋길래

가격 인하의 파급효과

Chrome과 Excel을 직접 제어한다

AI 모델 경쟁의 새 국면

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

AI 에이전트라 불리지만 에이전트가 아닌 것들, 검증 가능성이 핵심입니다

ClickUp, 직원 22% 줄이고 에이전트 3,000개 투입한 이유

샘 알트만·다리오 아모데이, AI 일자리 종말론 번복한 이유

OpenClaw 36만 스타의 이면, AI 에이전트 시대가 온 방식