AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Claude Opus 4.7 출시, 에이전트 자율성과 비전 해상도 대폭 향상

이전 Claude 모델들은 복잡한 코딩 작업을 맡기면 중간중간 확인이 필요했습니다. Anthropic이 오늘 발표한 Claude Opus 4.7은 그 경계를 밀어붙입니다. 가장 어려운 작업도 처음부터 끝까지 혼자 끌고 나가도록 설계됐습니다.

사진 출처: Anthropic

Anthropic이 Claude Opus 4.7을 정식 출시했습니다. Opus 4.6 대비 소프트웨어 엔지니어링 성능이 크게 향상됐고, 비전 해상도와 장기 에이전트 작업 능력도 한 단계 올라갔습니다.

출처: Introducing Claude Opus 4.7 – Anthropic

혼자서 끝까지 가는 능력

Opus 4.7의 핵심 변화는 장기 자율 실행 능력입니다. 긴 작업을 시작해서 중단하지 않고 완수하고, 결과물을 보고하기 전에 스스로 검증하는 단계까지 포함합니다.

파트너사들의 실제 테스트 결과를 보면 개선폭이 구체적으로 드러납니다. Cursor의 내부 벤치마크에서 Opus 4.7은 70%를 기록했고, Opus 4.6은 58%였습니다. Rakuten에서는 프로덕션 작업 해결률이 3배 늘었고, Notion은 14% 향상에 도구 오류가 3분의 1로 줄었습니다. 단순히 정답률이 높아진 것이 아니라, 중간에 멈추지 않고 작업을 완수하는 지속성이 달라졌다는 점이 공통적인 평가입니다.

여기서 중요한 것은 ‘자기 검증’ 동작입니다. Opus 4.7은 출력 전에 자신의 결과를 확인하고, 논리적 결함이 있으면 실행 단계에서 스스로 잡아냅니다. Vercel은 “자신의 한계에 대해 더 솔직해졌고, 시스템 코드 작업 전에 스스로 증명을 시도하는 새로운 행동이 생겼다”고 표현했습니다.

비전 성능, 3배 이상 높아진 해상도

이번 업데이트에서 눈에 띄는 또 다른 변화는 이미지 처리 능력입니다. Opus 4.7은 최대 2,576px(약 3.75메가픽셀)까지 이미지를 처리하는데, 이전 모델의 한계였던 1,568px(1.15메가픽셀)에서 3배 이상 올랐습니다.

이 변화는 특히 정밀한 시각 정보가 핵심인 작업에서 차이를 만듭니다. 화학 구조식 판독, 복잡한 기술 다이어그램 해석, 법률 문서의 시각 자료 분석 등이 대표적인 사례입니다. XBOW는 컴퓨터 사용 시나리오에서 시각적 정확도 벤치마크가 54.5%에서 98.5%로 뛰었다고 밝혔습니다. 이전 모델로는 쓸 수 없었던 작업 범주가 열린 셈입니다.

사이버 보안 안전장치, 처음 적용된 모델

Opus 4.7은 Anthropic이 사이버 안전장치를 실제 배포에 처음 테스트하는 모델이기도 합니다. 지난주 Anthropic은 Project Glasswing을 통해 AI 모델의 사이버 보안 위험성을 공개했고, 가장 강력한 모델인 Mythos Preview의 광범위 배포 전에 덜 강력한 모델에서 먼저 안전장치를 검증하겠다고 밝혔습니다.

Opus 4.7은 학습 단계에서 의도적으로 사이버 역량을 줄이는 실험을 거쳤고, 금지되거나 고위험 사이버 보안 요청을 실시간으로 탐지해 차단하는 시스템이 적용됩니다. 취약점 연구나 침투 테스트 등 합법적 보안 작업이 필요한 전문가는 별도 검증 프로그램(Cyber Verification Program)을 통해 신청할 수 있습니다.

무엇이 달라지나

Opus 4.7은 Opus 4.6과 같은 가격($5/백만 입력 토큰, $25/백만 출력 토큰)으로 Claude 제품 전반, API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 사용할 수 있습니다.

개발자에게 한 가지 확인이 필요한 부분이 있습니다. 새 토크나이저 적용으로 같은 입력에 최대 35% 더 많은 토큰을 쓸 수 있어, 실제 트래픽 기준으로 비용 변화를 측정해보는 것이 좋습니다. API에서는 claude-opus-4-7로 사용할 수 있고, Opus 4.6에서 전환할 경우를 위한 마이그레이션 가이드도 제공됩니다.

참고자료: Migrating to Claude Opus 4.7 – Anthropic API Docs


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다