AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI 조수가 사라지고 AI 스튜디오가 생겼다, Claude Fable 5 등장

지금까지 AI와 일한다는 건 나란히 앉아서 함께 코딩하는 것이었습니다. 내가 방향을 잡고, AI가 코드를 채우고, 내가 다시 검토했습니다. 그런데 Fable 5를 쓴 뒤 달라진 건 결과의 품질이 아니었습니다. 내가 하는 일이 달라졌습니다.

사진 출처: Anthropic

Anthropic이 새로운 모델 등급인 ‘Mythos 클래스’ 중 최초의 일반 공개 모델, Claude Fable 5를 출시했습니다. 이와 함께 제한된 파트너에게만 제공되는 Claude Mythos 5도 함께 공개했습니다. Fable 5는 소프트웨어 엔지니어링, 지식 업무, 비전, 생명과학 연구 등 거의 모든 벤치마크에서 기존 모델을 앞지르며, 특히 길고 복잡한 작업일수록 격차가 더 벌어집니다.

출처: Claude Fable 5 and Claude Mythos 5 – Anthropic

마법사에서 의뢰인으로

MIT 교수이자 AI 연구자인 Ethan Mollick은 Fable 5에 얼리 액세스 권한을 받아 여러 주 동안 실험을 반복했습니다. 그가 내린 결론은 단순한 성능 평가가 아니었습니다. “나는 더 이상 마법사가 아니다. 나는 후원자(patron)다.”

그가 아이소크론 지도(특정 지점에서 이동 시간에 따른 도달 범위를 나타낸 지도)를 만들어 달라고 요청했을 때 일어난 일이 이를 잘 보여줍니다. Fable 5는 혼자서 여러 시간 동안 다음 순서로 작업을 진행했습니다.

  1. 더 저렴한 Claude Sonnet 에이전트를 여러 개 생성해 데이터 수집을 병렬로 진행
  2. 항공편 2,200건 이상, TGV·신칸센 철도 시각표, 국가별 도로 속도 데이터를 수집
  3. 데이터 수집과 동시에 코딩 시작
  4. 추가 에이전트를 배포해 코드 검증과 테스트 수행
  5. 핏케언 섬에 정기선이 얼마나 다니는지, 오타와에서 그리스 피요르드까지 어떻게 가는지까지 직접 조사

Mollick이 한 일은 “원격지 여행 시간도 실제 데이터로 채워줘”라는 한 문장짜리 피드백이 전부였습니다. 결과물은 1881년 원본 지도와 동일한 시각 스타일을 따른 인터랙티브 지도였습니다.

가장 긴 프로젝트는 9시간 30분 동안 자율 실행했습니다. 연구자들이 수년째 필요로 했지만 개발 비용이 맞지 않아 존재하지 않던 학술 데이터 분석 소프트웨어를, Fable이 19페이지 분량의 설계 문서를 스스로 작성한 뒤 그대로 구현해 냈습니다.

어떤 작업에서 두드러지나

Anthropic이 공개한 결과들을 보면 특정 분야가 아니라 폭이 넓습니다.

소프트웨어 엔지니어링: Stripe는 5,000만 줄 규모의 Ruby 코드베이스에서 팀 전체가 두 달 이상 걸릴 마이그레이션 작업을 Fable이 하루 만에 완료했다고 밝혔습니다. 고품질 프로덕션 코드 기준을 요구하는 FrontierCode 평가에서도 프런티어 모델 중 최고 점수를 기록했습니다.

지식 업무 및 비전: 시니어급 금융 분석 벤치마크에서 최고 점수를 받았고, 스크린샷만으로 웹앱 소스 코드를 재구성하거나 포켓몬 파이어레드를 지도 없이 비전만으로 클리어하는 등 시각 이해 능력도 크게 향상됐습니다.

생명과학: Mythos 5를 활용한 단백질 설계 실험에서, 전문 단백질 언어 모델을 생물학 추론만으로 능가했습니다. 연구팀은 약물 설계 프로세스 일부를 10배 가속했고, 14개 단백질 표적 중 9개에서 유력한 후보 물질을 확보했습니다. Mythos 5가 제안한 E. coli 단백질 메커니즘 가설은 다른 연구팀이 독립적으로 수행한 연구에서 실제로 확인되기도 했습니다.

능력이 커질수록 달라지는 것

Fable 5의 특이한 점은 작업 방식의 변화입니다. 이전 AI들은 사용자의 지시에 반응했습니다. Fable 5는 지시를 받으면 자체적으로 판단하고, 에이전트를 배포하고, 중간 결과를 검증하면서 스스로 완주합니다. Mollick은 이를 이렇게 묘사합니다. “나는 더 이상 조향하지 않는다. 나는 의뢰한다.”

하지만 이 구조는 새로운 질문을 낳습니다. AI가 수백 가지 세부 판단을 내리는 동안 사용자는 그 과정을 볼 수도, 개입할 수도 없습니다. 결과가 나왔을 때 전문가라면 오류를 잡아낼 수 있지만, 그 결정들이 왜 그렇게 내려졌는지는 여전히 블랙박스입니다. 능력이 올라갈수록 프로세스의 투명성은 오히려 줄어드는 역설이 생깁니다.

안전 설계도 이 맥락에서 읽힙니다. Fable 5는 사이버보안, 생물·화학, 모델 증류 관련 요청을 감지하면 자동으로 Claude Opus 4.8이 응답하도록 설계됐습니다. 전체 세션의 95% 이상은 이 전환 없이 Fable 5가 그대로 처리합니다. Mythos 5는 같은 기반 모델이지만 이 안전 장치 일부가 해제된 버전으로, 현재는 Project Glasswing 파트너와 일부 생명과학 연구자에게만 제한 제공됩니다.

가격은 입력 토큰 100만 개당 10달러, 출력 100만 개당 50달러입니다. Claude Mythos Preview보다 절반 이하 수준입니다. 구독 플랜 사용자는 6월 22일까지 추가 비용 없이 이용 가능하며, 이후에는 사용 크레딧이 필요합니다.

참고자료: What it feels like to work with Mythos – One Useful Thing (Ethan Mollick)


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다