Fable 5, 출시 3일 만에 정부 명령으로 전면 차단된 이유

2026-06-14

﹒

2 minutes

지난 금요일 오후 5시 21분, Anthropic에 정부 공문 한 통이 도착했습니다. 출시한 지 사흘밖에 안 된 최신 모델 Fable 5와 Mythos 5에 대한 접근을 즉시 전면 차단하라는 수출 통제 명령이었습니다. 그로부터 몇 시간 뒤, 전 세계 모든 사용자의 접근이 끊겼습니다.

사진 출처: Anthropic

Anthropic이 6월 12일 발표한 공식 성명에 따르면, 미 정부는 국가 안보를 이유로 외국 국적자(미국 내 체류자 포함, 심지어 Anthropic 직원까지)의 Fable 5·Mythos 5 접근을 금지하는 수출 통제 지시를 내렸습니다. 현실적으로 외국 국적자만 선별 차단하는 것이 불가능한 탓에, Anthropic은 결국 모든 고객의 접근을 차단하는 방식으로 대응했습니다. 다른 Claude 모델들은 영향을 받지 않습니다.

출처: Statement on the US government directive to suspend access to Fable 5 and Mythos 5 – Anthropic

정부가 문제 삼은 것

정부가 제시한 명분은 Fable 5의 “젤브레이크(jailbreak)” 가능성입니다. 젤브레이크란 모델의 안전 장치를 우회해 차단된 응답을 끌어내는 기법을 말합니다.

그런데 Anthropic의 설명을 들어보면 그 근거가 상당히 빈약합니다. 정부가 Anthropic에 제공한 것은 구두 설명뿐이었고, 서면 증거도 없었습니다. 문제가 된 젤브레이크는 모델에게 특정 코드베이스를 읽히고 취약점을 찾도록 유도하는 방식인데, Anthropic이 검토한 결과 이 수준의 능력은 GPT-5.5를 비롯한 다른 공개 모델에서도 이미 가능한 것이었습니다. 또한 이런 기법은 사이버 보안 전문가들이 방어 목적으로 매일 사용하는 방식이기도 합니다. Anthropic은 “범용 젤브레이크(universal jailbreak)”, 즉 모델의 모든 안전 장치를 광범위하게 뚫는 방법은 아직 발견된 적이 없다고 밝혔습니다.

Anthropic의 방어 전략, 그리고 반박

Anthropic은 Fable 5 출시 전에 이미 완벽한 젤브레이크 방지는 불가능하다는 전제 아래 설계 전략을 세웠습니다. 이를 “방어 심층(defense in depth)” 전략이라고 부릅니다.

핵심은 단일 방어선이 뚫려도 피해를 최소화하는 구조입니다. 안전 장치를 모델 내부가 아닌 독립적인 분류 시스템으로 분리해, 모델이 거부를 넘어 계속 응답하더라도 가장 위험한 출력물은 별도 레이어에서 차단됩니다. 또한 고객 데이터를 30일간 보관하는 정책을 도입해 젤브레이크 시도를 추적하고 빠르게 대응할 수 있도록 했습니다.

Anthropic의 입장은 명확합니다. 비범용 젤브레이크 하나가 발견됐다고 수억 명이 사용하는 상용 모델을 회수할 이유가 없으며, 이 기준을 업계 전반에 적용하면 사실상 모든 프런티어 모델 배포가 중단될 것이라는 주장입니다.

안전을 강조한 서사가 부른 역설

이번 사태의 핵심 아이러니는 Anthropic 스스로가 쌓아온 서사에 있습니다.

Anthropic은 Mythos 출시 당시 “이 모델은 모든 주요 운영체제와 브라우저에서 보안 취약점을 찾아냈다”며 스스로 위험성을 강조하고, 일반 공개 대신 약 50개 검증된 조직에만 제한 배포하는 Project Glasswing을 운영해 왔습니다. Fable 5는 이 Mythos에 안전 장치를 얹어 일반 사용자에게 공개한 버전입니다.

그런데 바로 그 “이 AI는 위험하다”는 서사가, 정부가 “그렇다면 차단”이라는 결정을 내리게 된 배경이 됐습니다. TechCrunch가 지적했듯, Sam Altman은 Anthropic의 Mythos 제한 배포 방식을 “폭탄을 만들어 놓고 방공호를 파는 것”이라고 비꼬았는데, 그 비유가 예상보다 훨씬 현실에 가까워졌습니다.

Anthropic은 정부가 AI 배포를 차단할 수 있어야 한다는 원칙 자체에는 동의합니다. 다만 그 과정이 투명하고 공정하며 기술적 사실에 근거한 법적 절차여야 한다는 입장입니다. 이번 명령은 그 기준을 충족하지 못했다고 보고 있으며, 현재 접근 복구를 위해 협상 중이라고 밝혔습니다.

정부가 안보를 이유로 상용 AI 모델의 서비스를 전면 중단시킨 것은 이번이 처음입니다. AI 개발사가 안전성을 강조할수록 규제 당국의 주의를 끌게 되는 구조적 딜레마가 이번 사건으로 수면 위에 올라왔습니다.

참고자료:

Anthropic’s safety warnings may have just backfired – TechCrunch
Tech Things: There is a massive shadow hanging over this Fable thing – 12gramsofcarbon

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments