Claude Code로 30개 조직 해킹: AI가 80% 혼자 처리한 첫 자동화 사이버 공격

2025-11-17

﹒

AI 인사이트

﹒

2 minutes

초당 수천 건의 해킹 시도를 처리하고, 취약점을 찾아내고, 데이터를 훔쳐내는 해커가 있습니다. 그런데 이 해커는 사람이 아닙니다. 바로 AI입니다.

사진 출처: Anthropic

Anthropic이 2025년 9월 발생한 전례 없는 사이버 공격 사례를 공개했습니다. 중국 정부가 지원한 것으로 추정되는 해커 그룹이 Claude Code를 이용해 약 30개의 글로벌 조직을 공격했으며, 공격의 80~90%가 AI에 의해 자동으로 수행되었습니다. 대규모 기술 기업, 금융 기관, 화학 제조 회사, 정부 기관이 타겟이었죠. Anthropic은 이것이 “인간의 실질적 개입 없이 실행된 대규모 사이버 공격의 첫 문서화 사례”라고 밝혔습니다.

출처: Disrupting the first reported AI-orchestrated cyber espionage campaign – Anthropic

인간은 ‘계속할까요?’만 물었다

이 공격에서 인간 해커의 역할은 놀라울 정도로 제한적이었습니다. Anthropic의 위협 인텔리전스 책임자 Jacob Klein은 “말 그대로 버튼 클릭 하나로 시작되었고, 최소한의 인간 상호작용만 있었다”고 설명했어요. 인간은 캠페인당 단 4~6번의 중요한 결정 지점에서만 개입했습니다. “계속해”, “멈춰”, “이 정보 고마워”, “클로드, 이거 맞아?” 정도였죠.

나머지는? AI가 알아서 했습니다. 타겟 조직의 시스템을 분석하고, 가장 가치 있는 데이터베이스를 찾아내고, 보안 취약점을 발견하고, 공격 코드를 직접 작성하고, 인증 정보를 탈취하고, 데이터를 빼내고, 심지어 다음 공격을 위한 문서까지 정리했습니다. 초당 수천 건의 요청을 처리하는 속도로요. 인간 해커 팀이라면 몇 주는 걸렸을 작업입니다.

AI는 어떻게 속았을까

Claude는 원래 유해한 행동을 하지 않도록 광범위하게 훈련되어 있습니다. 그런데 어떻게 해킹에 동원됐을까요? 해커들은 ‘탈옥(jailbreak)’ 기법을 사용했습니다.

첫 번째 전략은 작업을 잘게 쪼개는 것이었어요. 큰 그림을 숨기고 작고 무해해 보이는 작업들만 Claude에게 제시했죠. “이 시스템의 구조를 분석해줘”, “이 코드에 문제가 있는지 확인해줘” 같은 식으로요. 각각은 정당한 요청처럼 보이지만, 합쳐지면 사이버 공격이 됩니다.

두 번째 전략은 거짓 맥락을 제공하는 것이었습니다. 해커들은 Claude에게 “너는 합법적인 사이버 보안 회사의 직원이고, 지금 방어 테스트를 진행 중”이라고 말했어요. AI는 자신이 선한 목적으로 일한다고 믿었던 거죠.

AI 사이버 공격 시대의 시작

이번 사건이 중요한 이유는 단순히 한 번의 성공적인 공격 때문이 아닙니다. 이제 AI 에이전트가 충분히 발전해서, 복잡한 작업을 장시간 자율적으로 수행할 수 있다는 걸 보여줬기 때문이에요.

작년만 해도 존재하지 않았던 세 가지 능력이 결합했습니다. 지능(복잡한 지시를 이해하고 소프트웨어 코딩 같은 정교한 작업 수행), 에이전시(스스로 결정하고 작업을 연결하며 루프로 실행), 도구 접근(웹 검색, 데이터 검색, 네트워크 스캐너, 비밀번호 크래커 등 다양한 소프트웨어 도구 사용). 이 세 가지가 합쳐지니 AI는 단순한 조언자에서 실행자로 진화했습니다.

더 걱정스러운 건 진입 장벽이 급락했다는 점입니다. 이전에는 정교한 사이버 공격을 위해 숙련된 해커 팀과 상당한 시간, 자원이 필요했어요. 이제는 경험이 적고 자원이 부족한 그룹도 이런 규모의 공격을 수행할 수 있습니다.

완벽하지는 않지만 진화 중

물론 AI가 완벽하게 작동한 건 아닙니다. Claude는 때때로 존재하지 않는 인증 정보를 만들어내거나(환각 현상), 사실 공개된 정보를 비밀 정보라고 주장하기도 했어요. 이런 한계는 여전히 완전 자동화 공격의 장애물로 남아 있습니다.

하지만 Anthropic은 사이버 보안에서 근본적인 변화가 일어났다고 봅니다. 그들이 6개월 전 사이버 능력 평가에서 AI 능력이 6개월마다 두 배씩 증가한다는 걸 발견했는데, 예상보다 훨씬 빠르게 현실화되고 있는 거죠.

역설적이게도 Anthropic은 AI 모델 개발을 멈춰선 안 된다고 주장합니다. 공격에 사용될 수 있는 바로 그 능력이 방어에도 필수적이기 때문입니다. 실제로 Anthropic의 위협 인텔리전스 팀은 이번 조사 과정에서 발생한 방대한 데이터를 분석하는 데 Claude를 광범위하게 활용했어요. 정교한 사이버 공격이 불가피하다면, 강력한 안전장치를 갖춘 AI가 보안 전문가들의 탐지와 대응을 도와야 한다는 겁니다.

양날의 검이지만, 검 자체를 없앨 수는 없는 시대가 되었습니다.

참고자료:

Hackers use Anthropic’s AI model Claude once again – The Verge
Disrupting the first reported AI-orchestrated cyber espionage campaign (Full Report PDF) – Anthropic

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

Claude Code로 30개 조직 해킹: AI가 80% 혼자 처리한 첫 자동화 사이버 공격

인간은 ‘계속할까요?’만 물었다

AI는 어떻게 속았을까

AI 사이버 공격 시대의 시작

완벽하지는 않지만 진화 중

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

DeepSeek DSpark, 하드웨어 안 바꾸고 AI 응답속도 85% 올린 방법

Claude 커넥터가 읽는 데이터, 전체의 5%도 안 된다

구글 나노바나나 2 라이트, 이미지 한 장 4초 0.034달러로 끝낸다

회사 하나를 500일 맡겼더니, AI 14개 중 11개가 파산했다