AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

ChatGPT 록다운 모드, 프롬프트 인젝션 데이터 유출을 시스템으로 막는 방법

ChatGPT는 웹을 검색하고, 파일을 읽고, 외부 서비스에 연결합니다. 그런데 바로 이 연결 능력이 공격자에게는 데이터를 빼내는 통로가 됩니다. AI가 유능해질수록 더 위험해지는 역설, OpenAI가 그 해법을 내놨습니다.

사진 출처: OpenAI Help Center

OpenAI가 ChatGPT의 새로운 보안 설정인 록다운 모드(Lockdown Mode)를 정식 출시했습니다. 민감한 데이터를 다루는 사용자를 겨냥한 선택적 기능으로, 현재 Free·Plus·Pro를 포함한 개인 계정과 셀프서브 Business 계정에 순차 적용 중입니다.

출처: Lockdown Mode – OpenAI Help Center

프롬프트 인젝션이 위험해지는 조건

프롬프트 인젝션은 웹 페이지나 업로드된 파일 속에 악성 지시를 숨겨 AI의 행동을 조종하는 공격 방식입니다. 지금 당장은 큰 위협이 아닐 수 있지만, 공격 기법이 정교해질수록 파급력이 커집니다.

보안 연구자 Simon Willison은 이 공격이 실제로 위험해지려면 세 가지 조건이 동시에 갖춰져야 한다고 설명합니다. 그는 이를 “치명적 트리펙타(Lethal Trifecta)”라고 부릅니다.

  1. AI가 민감한 데이터에 접근할 수 있어야 한다
  2. AI가 신뢰할 수 없는 외부 콘텐츠에 노출되어야 한다
  3. AI가 그 데이터를 외부로 전송할 수 있어야 한다

세 가지 중 하나라도 막으면 공격은 성립하지 않습니다. 록다운 모드는 세 번째 조건, 즉 데이터 유출 경로를 차단하는 전략입니다.

AI 판단이 아닌 시스템이 막는다

록다운 모드가 주목받는 이유는 차단 방식에 있습니다. 이 기능은 AI 모델에게 “나쁜 지시를 따르지 마라”고 가르치는 게 아닙니다. 대신 외부 네트워크 연결 자체를 시스템 레벨에서 물리적으로 끊습니다.

AI 시스템은 충분히 교묘한 공격 앞에서 스스로 속을 수 있습니다. 모델 자체가 조작될 가능성이 있는 이상, 모델의 판단에 보안을 맡기는 것은 한계가 있습니다. 록다운 모드는 그 판단을 우회해 결정론적으로 작동합니다. AI가 뭐라고 하든, 외부로 데이터가 나가는 경로를 시스템이 직접 닫아버리는 방식입니다.

구체적으로 비활성화되는 기능은 다음과 같습니다.

  • 실시간 웹 브라우징: 캐시된 콘텐츠만 접근 가능, 최신 검색 불가
  • 웹 이미지 불러오기: 파일 직접 업로드나 이미지 생성은 여전히 가능
  • 딥 리서치: 비활성화
  • 에이전트 모드: 비활성화
  • Canvas 네트워크 접근: Canvas에서 생성된 코드가 네트워크에 접근하는 것을 차단
  • 파일 다운로드: ChatGPT가 데이터 분석을 위해 파일을 다운로드하는 기능 차단

메모리, 파일 업로드, 대화 공유 기능은 그대로 유지됩니다.

완전한 보호는 아니다

OpenAI는 이 한계를 명확하게 인정합니다. 록다운 모드는 프롬프트 인젝션 자체를 막지 못합니다. 악성 지시가 캐시된 웹 콘텐츠나 업로드 파일 속에 숨어 있다면, ChatGPT는 여전히 그 지시에 영향을 받아 엉뚱한 답변을 낼 수 있습니다.

막는 것은 그 지시의 최종 목적, 즉 데이터를 외부로 빼내는 행위입니다. 공격자가 ChatGPT를 속이는 데 성공하더라도, 훔친 정보를 자신의 서버로 보내는 마지막 단계에서 막히게 됩니다.

OpenAI CISO Dane Stuckey는 이 기능이 모든 사용자를 위한 것이 아님을 분명히 했습니다. 의료·법률 기록처럼 민감한 데이터를 다루는 사람, 또는 공격 위험이 높은 업무 환경에 있는 사람에게 적합하며, 그 대신 상당한 기능 제한을 감수해야 합니다.

기본 보안 이상의 보호가 필요한 상황에서 취하는 트레이드오프인 셈입니다. 설정은 ChatGPT Settings → Security → Advanced security에서 켤 수 있습니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다