OpenAI Patch the Planet, 23년 묵은 버그도 잡아낸 AI 보안 실험

2026-06-26

﹒

AI 트렌드 분석

﹒

3 minutes

AI가 코드의 보안 취약점을 너무 잘 찾아내기 시작하자, 정작 그 취약점을 고쳐야 할 오픈소스 개발자들이 더 곤란해졌습니다. 발견은 폭발적으로 늘었는데, 고칠 사람은 그대로이기 때문입니다.

사진 출처: OpenAI

OpenAI가 6월 22일 사이버 방어 역량을 묶은 ‘Daybreak’를 확장하면서, 그 핵심으로 오픈소스 유지보수자를 돕는 ‘Patch the Planet’ 이니셔티브를 발표했습니다. 보안 전문 기업 Trail of Bits와 함께 만들었고, AI로 취약점을 찾되 사람 전문가가 검증을 거쳐 패치까지 연결하는 것이 골자입니다. cURL, Python, Go 등 30개 이상의 널리 쓰이는 프로젝트가 참여를 약속했습니다.

출처: Patch the Planet: a Daybreak initiative to support open source maintainers – OpenAI

병목이 ‘찾기’에서 ‘고치기’로 옮겨갔다

OpenAI가 던지는 핵심 메시지는 한 문장으로 압축됩니다. AI가 사이버보안의 물리학을 바꿔놨다는 것입니다.

오랫동안 심각한 취약점을 찾는 일은 희귀한 전문성과 시간, 복잡한 시스템에 대한 깊은 이해를 요구했습니다. 취약점을 찾는 것 자체가 병목이었죠. 그런데 이제 최신 AI 모델이 거대한 코드베이스를 훑고, 공격 경로를 추론하고, 가설을 검증하면서 숨어 있던 보안 문제를 표면으로 끌어올립니다. 찾기는 더 이상 어렵지 않습니다.

문제는 그다음입니다. 취약점 리포트 자체는 누구도 보호해주지 못합니다. 문제를 검증하고, 영향 범위를 파악하고, 패치를 만들어 테스트하고, 공개 시점을 조율하고, 실제로 배포해야 비로소 위험이 줄어듭니다. AI가 발견을 폭증시키면서, 이제 진짜 병목은 고치기가 됐습니다.

이 부담을 직접 떠안는 쪽이 오픈소스 유지보수자입니다. 리눅스 재단과 하버드의 조사에 따르면, 널리 쓰이는 프로젝트의 94%가 한 해 동안 추가된 코드의 90% 이상을 열 명 미만의 개발자가 책임지고 있었습니다. 대부분 자원봉사로 운영되는 소수의 사람들이, AI가 쏟아내는 리포트 더미를 받아들게 된 셈입니다. 그중 상당수는 실제 위협이 아닌 낮은 품질의 오탐(false positive)입니다. OpenAI의 사이버 기술 리드는 유지보수자들이 “오픈소스에 대한 애정으로 일하는데, 이제는 쓰레기 같은 CVE를 검토하느라 발이 묶였다”고 표현했습니다.

AI가 찾고, 사람이 검증하고, 유지보수자가 통제한다

Patch the Planet이 이 문제를 푸는 방식의 핵심은 ‘사람을 한가운데 두는 것’입니다. 작업 흐름은 대략 이렇게 진행됩니다.

각 협업은 유지보수자와의 상담에서 시작합니다. 우선순위, 선호하는 방식, 기존 공개 절차를 먼저 파악합니다.
보안 연구자가 AI 모델과 Codex Security를 활용해 잠재적 취약점을 조사하고 패치 후보를 만듭니다.
Trail of Bits 엔지니어가 유지보수자에게 도달하기 전에 모든 발견을 직접 검증합니다. 증거를 재현하고, 중복을 제거하고, 심각도를 다시 평가합니다.
검증된 취약점만 우선순위를 매겨 유지보수자에게 전달하고, 패치를 제출합니다.

3단계가 이 프로그램의 진짜 가치입니다. 프론티어 AI 모델은 취약점을 잘 찾고 패치도 잘 만들지만, 동시에 막대한 양의 오탐을 만들어냅니다. 이 거품을 걷어내는 인간 검토가 없으면, 유지보수자의 부담을 덜어주기는커녕 오히려 키우게 됩니다. 어떤 패치를 배포할지, 공개를 어떻게 처리할지에 대한 최종 결정권은 끝까지 유지보수자에게 남습니다.

흥미로운 점은 들이는 시간의 절반만 버그를 찾는 데 쓴다는 것입니다. Trail of Bits CEO 댄 귀도에 따르면, 나머지 절반은 각 프로젝트의 코드베이스에 맞춰 에이전트를 커스터마이징하는 데 씁니다. 작업이 끝난 뒤에도 유지보수자가 직접 그 도구를 쓸 수 있도록 남겨두기 위해서입니다. 일회성 버그 사냥이 아니라, 팀이 스스로 더 빨리 패치할 수 있는 역량을 심어주는 쪽에 무게를 둔 설계입니다.

23년 묵은 버그까지, 실제로 무엇을 찾았나

이 접근이 빈말이 아니라는 걸 보여주는 초기 사례들이 소프트웨어 스택의 모든 층에서 나왔습니다.

가장 상징적인 발견은 OpenBSD에서 나왔습니다. 모델이 OpenBSD 커널의 System V 세마포어 구현에서 23년 묵은 use-after-free 취약점을 찾아냈습니다. 연구자들이 재현해본 결과, 권한 없는 로컬 사용자가 이를 이용해 root 권한까지 탈취할 수 있다는 것이 확인됐습니다. 20년 넘게 숨어 있던 결함을 AI가 끄집어낸 셈입니다.

규모 면에서는 리눅스 커널 사례가 눈에 띕니다. GPT-5.5-Cyber가 3천만 줄이 넘는 코드에서 보안 관련 구성요소를 식별하고, 문제를 동적으로 검증해 커널 포인터 정보 유출 PoC 8건과 로컬 권한 상승 익스플로잇 24건을 만들어냈습니다. 이는 자동으로 PoC가 생성된 일부일 뿐, 식별된 문제는 수백 건에 달했습니다.

브라우저도 예외가 아니었습니다. Chrome의 V8 자바스크립트 엔진에서 익스플로잇 가능한 취약점 5건이 보고됐고, 그중 셋은 코드에 도입된 지 며칠 만에 발견·수정됐습니다. Safari에서는 약 일주일의 집중 작업으로 10건이 넘는 취약점이 나왔습니다. Firefox의 경우, GPT-5.5가 안전성 평가 중에 찾아낸 WebAssembly 취약점을 Mozilla가 해킹 대회 Pwn2Own 베를린 이틀 전에 패치했고, 그 결과 등록된 Firefox 공격 시도 여섯 중 다섯이 철회되기도 했습니다.

5일간의 첫 스프린트에 Trail of Bits 엔지니어 25명, 인력의 약 5분의 1이 투입됐습니다. 첫 주에만 수백 개의 문제를 찾아내고 수십 개의 패치를 병합했습니다.

‘방어 역량 민주화’라는 메시지의 무게

OpenAI가 반복해서 강조하는 표현은 ‘방어 역량의 민주화’입니다. 프론티어 방어 역량이 소수의 손에만 집중돼서는 안 되며, 공격자가 결함을 악용하기 전에 모든 방어자가 이 역량에 접근할 수 있어야 한다는 논리입니다.

이 메시지가 나온 타이밍은 의미심장합니다. 같은 시기 경쟁사 Anthropic은 사이버 역량에 대한 미국 정부의 우려 속에 Fable 5와 Mythos 5 모델을 시장에서 철수해야 했습니다. AI의 공격 역량이 통제 대상이 되는 흐름 속에서, OpenAI는 같은 기술을 ‘방어자를 무장시키는 쪽’으로 프레이밍하며 차별화를 시도하는 모양새입니다. Five Eyes 정보동맹이 같은 날 “프론티어 AI 모델이 공격과 방어 양쪽의 사이버 역량을 근본적으로 바꿀 것이며, 그 시점은 몇 년이 아니라 몇 달”이라고 경고한 것도 이 긴장을 보여줍니다.

기술을 다루는 개인 입장에서 더 흥미로운 건, 보안 작업에서 인간의 가치가 어디로 이동하는가입니다. 취약점을 ‘찾는’ 능력이 흔해지면, 가치는 검증하고, 우선순위를 판단하고, 맥락에 맞는 패치를 실제로 적용하는 판단의 영역으로 옮겨갑니다. AI가 발견을 자동화할수록, 무엇이 진짜 위협인지 가려내고 신뢰할 수 있게 고치는 사람의 판단이 오히려 더 귀해진다는 뜻이기도 합니다.

OpenAI는 개별 발견의 검증 방법과 워크플로를 담은 심층 기술 보고서를 공개 조율이 마무리되는 대로 추가로 내놓겠다고 밝혔습니다.

참고자료:

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

OpenAI Patch the Planet, 23년 묵은 버그도 잡아낸 AI 보안 실험

병목이 ‘찾기’에서 ‘고치기’로 옮겨갔다

AI가 찾고, 사람이 검증하고, 유지보수자가 통제한다

23년 묵은 버그까지, 실제로 무엇을 찾았나

‘방어 역량 민주화’라는 메시지의 무게

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

OpenAI Patch the Planet, 23년 묵은 버그도 잡아낸 AI 보안 실험

루프가 코드를 쓰는 시대, Flask 창시자가 환영하지 못하는 이유

건강 대화만 학습시켰더니 코드 부정행위가 줄었다, OpenAI의 정렬 일반화 실험

변호사도 Codex로 코딩한다, OpenAI가 공개한 직무 경계 붕괴 데이터