AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Claude Code 맞수 등장, OpenAI Codex 데스크톱 앱 출시

OpenAI CEO Sam Altman이 최근 흥미로운 고백을 했습니다. “며칠 전 꽤 큰 코딩 프로젝트를 완성했는데, IDE(통합 개발 환경)를 단 한 번도 열지 않았습니다.” 개발자에게 IDE는 코딩의 필수 도구였는데, 이제는 AI 에이전트에게 작업을 맡기고 관리만 하는 방식으로 바뀌고 있다는 뜻이죠.

사진 출처: OpenAI

OpenAI가 2월 3일 Codex macOS 데스크톱 앱을 공식 출시했습니다. Codex는 원래 CLI(명령줄 인터페이스)나 IDE 확장 프로그램으로 사용하던 AI 코딩 도구였는데, 이제 독립된 데스크톱 앱으로 진화한 겁니다. 특히 “여러 AI 에이전트를 동시에 관리하는 커맨드 센터”를 표방하며, Anthropic의 Claude Code와 본격적인 경쟁 구도를 형성했습니다.

출처: Introducing the Codex app – OpenAI

왜 독립 앱을 만들었나

OpenAI가 이미 있던 CLI와 IDE 확장을 두고 굳이 새로운 앱을 만든 이유는 명확합니다. 사용자들의 작업 패턴이 완전히 바뀌었기 때문이죠.

Codex 제품 책임자 Alexander Embiricos는 “2021년 Codex가 처음 나왔을 때는 IDE에서 코드 몇 줄을 자동완성하는 수준이었다”고 설명합니다. 하지만 GPT-5가 나오고, 특히 작년 12월 GPT-5.2가 출시되면서 “개발자들이 전체 기능을 통째로 AI에게 위임하기 시작했다”는 겁니다. 더 이상 한 줄씩 코딩하는 게 아니라, “이 기능 만들어줘”라고 맡기고 몇 시간 뒤에 결과를 받는 방식으로 변한 거죠.

문제는 기존 인터페이스가 이런 패턴에 맞지 않았다는 점입니다. CLI는 여러 작업을 동시에 돌리기 어렵고, IDE 확장은 몇 시간씩 돌아가는 긴 작업을 감독하기에 불편했어요. 그래서 OpenAI는 “여러 에이전트를 병렬로 실행하고, 각각을 독립적으로 관리할 수 있는” 새로운 인터페이스가 필요하다고 판단했습니다.

Claude Code와 뭐가 다른가

Anthropic은 이미 Claude Code로 macOS 앱을 먼저 선보였습니다. 최근 6개월간 엔터프라이즈 시장에서 25% 점유율 상승을 기록하며 “소프트웨어 개발과 데이터 분석 분야”에서 강세를 보이고 있죠. OpenAI는 여기에 어떻게 대응하고 있을까요?

모델 성능에서의 차별화
Codex 팀 리더 Thibault Sottiaux는 “우리 모델은 긴 시간 동안 안정적으로 작업하는 능력에서 최전선에 있다”고 강조합니다. Sam Altman도 “간단한 프론트엔드 앱이 아니라 복잡한 시스템을 다루는 진지한 소프트웨어 엔지니어링에서는 GPT-5.2가 단연 가장 강력하다”고 자신합니다.

병렬 멀티태스킹 최적화
Codex 앱의 핵심 차별점은 여러 에이전트를 동시에 돌리는 경험에 최적화했다는 점입니다. 각 에이전트는 최대 30분까지 독립적으로 작동하며, “워크트리(worktree)” 기능으로 같은 코드베이스에서 충돌 없이 작업합니다. Embiricos는 “어젯밤에 여러 변경사항을 동시에 진행했는데, 그냥 각 작업 사이를 오가며 관리만 했다”고 말합니다. 백그라운드에서 에이전트들이 알아서 돌아가는 거죠.

더 많은 사용량, 같은 가격
OpenAI는 경쟁사 대응 전략으로 “더 높은 사용량 제한”을 내세웠습니다. 이번 출시와 함께 모든 유료 플랜에서 Codex 사용 한도를 2배로 늘렸어요. 심지어 무료 사용자에게도 한시적으로 Codex를 제공합니다. 가격은 비슷한데 더 많이 쓸 수 있게 만든 겁니다.

Skills와 Automations, 단순 코딩을 넘어서

Codex 앱은 코드 생성을 넘어선 기능도 제공합니다. “Skills”는 특정 작업을 위한 지침과 리소스를 묶어놓은 템플릿입니다. Figma에서 디자인 가져오기, Linear로 프로젝트 관리하기, Cloudflare나 Vercel로 배포하기 같은 작업을 Skills로 만들어두면 Codex가 자동으로 활용하죠.

“Automations”는 한 발 더 나갑니다. 정해진 스케줄에 따라 백그라운드에서 작업을 자동 실행하는 기능입니다. OpenAI는 내부적으로 “매일 이슈 분류하기, CI 실패 찾아서 요약하기, 일일 릴리스 브리핑 만들기, 버그 체크하기” 같은 반복 작업을 Automations로 처리한다고 합니다.

실제 사례도 있습니다. OpenAI는 Codex로 레이싱 게임을 만드는 데모를 공개했는데, 단 하나의 프롬프트만 입력하고 Codex가 이미지 생성 스킬과 웹 게임 개발 스킬을 활용해 700만 토큰을 사용하며 “디자이너, 게임 개발자, QA 테스터 역할을 모두 수행”했다고 합니다. 심지어 게임을 직접 플레이하며 검증까지 했대요.

AI가 기술 부채와의 전쟁을 이긴다

OpenAI 내부에서 예상치 못한 효과도 나타났습니다. 바로 기술 부채 해결입니다.

Sam Altman은 “인간 엔지니어가 싫어하는 작업들—리팩토링, 코드베이스 정리, 테스트 작성—을 AI는 재미있든 아니든 상관없이 그냥 합니다”라고 말합니다. 실제로 OpenAI의 일부 인프라 팀은 “기술 부채와의 전쟁에서 장기적으로 이길 수 없다고 포기했었는데, 이제는 이길 수 있다고 생각한다”고 합니다. AI가 끊임없이 백그라운드에서 테스트 커버리지를 확보하고 리팩토링을 해주니까요.

한 팀원은 “AI 코딩 동료와 일할 때 가장 어려운 정신적 적응은, 인간과 달리 AI는 도파민이 떨어지지 않는다는 점”이라고 말했습니다. 뭔가 안 될 때 인간은 동기와 에너지를 잃지만, AI는 계속 시도하며 결국 해결책을 찾아낸다는 거죠.

엔터프라이즈 시장의 치열한 경쟁

벤처캐피털 Andreessen Horowitz가 최근 글로벌 2000대 기업 CIO 100명을 대상으로 한 조사에 따르면, 78%가 OpenAI 모델을 프로덕션에서 사용하고 있습니다. 하지만 Anthropic도 44%로 빠르게 추격 중이며, 특히 소프트웨어 개발과 데이터 분석 분야에서 선호도가 높습니다.

흥미로운 점은 81%의 기업이 이제 3개 이상의 모델 제품군을 동시에 사용한다는 겁니다. Microsoft GitHub Copilot이 여전히 코딩 도구 시장을 주도하지만, 기업들은 “더 빠른 혁신, 더 깊은 AI 집중, 더 큰 유연성”을 이유로 AI 네이티브 스타트업에도 관심을 보입니다.

OpenAI는 Codex를 단순한 코딩 도구가 아니라 “모든 지식 작업의 기반”으로 만들고 싶어 합니다. Altman은 “코드는 컴퓨터에게 원하는 걸 시키는 보편 언어”라며, “곧 모든 비코딩 지식 작업도 코드로 처리할 수 있을 것”이라고 전망합니다.

OpenAI Sora 안드로이드 앱은 엔지니어 4명이 18일 만에 만들었습니다. Sottiaux는 “이런 규모에서 이런 속도는 본 적이 없다”고 말합니다. 연구팀은 회의 중에 Codex에게 조사를 맡기고, 결과가 나오면 그걸 보고 더 빠르게 디버깅한다고 합니다. Codex는 심지어 “자기 자신을 개발하는 데도 참여”하고 있습니다. Codex 엔지니어링 팀 모니터에는 항상 6~10개의 Codex 작업이 돌아가고 있대요.

Codex 앱은 오늘부터 ChatGPT Plus, Pro, Business, Enterprise, Edu 구독자가 사용할 수 있으며, 한시적으로 무료 및 Go 사용자도 이용 가능합니다. OpenAI는 곧 Windows 버전을 출시하고, 클라우드 기반 트리거를 지원해 “컴퓨터를 켜지 않아도 백그라운드에서 계속 돌아가는” Automations를 제공할 계획입니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다