AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Codex로 바뀐 업무 방식, AI가 퇴근 후에도 일하게 만드는 법

Amazon 고객센터 대기 시간이 25분이라고 했습니다. Jason Liu는 기다리는 대신 Codex에 지시를 내리고 샤워를 하러 갔습니다. 샤워를 마치고 나왔을 때 환불은 이미 완료되어 있었습니다.

사진 출처: jxnl.co

ML 엔지니어이자 AI 컨설턴트인 Jason Liu가 OpenAI Codex 앱을 실제 업무에 통합한 경험을 공유했습니다. 코딩 도구로만 쓰던 AI 에이전트를 지식 작업 전반으로 확장하면서 발견한 핵심 개념, 바로 운영 루프(Operating Loop)입니다.

출처: Codex-maxxing – jxnl.co

“한 번 물어보고 답을 받는” 방식의 한계

대부분의 사람들이 AI를 쓰는 방식은 이렇습니다. 프롬프트 하나를 입력하고, 답을 받고, 다음 프롬프트를 입력합니다. 작업이 끝나면 대화도 끝납니다. 다음에 다시 시작할 때는 처음부터입니다.

Jason이 발견한 것은 이 패턴 자체를 바꾸는 방식이었습니다. AI가 단순히 답을 돌려주는 게 아니라, 내가 자리를 비운 사이에도 작업을 계속 이어갈 수 있는 구조 말이죠. 그는 이를 운영 루프라고 부릅니다. 지속적인 스레드, 스레드 밖에 저장된 공유 메모리, 컴퓨터를 직접 조작하는 도구, 그리고 작업 결과물을 검토할 수 있는 공간으로 구성됩니다.

루프를 작동시키는 핵심 요소들

운영 루프를 가능하게 하는 요소는 크게 세 가지입니다.

지속적인 스레드와 메모리가 첫 번째입니다. Jason은 중요한 업무마다 고정된 스레드를 하나씩 유지합니다. Chief of Staff 스레드, Agents SDK 모니터링 스레드, Twitter 모니터링 스레드 등입니다. 이 스레드들은 수개월에 걸쳐 누적된 맥락, 선호도, 과거 결정들을 담고 있습니다. 단, 스레드 안에 갇힌 메모리는 결국 사라집니다. 그래서 그는 Obsidian 볼트를 GitHub 저장소로 운영하면서, 에이전트가 새로운 정보를 학습할 때마다 관련 파일을 업데이트하도록 지시해 둡니다. 스레드가 종료되거나 너무 비용이 많이 들어도 유용한 지식은 파일로 남습니다. diff를 통해 에이전트가 무엇을 중요하게 판단했는지도 검토할 수 있습니다.

Heartbeats가 두 번째입니다. 고정된 스레드도 결국 사람이 말을 걸어야만 작동합니다. Heartbeats는 스레드가 스스로 반복 실행 일정을 설정하는 기능입니다. Jason의 Chief of Staff 스레드는 30분마다 Slack과 Gmail을 확인하고, 답장이 필요한 메시지에 대해 최대한 깊이 조사한 뒤 초안을 작성해 둡니다. 그가 Slack을 열면 답장 초안이 이미 기다리고 있습니다. 환불 사례에서는 고객센터 채팅에 상담원이 합류하면 5분마다 확인하고, 답장이 오면 1분 간격으로 빠르게 대응하도록 설정했습니다.

Heartbeats의 진짜 힘은 도구 경계를 넘을 때 나타납니다. 한 애니메이션 프로젝트에서 Jason은 Slack에 영상을 올리고 Codex에 15분마다 댓글을 확인해서 피드백이 오면 새 버전을 렌더링하고 리뷰어를 태그해 스레드에 게시하도록 시켰습니다. Slack으로 피드백을 받고, Remotion으로 렌더링하고, @computer로 파일을 업로드하는 루프가 그가 없는 사이에도 돌아갔습니다.

명확한 목표와 검증 기준이 세 번째입니다. Goals 기능은 단순히 “이 계획을 구현해줘”가 아닌, 에이전트가 계속 밀어붙일 수 있는 실제 완료 기준을 설정합니다. Jason은 Python Rich 라이브러리를 Rust로 마이그레이션하는 작업에서 “원본 라이브러리의 모든 단위 테스트를 통과할 것”을 목표로 설정했습니다. 테스트 스위트가 에이전트의 판단 기준이 되면서, 애매한 완료 상태가 아닌 명확한 성공 조건이 생겼습니다.

“일이 프롬프트 사이에서 죽지 않는” 구조

Jason이 이 글에서 말하는 핵심은 기능 하나하나가 아닙니다. “AI에게 더 많은 일을 시키는 방법”도 아닙니다. 작업이 프롬프트 사이에서 사라지지 않는 구조를 어떻게 만드느냐입니다.

지금까지 AI 에이전트는 내가 붙어 있어야 돌아갔습니다. 자리를 비우면 멈췄고, 다시 돌아오면 처음부터 맥락을 설명해야 했습니다. 운영 루프는 이 구조를 뒤집습니다. 에이전트가 기억을 유지하고, 스스로 일정을 잡고, 내가 없는 사이에도 작업을 계속 진행합니다. 나는 결정이 필요한 시점에만 개입합니다.

코딩 도구로 시작한 Codex가 지식 작업 전반의 운영 공간으로 변화하고 있다는 것, 이 글이 보여주는 변화는 그런 방향입니다.


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다