AI 코딩 도구를 전사 도입했더니 개발 속도가 빨라졌습니다. 그런데 동시에 코드 리뷰 대기열이 터지고, CI 시스템이 과부하됐습니다. 더 빨리 만들수록 다음 단계에서 더 자주 막혔습니다.

Dropbox 엔지니어링팀이 AI 코딩 도구를 전사 도입한 뒤 겪은 현실과, 이를 해결하기 위해 자체 에이전트 플랫폼 Nova를 구축한 경험을 공식 테크 블로그에 공개했습니다. 코드 생성 속도를 높이는 것만으로는 충분하지 않고, 그 코드를 검증하고 배포하는 시스템 전체가 함께 진화해야 한다는 것이 핵심 메시지입니다.
출처: Beyond code generation: rethinking engineering productivity in the age of AI agents – Dropbox Tech Blog
병목은 사라지지 않고 이동한다
AI 코딩 도구가 코드 작성 속도를 높이자, 압박은 그대로 다음 단계로 옮겨갔습니다. 코드 리뷰 대기열이 늘어나고, CI(지속적 통합) 시스템 비용이 올라가고, 배포 조율과 프로덕션 운영에 부담이 쌓였습니다. PR(풀 리퀘스트) 수가 늘어난다고 해서 고객 가치가 자동으로 늘어나지는 않았습니다.
Dropbox가 내린 결론은 명확했습니다. 코드를 더 빨리 만드는 도구를 도입하는 것과, 그 코드를 안전하게 검증하고 배포할 수 있는 시스템을 갖추는 것은 별개의 문제라는 것입니다.
Nova, 에이전트를 위한 플랫폼
Dropbox는 이 문제를 해결하기 위해 내부 에이전트 플랫폼 Nova를 구축했습니다. Nova는 엔지니어가 자연어로 작업을 기술하면, AI 에이전트가 코드베이스를 분석하고 파일을 수정하고 테스트를 실행한 뒤 결과물을 사람이 검토할 수 있는 형태로 반환합니다.
현재 Dropbox 전체 PR의 약 1/12이 Nova를 통해 생성되고 있습니다. 기능 개발 외에도 레거시 마이그레이션, 불안정한 테스트 수정, 의존성 업데이트 같은 반복 작업에도 쓰입니다. Nova의 가치는 모델 자체보다 그 주변을 감싸는 시스템, 즉 코드베이스 맥락, 내부 개발 관행, 안전한 실행 환경, 워크플로 통합에서 나온다고 Dropbox는 강조합니다.
생산성 측정의 재정의
AI가 만드는 코드 양이 늘어나면서, 기존 지표인 PR 처리량만으로는 생산성을 제대로 측정하기 어려워졌습니다. Dropbox는 생산성을 4단계 모델로 재구성했습니다.
- Fuel: AI 도구가 실제로 활용되고 있는가
- Adoption: 팀의 워크플로가 어떻게 변화하고 있는가
- Output: AI가 프로덕션 작업에 실질적으로 기여하는가
- Impact: 아이디어에서 고객 가치까지 도달하는 시간이 줄고 있는가
코드 리뷰 처리 시간, 첫 실행 테스트 통과율, 결함 비율, 재작업 비율도 함께 추적합니다. 속도가 빨라진다고 해서 신뢰성이 떨어지면 안 된다는 전제를 측정 체계에 담은 것입니다.
엔지니어의 역할이 달라진다
에이전트가 구현 작업을 담당하게 되면서, 엔지니어의 역할은 코드를 직접 작성하는 것에서 의도를 정의하고, 생성된 결과를 검토하고, 아키텍처와 품질 판단을 내리는 쪽으로 무게중심이 이동하고 있습니다. Dropbox는 이 전환을 단순히 도구를 바꾸는 문제가 아니라 개발 운영 모델 자체의 변화로 보고, 해커톤, 부트캠프, 팀 간 사례 공유 같은 교육에도 함께 투자하고 있습니다.
구현이 빨라질수록 오히려 제품 기획과 디자인의 품질이 더 중요해집니다. 명확하지 않은 요구사항은 빠른 구현이 아니라 빠른 재작업으로 이어지기 때문입니다.
Dropbox의 경험은 AI 에이전트 도입의 이점이 모델 성능보다 그 주변 시스템, 즉 맥락 관리, 내부 도구, 품질 통제, 워크플로 통합에서 결정된다는 것을 보여줍니다.
참고자료: Nova 플랫폼 소개 – Dropbox Tech Blog

답글 남기기