AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

코딩 AI는 왜 빠르게 성장했을까, AI 에이전트의 유일한 해자는 데이터

왜 Cursor 같은 코딩 에이전트는 급속도로 발전했는데, 슬라이드 생성 AI는 여전히 만족스럽지 못할까요? 기술력 차이? 투자금 부족? 아닙니다. 핵심은 데이터를 모을 수 있는 구조에 있습니다.

사진 출처: Frontier AI

AI 스타트업 RunLLM의 공동창업자들이 운영하는 블로그 ‘The AI Frontier’가 AI 에이전트 시장을 분석한 글을 발표했습니다. 시장을 “기술적 복잡도”와 “도입 난이도”로 나눈 2×2 매트릭스를 제시하며 한 가지 결론을 내립니다. 어떤 사분면에 있든, 데이터가 여러분의 유일한 경쟁 우위(moat)입니다.

출처: Data is your only moat – The AI Frontier

데이터 플라이휠, Cursor가 빠르게 성장한 이유

코딩은 분명 어려운 문제입니다. 그런데 왜 코딩 에이전트는 다른 AI 도구들보다 빠르게 발전했을까요?

핵심은 도입 장벽이 낮았다는 점입니다. 개발자들은 회사 승인 없이 5분 만에 Cursor를 쓸 수 있었습니다. 구매 위원회도, 보안 검토도 필요 없었죠. 개발자는 자기 IDE를 스스로 선택할 수 있기 때문에 시도 비용이 거의 없었습니다.

이렇게 많은 개발자가 빠르게 유입되자 마법이 일어났습니다. 소프트웨어 엔지니어는 하루에 수십, 수백 번 Cursor로 코드를 생성합니다. 수락하거나 거부한 모든 제안이 학습 데이터가 되죠. 데이터가 쌓이면서 모델이 개선되고, 개선된 모델이 더 많은 사용자를 끌어들이는 데이터 플라이휠이 돌아가기 시작한 겁니다.

반대로 슬라이드 생성 같은 도구가 더디게 발전하는 이유는? 이런 세밀한 피드백 루프가 없기 때문입니다. 사용 빈도도 낮고, 수락/거부 같은 명확한 피드백 신호도 없죠.

4가지 사분면, 4가지 데이터 전략

AI 에이전트 시장은 4개 유형으로 나뉩니다. 각 사분면마다 데이터를 모으는 방식과 경쟁 우위가 만들어지는 메커니즘이 다릅니다.

사분면예시데이터 수집 방식경쟁 우위(Moat)주요 플레이어
쉬운 문제 + 쉬운 도입AI 검색, 챗봇대량 사용 데이터약함 (쉽게 대체됨)OpenAI, Google, Anthropic
어려운 문제 + 쉬운 도입코딩 에이전트빠른 피드백 루프중간 (플라이휠 효과)Cursor, GitHub Copilot
쉬운 문제 + 어려운 도입엔터프라이즈 지원기업별 맞춤 학습강함 (통합 비용)Sierra, Decagon
어려운 문제 + 어려운 도입SRE, 보안 운영복잡한 워크플로우 학습매우 강함 (재현 불가)초기 단계

1. 쉬운 문제 + 쉬운 도입: 모델 제공자의 영역

검색을 AI 답변으로 대체하는 것, 간단한 질문에 답하는 것. Perplexity나 You.com 같은 스타트업이 뛰어든 영역이지만, 문제가 있습니다. 진입 장벽이 낮으면 대체되기도 쉽다는 것이죠.

OpenAI, Google, Anthropic은 이런 “명백한” 사용 사례에서 이미 수백만 건의 데이터를 모으고 있습니다. 최근 OpenAI가 발표한 ChatGPT Health가 좋은 예시죠. 거대 모델 제공자들은 비용을 보조할 수 있고, 방대한 사용자 기반으로 빠르게 학습합니다. 작은 스타트업이 경쟁하기엔 불리한 구조입니다.

2. 어려운 문제 + 쉬운 도입: 데이터 플라이휠의 전쟁터

코딩 에이전트가 여기 속합니다. 쉬운 도입 덕분에 사용량이 폭발하고, 그 데이터로 품질이 급속히 개선됩니다. 하지만 OpenAI, Google, Anthropic도 이 영역을 주목하고 있어서 치열한 경쟁이 예상됩니다.

사용자 충성도는 여전히 낮은 편입니다. 많은 개발자가 여러 코딩 에이전트를 상황에 따라 번갈아 쓰거든요. 회사별 맞춤 설정(Cursor rules 같은)이 어느 정도 lock-in을 만들 수 있지만, 표준화나 상호운용성이 등장하면 이마저도 약해질 수 있습니다.

3. 쉬운 문제 + 어려운 도입: 통합이 만드는 해자

고객 지원 티켓, IT 헬프데스크 같은 엔터프라이즈 AI가 여기 속합니다. Sierra, Decagon 같은 회사들이 지난 2년간 빠른 성장을 보인 영역이죠.

여기서 데이터 해자는 기업별 맞춤 학습에서 나옵니다. 각 고객사의 시스템, 프로세스, 용어를 학습하면서 제품이 그 회사에 깊이 뿌리내립니다. 다음 경쟁자가 오더라도 그 학습된 전문성을 재현하기 어렵죠. 숙련된 직원을 해고하고 신입으로 교체하는 것만큼 리스크가 큽니다.

다만 이 데이터는 범용성이 떨어집니다. 기업들은 자사 데이터로 모델을 학습하는 걸 제한할 가능성이 높고, A사에서 배운 워크플로우가 B사에 적용되기 어렵습니다.

4. 어려운 문제 + 어려운 도입: 다음 기회

SRE(사이트 안정성 엔지니어링), 보안 운영 같은 복잡한 워크플로우 영역입니다. 상대적으로 가장 적은 관심을 받았지만, Frontier AI는 앞으로 12-24개월간 이 사분면에서 승자들이 등장할 것으로 예측합니다.

이유는 세 가지입니다. 첫째, 추론 모델(reasoning models)이 복잡한 계획을 세울 수 있게 되었습니다. 둘째, 코딩 에이전트가 좋아지면서 워크플로우 구축이 쉬워지고 있습니다. 셋째, 기업들이 쉬운 과제를 다 따고 나면 자연스럽게 더 어려운 문제로 눈을 돌리게 됩니다.

여기서의 데이터 해자는 가장 강력합니다. 한 회사의 복잡한 워크플로우에 대한 전문성을 쌓으면, 경쟁자가 그걸 복제하는 건 거의 불가능합니다. 다만 개선 사이클은 가장 느립니다. 데이터 양이 적고, 피드백 검증도 복잡하니까요.

데이터 수집 구조를 먼저 설계하라

결국 핵심은 하나입니다. 어떤 AI 에이전트를 만들든, 데이터를 지속적으로 모을 수 있는 구조를 먼저 설계해야 합니다.

쉽게 도입할 수 있으면 빠르게 데이터를 모으지만, 대체되기도 쉽습니다. 도입이 어려우면 데이터를 천천히 모으지만, 한번 자리 잡으면 경쟁자가 파고들기 어렵습니다. 기술적 복잡도는 중요하지만, 추론 모델의 발전으로 그 격차가 빠르게 좁혀지고 있습니다.

진짜 질문은 이겁니다. “이 제품으로 어떻게 하면 사용자의 피드백을 학습 데이터로 전환할 수 있을까?” 그 답을 찾은 사람이 시장의 승자가 될 겁니다.


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다