AI Sparkup

복잡한 AI 세상을 읽는 힘

Dropbox Dash: RAG와 AI 에이전트로 비즈니스 생산성을 혁신하다

현대 업무 환경에서 지식 근로자들은 정보 관리에 많은 어려움을 겪고 있습니다. 수많은 문서, 이메일, 메시지가 여러 애플리케이션과 형식으로 분산되어 있어 필요한 정보를 찾고 활용하는 것이 큰 도전이 되고 있죠. 드롭박스(Dropbox)는 이런 문제를 해결하기 위해 ‘Dash’라는 AI 기반 검색 및 지식 관리 도구를 개발했고, 최근 더욱 강력한 기능들을 추가했습니다. 이번 글에서는 Dash가 어떻게 RAG(Retrieval-Augmented Generation)와 AI 에이전트를 활용해 비즈니스 생산성을 혁신하고 있는지 살펴보겠습니다.

현대 업무 환경의 데이터 관리 과제

오늘날 지식 근로자들은 크게 세 가지 데이터 관련 도전에 직면해 있습니다:

1. 데이터 다양성

비즈니스 환경에서는 이메일, 문서, 회의 노트, 작업 관리 데이터 등 다양한 유형의 데이터가 존재합니다. 각 데이터 유형은 고유한 구조와 맥락을 가지고 있어 AI 시스템이 이를 효과적으로 처리하기 위해서는 각 데이터 유형에 맞는 접근 방식이 필요합니다.

데이터 다양성의 예 출처: Dropbox Tech Blog – 올바른 데이터 소스 식별에는 도메인 지식과 맥락 정보가 필요합니다

2. 데이터 파편화

조직의 데이터는 여러 애플리케이션에 분산되어 있어 관련 정보가 단일 위치에 저장되지 않습니다. 사용자는 필요한 정보를 찾기 위해 여러 앱 사이를 오가며 수동으로 검색해야 하는데, 이는 시간 소모적이고 비효율적입니다.

데이터 파편화의 예 출처: Dropbox Tech Blog – 여러 앱에 분산된 정보는 완전한 답변을 구성하기 위해 통합이 필요합니다

3. 데이터 형식의 다양성

비즈니스 사용자들은 텍스트 문서, 이미지, 프레젠테이션, 동영상 등 다양한 형식의 데이터를 다룹니다. 포괄적인 AI 솔루션은 이 모든 형식을 처리하고 통합할 수 있어야 합니다.

데이터 형식 다양성의 예 출처: Dropbox Tech Blog – 여러 형식에 분산된 정보

Dropbox의 기술적 해결책

이러한 도전을 해결하기 위해 Dropbox는 두 가지 핵심 AI 기술을 활용했습니다: RAG(Retrieval-Augmented Generation)와 AI 에이전트.

RAG(Retrieval-Augmented Generation)의 활용

RAG는 외부 정보 검색과 최신 생성형 모델을 결합하는 기술로, 특히 쿼리 응답과 요약 작업에 적합합니다. RAG는 데이터셋이나 지식 베이스에서 가장 관련성 높은 콘텐츠를 검색한 다음, 대형 언어 모델(LLM)을 사용하여 해당 콘텐츠를 기반으로 응답을 생성합니다.

RAG 개념도 출처: Dropbox Tech Blog – RAG(Retrieval-Augmented Generation) 프로세스

RAG 시스템의 핵심은 검색 시스템으로, Dropbox는 여러 접근 방식을 실험한 끝에 다음과 같은 조합을 선택했습니다:

  1. 전통적인 정보 검색(IR): 어휘 기반 시스템과 임베딩 특성을 활용한 스마트 재순위화
  2. 실시간 청킹(On-the-fly chunking): 쿼리 시점에 문서를 청킹하여 관련 섹션만 추출
  3. 재순위화(Reranking): 효율적인 임베딩 모델을 사용해 결과를 재정렬

이 접근 방식은 쿼리의 95% 이상을 2초 이내에 처리하면서도 높은 품질의 결과를 제공하는 균형을 달성했습니다.

AI 에이전트의 역할

RAG가 단순한 정보 검색 쿼리에 뛰어난 반면, 복잡한 다단계 작업을 처리하기 위해서는 AI 에이전트가 필요합니다. Dropbox에서 AI 에이전트는 사용자 쿼리를 개별 단계로 동적으로 분해하고, 가용한 리소스와 정보를 사용하여 해당 단계를 실행하며, 최소한의 인간 감독으로 최종 응답을 생성하는 다단계 오케스트레이션 시스템입니다.

AI 에이전트 다단계 오케스트레이션 출처: Dropbox Tech Blog – 다단계 오케스트레이션으로서의 AI 에이전트

AI 에이전트의 다단계 오케스트레이션은 계획과 실행이라는 두 단계로 구성됩니다:

1단계: 계획

계획 단계에서는 사용자 쿼리를 일련의 고수준 단계로 분해합니다. 이것은 LLM이 수행하며, 쿼리를 해석하고 사용자 쿼리에 응답하는 논리를 표현하기 위한 간단한 코드 문을 생성합니다. 이 코드는 파이썬과 유사한 Dropbox의 도메인 특화 언어(DSL)로 작성됩니다.

예를 들어, “내일 전체 회의 노트를 보여줘”라는 요청을 처리할 때 에이전트는 다음과 같은 단계로 논리를 표현합니다:

time_window: TimeWindow = time_helper.get_time_window_for_tomorrow()
meeting: Meeting = meetings_helper.find_meeting(title="all-hands", 
time_window=time_window)
notes: list[Document] = meetings_helper.get_attached_documents(meeting=meeting)

2단계: 실행

다음 단계는 코드로 표현된 논리를 검증하고 실행하는 것입니다. 정확성, 안전성을 보장하고 누락된 기능을 탐지하기 위해 정적 분석을 통해 코드를 검증합니다. 누락된 기능이 발견되면 LLM을 두 번째로 사용하여 누락된 코드를 구현합니다.

검증 및 보안

Dropbox는 LLM이 생성한 코드를 실행하기 위한 인터프리터를 처음부터 개발했습니다. 이를 통해 정적 분석 패스와 “드라이 런”, 런타임 타입 강제와 같은 모든 것을 완벽하게 제어할 수 있었습니다.

보안 문제를 해결하기 위해 인터프리터와 개발 프로세스에 보안 제어를 구현했습니다. 인터프리터의 런타임에는 최소한의 필요 기능만 구현되어 있어, 다른 전체 기능 인터프리터에 존재하는 주요 보안 위험을 방지합니다.

Dash의 새로운 기능

Dropbox는 최근 Dash에 여러 새로운 기능을 추가했습니다:

멀티미디어 검색 능력

이제 Dash는 텍스트뿐만 아니라 오디오, 비디오, 이미지와 같은 다양한 유형의 콘텐츠를 “이해”합니다. 사용자는 자연어 쿼리를 통해 다양한 미디어 형식을 검색할 수 있습니다.

Dash 멀티미디어 검색 UI 출처: TechCrunch – Dropbox는 사용자가 자연어 쿼리를 통해 다양한 미디어 형식을 검색할 수 있게 할 예정입니다

인물 검색 기능

Dash에 추가된 인물 검색 기능을 통해 사용자는 특정 프로젝트에 참여한 사람을 검색하거나 주제 전문가를 찾을 수 있습니다.

새로운 문서 작성 도구

Dropbox는 이미 문서 요약 기능을 제공하고 있었는데, 이번 업데이트로 다양한 데이터 소스의 요약을 활용해 새로운 문서와 프레젠테이션을 만드는 새로운 작성 도구를 도입했습니다. 이 도구는 이메일, 회의 노트, 기존 문서의 정보를 수집하여 프로젝트 계획, 메모, 브리핑 등을 작성할 수 있습니다.

다양한 앱 통합

Dropbox는 Dash에 새로운 통합 기능을 추가하고 있습니다. Slack, Zoom, Microsoft Teams와 같은 커뮤니케이션 도구와 Figma, Canva, Jira와 같은 프로젝트 관리 및 창의적 도구를 포함한 통합을 제공합니다. 이를 통해 사용자는 다양한 플랫폼에서 프로젝트 정보를 검색할 수 있습니다.

교훈과 AI 생산성 도구의 미래 전망

Dropbox는 비즈니스용 AI 솔루션을 개발하면서 여러 중요한 교훈을 얻었습니다:

  1. 적절한 도구 선택의 중요성: AI 에이전트는 다단계 오케스트레이션을 통해 복잡한 작업을 처리하는 데 탁월하지만, 간단한 정보 검색 작업에는 RAG가 여전히 필수적입니다.
  2. 데이터 관리의 복잡성: 데이터 다양성, 파편화, 다양한 형식을 해결하기 위해서는 혁신적인 접근 방식이 필요합니다.
  3. LLM 간의 차이: 모든 LLM이 동일하지 않으며, 같은 프롬프트라도 다른 LLM에게는 다르게 작용할 수 있습니다. 특정 작업을 완료하기 위해 LLM에 맞는 프롬프트를 신중하게 선택하고 최적화해야 합니다.
  4. 모델 크기, 지연 시간, 정확도 간의 균형: 더 큰 모델이 더 정확한 결과를 제공할 수 있지만, 사용자 기대에 맞지 않는 지연을 초래할 수 있습니다.

미래를 향한 Dropbox의 계획은 다음과 같은 방향성을 포함합니다:

  1. 멀티턴 대화 지원 에이전트: AI 에이전트가 다중 턴 대화에 참여할 수 있게 하여 더 자연스럽고 직관적인 상호 작용이 가능하도록 합니다.
  2. 자기 성찰 능력을 갖춘 에이전트: 자신의 성과를 평가하고 새로운 정보에 적응할 수 있는 에이전트를 개발하여 자율성과 효율성을 높이고 인간 개입의 필요성을 줄입니다.
  3. 비즈니스 요구에 맞는 LLM 미세 조정: 특정 비즈니스 요구에 맞춰 LLM을 지속적으로 미세 조정하여 관련성과 정확성을 향상시킵니다.
  4. 다국어 지원: 여러 언어를 지원하도록 AI 기능을 확장하여 제품을 더 접근 가능하고 다양한 팀에게 가치 있게 만듭니다.

결론

RAG와 AI 에이전트의 통합은 Dropbox Dash의 AI 기능을 크게 향상시켜 사용자의 질문에 유용한 답변을 제공할 수 있게 되었습니다. Dropbox는 학습한 내용을 바탕으로 도전과 기회를 탐색하는 데 집중하고 있으며, AI 원칙과 신뢰를 얻을 가치가 있다는 약속을 지키고 있습니다.

비즈니스 AI의 환경은 빠르게 발전하고 있으며, Dropbox는 사용자가 진정으로 의미 있는 인간적인 작업에 집중할 수 있도록 AI 기능을 발전시키는 데 주력하고 있습니다. Dash와 같은 도구의 발전은 우리가 일하는 방식의 미래를 보여주는 중요한 이정표가 될 것입니다.

참고자료:

Comments