출처: Genspark
인공지능 기술의 발전은 멈출 줄 모르는 속도로 계속되고 있습니다. 특히 최근에는 단순한 텍스트 생성이나 이미지 생성을 넘어 복잡한 작업을 자율적으로 수행하는 ‘AI 에이전트’가 큰 주목을 받고 있습니다. 그 중에서도 가장 눈에 띄는 것이 바로 Genspark의 ‘Super Agent’입니다. 이 새로운 AI 도구는 기존의 여러 AI 모델과 도구들을 통합하여 놀라운 능력을 보여주고 있는데요, 오늘은 이 혁신적인 기술에 대해 자세히 알아보겠습니다.
Genspark Super Agent란?
Genspark Super Agent는 팔로알토에 기반을 둔 스타트업 Genspark가 개발한 AI 에이전트로, 다양한 분야의 실제 작업을 자율적으로 처리할 수 있는 시스템입니다. 이 에이전트는 단순한 챗봇이나 검색 엔진을 넘어, 복잡한 워크플로우를 이해하고 처리하며 완전히 완료된 결과물을 제공할 수 있습니다.
Genspark의 공동 창업자 Eric Jing에 따르면, Super Agent는 세 가지 핵심 요소를 바탕으로 구축되었습니다:
- 9개의 서로 다른 LLM(대규모 언어 모델)의 조합
- 80개 이상의 도구
- 10개 이상의 독점 데이터셋
이 모든 요소들이 조화롭게 협력하며 작동하는 것이 Super Agent의 특징입니다.
Genspark Super Agent의 핵심 기술 – 출처: Genspark
Super Agent의 놀라운 기능
Genspark Super Agent는 일상적인 작업부터 복잡한 창의적 프로젝트까지 다양한 작업을 처리할 수 있습니다. 몇 가지 주요 기능을 살펴보겠습니다:
1. 여행 계획 및 예약 서비스
Super Agent는 샌디에고 여행을 위한 완벽한 5일 일정을 계획하고, 관광 명소 간 도보 거리를 계산하며, 대중교통 옵션을 매핑할 수 있습니다. 더 놀라운 것은 실제 목소리와 유사한 AI 음성을 사용하여 레스토랑에 직접 전화를 걸어 예약을 진행할 수도 있다는 점입니다. 이 과정에서 음식 알레르기나 좌석 선호도도 처리할 수 있습니다.
2. 비디오 및 애니메이션 제작
Super Agent는 요리 비디오 릴을 위한 레시피 단계, 비디오 장면, 오디오 오버레이를 생성할 수 있습니다. 또한 최근 정치적 스캔들에 대한 사우스 파크 스타일의 애니메이션 에피소드를 작성하고 제작하는 능력도 보여주었습니다.
3. 연구 및 데이터 분석
글로벌 음악 스트리밍에 대한 연구를 수행하고 시각적 데이터 보고서를 생성하거나, 미국 지진 데이터를 분석하여 상세한 보고서를 만들 수 있습니다.
4. 웹사이트 및 마케팅 자료 디자인
메르세데스 GLA 250을 위한 전문적인 포스터와 마케팅 웹사이트를 디자인하는 등 시각적 디자인 작업도 가능합니다.
5. 코딩 및 기술적 작업
복잡한 수학 공식의 인터랙티브 3D 시각화 코딩 등 기술적인 작업도 수행할 수 있습니다.
이처럼 Super Agent는 소비자 중심의 작업부터 기업용 애플리케이션까지 광범위한 영역을 커버합니다. 이는 단순히 텍스트를 생성하는 것을 넘어, 여러 단계의 작업을 이해하고 다양한 도구를 활용하여 실제 결과물을 만들어내는 능력을 보여줍니다.
다른 AI 에이전트와의 비교
Manus와의 비교
Super Agent의 등장은 중국 기반 스타트업인 Monica가 만든 Manus가 주목받기 시작한 지 약 3주 후에 이루어졌습니다. Manus는 여행 예약, 이력서 심사, 주식 분석과 같은 비동기 클라우드 작업을 완료하기 위해 도구와 데이터 소스를 조정하는 능력으로 주목을 받았습니다.
그러나 Genspark은 Manus보다 한 발 더 나아갔다고 주장합니다. GAIA 벤치마크(에이전트가 실제 작업 자동화를 평가하기 위해 설계된 테스트)에서 Genspark는 87.8%를 기록했는데, 이는 Manus의 86%보다 앞선 결과입니다. 또한 Genspark은 독점 구성 요소와 더 광범위한 도구 커버리지를 포함하는 아키텍처로 이를 달성했다고 합니다.
Kompas AI와의 비교
Kompas AI는 연속적인 연구와 장문 보고서 생성에 중점을 둔 연구 지향 AI 도구입니다. Kompas는 반복적인 웹 검색을 통해 주제를 깊이 파고들고 발견한 내용을 구조화된 편집 가능한 보고서로 제시합니다.
Super Agent와 Kompas를 비교할 때, Super Agent는 더 광범위한 작업(전화 통화, 비디오 생성 등)을 처리할 수 있지만, Kompas는 심층 연구 보고서 생성에 더 특화되어 있습니다. Super Agent는 다양한 멀티모달 작업을 처리할 수 있는 ‘모든 것을 위한 도구’로 볼 수 있는 반면, Kompas는 깊이 있는 연구에 중점을 둔 전문화된 도구입니다.
대형 기술 기업들의 AI 에이전트와 비교
마이크로소프트나 OpenAI 같은 대형 기술 기업들도 에이전트를 개발하고 있지만, 그들의 접근 방식은 더 보수적입니다:
- 마이크로소프트의 주요 AI 에이전트인 Copilot Studio는 Excel이나 Outlook과 같은 기업용 앱과 긴밀히 연결된 수직 에이전트에 중점을 두고 있습니다.
- OpenAI의 Agent SDK는 구성 요소를 제공하지만 자체적인 완전한 기능을 갖춘 범용 에이전트를 출시하는 것을 멈추고 있습니다.
- 아마존의 최근 발표된 Nova Act는 개발자 중심의 접근 방식을 취하며, SDK를 통해 브라우저 기반 액션을 제공하지만 Nova LLM 및 클라우드 인프라와 긴밀하게 연결되어 있습니다.
이러한 접근 방식들은 모듈화되어 있고 보안성이 높으며 기업 사용을 명확하게 타겟팅하고 있습니다. 하지만 Genspark의 데모에서 보여준 야심이나 자율성은 부족합니다. 이는 위험 회피 때문일 수 있습니다. 구글이나 마이크로소프트의 범용 에이전트가 잘못된 항공편을 예약하거나 음성 통화에서 이상한 말을 하면 평판 비용이 높을 수 있습니다.
이와 달리 Genspark와 같은 스타트업은 LLM을 혼합하고 일치시킬 수 있는 자유가 있으며, 빠르게 움직일 수 있습니다.
Super Agent가 작동하는 방식
Genspark의 접근 방식이 돋보이는 이유는 규모에 맞는 도구 오케스트레이션이라는 오랜 AI 엔지니어링 과제를 해결했기 때문입니다. 대부분의 현재 에이전트는 몇 개의 외부 API나 도구를 처리할 때 성능이 저하되지만, Genspark의 Super Agent는 모델 라우팅과 검색 기반 선택을 사용하여 작업에 따라 도구와 하위 모델을 동적으로 선택하는 방식으로 이를 더 잘 관리하는 것으로 보입니다.
또 다른 중요한 기술적 요소는 Model Context Protocol(MCP)입니다. 이는 에이전트가 단계별로 더 풍부한 도구 및 메모리 컨텍스트를 전달할 수 있게 해주는 표준입니다. Genspark의 독점 데이터셋과 결합하여, MCP는 Super Agent가 다른 대안들보다 더 “조향 가능(steerable)”하게 보이는 이유 중 하나일 수 있습니다.
눈에 띄는 또 다른 기능은 Super Agent가 사고 과정을 명확하게 시각화한다는 점입니다. 각 단계를 어떻게 추론하고, 어떤 도구를 호출하며, 그 이유를 추적합니다. 이 논리가 실시간으로 펼쳐지는 것을 보면 시스템이 블랙박스보다는 협력적인 파트너처럼 느껴집니다.
Super Agent의 주요 장점
Genspark Super Agent는 여러 가지 중요한 장점을 제공합니다:
- 빠른 속도: 일반 검색/채팅과 비슷한 거의 즉각적인 결과
- 신뢰성: 실행 중 오류와 환각이 크게 줄어듦
- 조향 가능성: 사용자가 제어할 수 있게 하여 요구 사항에 정확히 맞도록 출력을 안내하고 정제할 수 있음
- 세계 최초의 혼합 에이전트 시스템: 다양한 작업을 처리하기 위해 최고의 모델, 도구 및 데이터 세트를 활용
- 내부에서 구축된 다양한 신뢰할 수 있는 도구 세트: 효율성과 견고성을 보장하기 위해 신중하게 구축 및 테스트
- 내부에서 구축된 다양한 신뢰할 수 있는 데이터셋: 품질, 신선도 및 수량을 보장하기 위해 웹에서 사전 구축 및 추출
기업에게 Super Agent의 의미
대부분의 기업은 저녁 예약을 하거나 풍자 만화를 만드는 범용 에이전트가 필요하지 않을 수 있습니다. 그러나 곧 컴플라이언스 데이터 표면화 및 포맷팅, 고객 온보딩 오케스트레이션 또는 여러 형식의 콘텐츠 제작과 같은 도메인별 다단계 작업을 처리할 수 있는 에이전트가 필요할 수 있습니다.
이러한 맥락에서 Genspark의 작업은 더 관련성이 높아집니다. 범용 에이전트가 더 원활해지고 자율적으로 될수록, 그리고 음성, 메모리 및 외부 도구를 더 많이 통합할수록 레거시 SaaS 애플리케이션 및 RPA 플랫폼과 경쟁하기 시작할 수 있습니다.
또한 더 가벼운 인프라로 이를 수행합니다. 예를 들어, Genspark은 에이전트가 “매우 조향 가능”하며 마케터, 교사, 채용 담당자, 디자이너 및 분석가가 최소한의 설정으로 사용할 수 있다고 주장합니다.
결론: AI 에이전트의 미래
Genspark Super Agent와 같은 도구의 등장은 AI 에이전트 시대가 더 이상 가상이 아니라는 것을 보여줍니다. 이미 여기에 있으며 빠르게 움직이고 있습니다. 이러한 AI 에이전트는 단순한 작업 자동화를 넘어 실질적으로 가치 있는 결과물을 만들어내는 방향으로 발전하고 있습니다.
물론 아직 초기 단계이고 개선해야 할 부분이 많습니다. 그러나 Genspark Super Agent를 비롯한 혁신적인 AI 에이전트의 등장은 인공지능의 미래가 단순한 질문-답변 인터페이스가 아닌, 실제로 사람처럼 생각하고 행동하며 복잡한 작업을 자율적으로 수행하는 에이전트가 될 것임을 암시합니다.
기업이든 개인 사용자든, 이러한 AI 에이전트의 발전을 주시하고 어떻게 자신의 작업과 비즈니스를 혁신할 수 있는지 고려해볼 때입니다. 앞으로도 Genspark Super Agent를 포함한 AI 에이전트의 발전에 주목하며, 이 기술이 우리의 일상과 업무에 어떤 변화를 가져올지 기대해 봅니다.
Comments