출처: Mashable 웹사이트의 Perplexity 스크린샷
인공지능 음성 비서의 새로운 전환점
“시리, 스파이더맨 마스크를 쓰고 천장에 거꾸로 매달려 있는 세스 코헨이 나오는 O.C.의 노래를 재생해줘.”
이런 복잡한 요청을 했을 때, 애플의 시리는 어떻게 반응할까요? MacStories의 Federico Viticci가 실험해본 결과, 시리는 이 질문을 이해하지 못하고 ‘Seth and Summer Forever’라는 완전히 관련 없는 노래를 재생했습니다. 반면 새롭게 출시된 Perplexity의 iOS 음성 비서는 정확한 장면을 찾아내고 노래까지 제공했습니다.
이는 단순한 우연이 아닙니다. 인공지능 음성 비서 시장이 중요한 전환점을 맞이하고 있음을 보여주는 사례입니다. LLM(대규모 언어 모델) 기술이 발전하면서 사용자들은 더 이상 단순히 날씨를 묻거나 타이머를 설정하는 수준의 기능이 아닌, 자연스러운 대화와 복잡한 요청을 처리할 수 있는 비서를 원하게 되었습니다. 그리고 이제 Perplexity가 그 기대에 부응하는 새로운 접근법을 선보였습니다.
Perplexity의 접근 방식: 기존 API의 창의적 활용
Perplexity가 선보인 iOS 음성 비서의 가장 흥미로운 점은 특별한 기술이나 ‘비밀 API’를 사용하지 않았다는 것입니다. 대신 이미 존재하는 iOS의 기본 프레임워크와 API를 창의적으로 통합했습니다:
- EventKit: 캘린더 이벤트와 리마인더 조회 및 생성
- MapKit: 위치 검색과 지도 표시
- Mail 앱의 작성 기능: 이메일 작성 및 전송
- MusicKit: Apple Music 재생
- Safari View Controller: 웹페이지 표시
출처: Mashable 웹사이트의 Perplexity 스크린샷 – 지도 통합 기능
이런 접근은 매우 단순하면서도 효과적입니다. 사실상 모든 서드파티 iOS 개발자가 접근할 수 있는 API를 활용한 것이지만, 대화형 AI의 맥락에서 이를 통합한 첫 번째 주요 기업이 되었습니다. 이는 OpenAI의 ChatGPT나 Google의 Gemini와 같은 다른 AI 기업들이 아직 시도하지 않은 방식입니다.
Tao of Mac 블로그의 작성자는 “혁신은 종종 혁명적인 새로운 트릭이 아닌 실용적인 조정에서 비롯된다”고 지적했습니다. Perplexity의 사례가 바로 그것을 증명합니다.
시리와의 실제 비교 사례
Perplexity와 시리의 차이를 더 구체적으로 이해하기 위해, 몇 가지 비교 사례를 살펴보겠습니다:
- 복잡한 미디어 검색: “iOS의 Control Center가 몇 번의 주요 디자인 변경을 거쳤는지 알려줘.” – 시리는 Google 검색 결과를 보여주며 그중 하나는 이상하게도 Alexa 앱 스토어 링크였습니다. Perplexity는 연도별로 정확한 디자인 변경 사항을 정리해 보여주었습니다.
- 문맥 이해와 후속 조치: “근처 카페를 찾아줘” 다음에 “그중에서 와이파이가 잘 되는 곳은?” – 시리는 두 번째 질문에서 문맥을 잃어버리는 반면, Perplexity는 이전 대화의 맥락을 유지하며 정보를 제공합니다.
- 실용적 기능 연계: 일정 검색 후 “이 정보를 리마인더로 저장해줘” – Perplexity는 앞서 찾은 정보를 기반으로 리마인더를 생성할 수 있습니다.
ZDNET의 테스트에 따르면, Perplexity의 음성 비서는 캘린더 일정 확인, 리마인더 설정, Apple Maps를 통한 방향 안내, 이메일 작성, Uber 호출 등의 작업을 수행할 수 있습니다. 첫 사용 시에는 캘린더, 리마인더, 연락처 등에 접근 권한을 요청하지만, 이후에는 신속하고 원활하게 작동합니다.
기술적 한계와 개선 가능성
물론 Perplexity의 음성 비서도 완벽하지는 않습니다. 플랫폼 제한으로 인한 몇 가지 한계가 있습니다:
- 리마인더 기능의 제한: Perplexity는 종종 오늘 마감인 리마인더에 기한을 추가하는 데 실패하며, 리마인더 앱의 특정 목록에 항목을 저장할 수 없습니다.
- HomeKit 통합 부재: HomeKit을 통한 홈 액세서리 제어는 아직 지원하지 않습니다.
- 시리 전용 기능: 숏컷 실행, 타이머 설정, 메시지 전송, 노트 생성, 설정 변경 등 애플이 API를 제공하지 않는 기능은 수행할 수 없습니다.
이러한 한계에도 불구하고, Perplexity의 접근 방식은 미래 AI 비서 발전의 중요한 이정표를 세웠습니다. 이론적으로는 ShazamKit, Image Playground, WeatherKit, 클립보드 접근, 사진 라이브러리 접근 등 더 많은 프레임워크를 통합할 가능성이 있습니다.
애플과 다른 AI 기업들의 향후 전략
Perplexity의 혁신은 애플과 다른 AI 기업들에게 중요한 메시지를 전달합니다:
애플의 딜레마
애플은 흥미로운 딜레마에 직면해 있습니다. 한편으로는 “AI를 위한 최고의 컴퓨터를 만드는 회사”로 불리지만, 다른 한편으로는 사용자들이 점점 더 애플 기기를 다른 회사의 AI 서비스를 실행하는 ‘단순한 도구’로 사용하고 있습니다. 시리가 계속해서 뒤처진다면, 사용자들은 음성 비서 기능을 위해 다른 앱으로 옮겨갈 것입니다.
MacStories의 Federico Viticci는 이렇게 지적합니다: “수억 명의 사람들이 매일 ChatGPT의 음성 모드로 실제로 생산적인 대화를 나누는 데 익숙해지면, 애플이 이 분야에 향후 1년 동안 참여하지 않을 경우 어떻게 될까요?”
OpenAI와 다른 기업들의 기회
Perplexity의 접근 방식을 따라, OpenAI는 ChatGPT 앱을 통해 iOS의 나머지 기능과 통합할 가능성이 높습니다. 이는 아이러니하게도 시리가 ChatGPT의 도움을 받는 동안, ChatGPT는 iOS의 나머지 부분과 통합되는 상황을 만들 수 있습니다.
AI 음성 비서의 미래 전망
Perplexity의 혁신은 AI 음성 비서의 미래에 대한 중요한 통찰을 제공합니다:
- 통합이 핵심: 단순한 대화형 인터페이스를 넘어 실제 기기 기능과의 통합이 사용자 경험을 극대화합니다.
- 맥락 이해의 중요성: 긴 대화를 통해 맥락을 유지하고 이해하는 능력이 더욱 중요해지고 있습니다.
- 에코시스템 간 경쟁: 폐쇄적인 에코시스템과 오픈 API 사이의 긴장이 새로운 혁신을 촉진할 것입니다.
- 실용성 중심의 발전: 화려한 기능보다는 사용자의 일상 작업을 효율적으로 돕는 실용적 기능이 가치를 인정받을 것입니다.
결론
Perplexity의 iOS 음성 비서는 기존 API를 창의적으로 활용함으로써 AI 비서의 새로운 가능성을 보여주었습니다. 이는 기술 혁신이 항상 완전히 새로운 것을 창조하는 것이 아니라, 기존 요소들을 새롭게 조합하고 재해석하는 데서 비롯될 수 있음을 상기시킵니다.
사용자 관점에서 이런 발전은 더 자연스럽고 유용한 AI 비서 경험을 약속합니다. 이제 우리는 단순히 명령을 내리는 것이 아니라, AI 비서와 대화하고 복잡한 요청을 이해하고 처리하는 시대에 살고 있습니다.
애플과 다른 기술 기업들이 AI 음성 비서를 어떻게 발전시켜 나갈지 지켜보는 것은 흥미로울 것입니다. 그러나 Perplexity가 보여준 것처럼, 때로는 가장 간단한 접근 방식이 가장 혁신적인 결과를 가져올 수 있습니다.
Comments