출처: Google Blog
인류의 오래된 꿈, 동물과의 대화
인류는 오랫동안 동물과 대화하는 꿈을 꿔왔습니다. 특히 높은 지능을 가진 것으로 알려진 돌고래와의 소통은 과학자들의 주요 관심사였죠. 수십 년간 연구자들은 돌고래의 복잡한 휘파람소리와 클릭음을 이해하기 위해 노력해왔지만, 그 진전은 더디기만 했습니다. 하지만 이제 인공지능 기술의 발전으로 큰 도약이 이루어질 준비가 되었습니다.
구글이 최근 발표한 ‘DolphinGemma’는 돌고래의 의사소통 방식을 이해하고 해독하기 위한 AI 모델입니다. 야생 돌고래 프로젝트(Wild Dolphin Project, WDP)와 조지아 공과대학교와 협력하여 개발된 이 모델은 돌고래의 소리를 분석하고, 그 패턴을 학습하여 소통 가능성을 열어주는 혁신적인 시도입니다.
DolphinGemma: 돌고래 언어를 해독하는 AI
DolphinGemma는 구글의 Gemma AI 모델을 기반으로 합니다. 이 모델은 인간 언어용으로 개발된 대규모 언어 모델(LLM)의 원리를 돌고래 소리에 적용한 것입니다. 인간 언어 모델이 다음 단어나 토큰을 예측하는 방식으로 작동하듯, DolphinGemma는 돌고래 소리의 시퀀스를 처리하여 패턴을 파악하고 소리의 구조를 학습합니다.
구글은 SoundStream이라는 오디오 기술을 활용해 돌고래 소리를 토큰화합니다. 이렇게 변환된 소리 데이터는 AI 모델에 입력되어 분석됩니다. 약 4억 개의 매개변수를 가진 이 모델은 야생 돌고래 프로젝트가 현장에서 사용하는 픽셀 폰에서 직접 실행될 수 있도록 최적화되어 있습니다.
출처: TechSpot – 픽셀 폰을 활용한 돌고래 연구
40년의 데이터, AI로 새롭게 해석하다
야생 돌고래 프로젝트(WDP)는 1985년부터 바하마에 서식하는 대서양 점박이 돌고래를 연구해왔습니다. “그들의 세계에서, 그들의 방식으로”라는 비침습적 접근법을 통해 이 프로젝트는 돌고래의 행동과 소리를 기록한 방대한 데이터베이스를 구축했습니다.
연구자들은 지금까지 돌고래가 내는 소리와 특정 행동 사이의 상관관계를 발견했습니다. 예를 들어:
- 고유한 휘파람 소리(서명 휘파람)는 이름처럼 사용되어 어미 돌고래가 새끼를 찾을 때 활용됩니다.
- 다른 돌고래와 싸움 중에는 ‘끽끽’거리는 소리(burst-pulse squawks)를 자주 냅니다.
- 구애 중이나 상어를 쫓을 때는 클릭 ‘버즈’ 소리를 사용합니다.
이러한 데이터베이스는 AI 분석에 이상적인 자료로, DolphinGemma가 학습할 수 있는 풍부한 컨텍스트를 제공합니다.
CHAT: 수중에서 돌고래와 대화하기
WDP와 조지아 공과대학은 CHAT(Cetacean Hearing Augmentation Telemetry) 시스템을 개발했습니다. 이는 돌고래의 복잡한 자연 언어를 직접 해독하기보다는, 단순화된 공유 어휘를 확립하는 것을 목표로 합니다.
CHAT 시스템은 돌고래가 좋아하는 물체(예: 해조류, 해초, 연구자들이 사용하는 스카프 등)와 특정 합성 휘파람 소리를 연관시킵니다. 연구자들은 돌고래가 이러한 소리를 모방하여 원하는 물건을 요청하게 되기를 기대합니다.
이 시스템이 작동하기 위해서는:
- 바다 소음 속에서 돌고래의 모방 소리를 정확히 듣기
- 어떤 휘파람이 모방되었는지 실시간으로 식별하기
- 돌고래가 ‘요청한’ 물체를 연구자에게 알리기
- 연구자가 빠르게 올바른 물체를 제공하여 연결을 강화하기
구글 픽셀 6 스마트폰은 실시간으로 돌고래 소리의 고충실도 분석을 처리했습니다. 2025년 여름 연구 시즌을 위해 개발 중인 다음 세대 시스템은 구글 픽셀 9를 중심으로 구축되며, 스피커/마이크 기능을 통합하고 딥러닝 모델과 템플릿 매칭 알고리즘을 동시에 실행할 수 있습니다.
출처: Ars Technica – DolphinGemma 시스템 개요
연구 커뮤니티와 함께하는 DolphinGemma
구글은 과학적 발견에서 협력의 가치를 인식하고, 올해 여름 DolphinGemma를 오픈 모델로 공유할 계획입니다. 대서양 점박이 돌고래 소리로 훈련되었지만, 병목코 돌고래나 회전돌고래와 같은 다른 고래류를 연구하는 연구자들에게도 유용할 것으로 예상됩니다.
다른 종의 발성에 맞게 미세 조정이 필요할 수 있지만, 모델의 오픈 특성으로 이러한 적응이 가능합니다. 구글은 DolphinGemma와 같은 도구를 제공함으로써 전 세계 연구자들이 자신의 음향 데이터셋을 분석하고, 패턴을 찾는 과정을 가속화하며, 이러한 지능적인 해양 포유류에 대한 이해를 집단적으로 심화시키기를 희망합니다.
AI가 여는 종간 소통의 미래
돌고래 의사소통을 이해하는 여정은 여전히 길지만, WDP의 헌신적인 현장 연구, 조지아 공과대학의 공학적 전문성, 구글의 기술력이 결합하여 흥미로운 새로운 가능성을 열고 있습니다.
구글의 기술은 단순히 듣는 것을 넘어 소리 내의 패턴을 이해하기 시작하여, 인간과 돌고래 의사소통 간의 격차가 조금씩 좁아지는 미래를 위한 길을 닦고 있습니다.
이 연구는 AI 기술이 인간 언어 처리를 넘어 다른 지능적 생명체와의 소통 가능성을 열어준다는 점에서 큰 의미가 있습니다. 또한 해양 생태계 보존과 이해에도 중요한 기여를 할 것으로 기대됩니다.
AI 기술이 발전함에 따라, 우리가 지구를 공유하는 다른 종들과 소통하는 방식에도 혁명적인 변화가 일어날 수 있습니다. DolphinGemma는 그 첫 걸음이 될 것이며, 앞으로 더 많은 종과의 소통 가능성을 열어줄 것입니다.
Comments