구글, AI를 활용해 돌고래와 대화 시도

수십 년 동안 과학자들은 돌고래가 의사소통에 사용하는 복잡한 소리에 매료되어 왔습니다. 클릭음, 휘파람 소리, 연속된 펄스는 인간의 이해를 넘어서는 언어입니다. 연구자들이 이러한 소리를 포착하고 분석하는 도구를 개발했지만, 진정한 도전은 그 패턴을 해독하고 그 의미를 밝혀내는 것입니다. 이제 인공지능이 급속도로 발전함에 따라, 마침내 이 코드를 해독하는 데 도움이 될 수 있을까요?
구글의 AI 연구소인 구글 딥마인드는 조지아 공대 연구진과 와일드 돌핀 프로젝트(WDP)의 현장 연구 협력을 통해 돌고래 발성을 해독할 수 있다고 주장하는 새로운 AI 모델인 '돌핀제마(DolphinGemma)'를 개발했습니다. 이 모델은 합성 돌고래 목소리를 만들고 일치하는 "응답"을 듣는 방식으로 작동합니다.
이 혁신적인 AI 기술은 돌고래 의사소통을 이해하는 연구 노력을 지원하여 돌고래의 사회적 행동, 인지 능력 및 인간과 돌고래 간의 의미 있는 상호작용 가능성에 대한 더 깊은 통찰력을 제공할 수 있습니다. 또한 연구자들이 스트레스 신호를 식별하고 환경적 위협을 모니터링할 수 있게 함으로써 돌고래 보존 노력에서 중요한 역할을 할 수 있습니다.
돌핀제마는 구글의 제마 프레임워크를 기반으로 구축되었으며 오디오 입력-출력 모델로 작동합니다. 이 모델은 야생 대서양 얼룩 돌고래를 연구하는 풍부한 경험을 가진 WDP의 훈련 데이터를 사용합니다. 수십 년간의 수중 녹음과 상세한 행동 관찰을 통해 WDP는 돌핀제마가 풍부한 맥락 데이터로 음성 패턴을 분석할 수 있게 하는 중요한 통찰력을 제공합니다.
돌핀제마의 핵심 구성 요소는 딥마인드가 설계한 신경 오디오 코덱인 SoundStream 토크나이저로, 오디오 신호의 효율적인 압축 및 처리를 위해 설계되었습니다. SoundStream은 돌고래 소리의 복잡한 음향 시퀀스를 효율적으로 표현하고 처리합니다. 이 시스템은 돌고래 발성을 구조화된 형식으로 변환합니다.
각 음향 샘플은 개별 돌고래 신원, 생애 이력 및 관찰된 행동과 연결되어 AI 시스템이 학습할 수 있는 풍부한 데이터셋을 확보합니다. 돌핀제마의 예측 기능은 문장에서 다음 단어나 토큰을 예상하는 인간 대규모 언어 모델(LLM)과 유사하게 작동합니다.
400M 파라미터 모델을 사용하는 돌핀제마는 성능과 계산 효율성의 균형을 맞춥니다. 연구자들은 휴대용 기기에서 직접 모델을 실행할 수 있습니다. 이는 고급 또는 특수 하드웨어를 사용할 수 없는 현장 연구에 돌핀제마를 배치해야 할 때 유용한 기능입니다.

WDP는 구글의 픽셀 9 스마트폰을 사용하여 이번 현장 시즌에 돌핀제마를 배포하기 시작했습니다. 구글에 따르면, 연구자들은 장치에서 AI 모델과 템플릿 매칭 알고리즘을 동시에 실행할 수 있습니다.
돌고래 발성 분석을 넘어, 돌핀제마는 인간과 돌고래 간의 직접적인 상호 작용을 촉진하기 위해 고래 청각 증강 원격 측정(CHAT) 시스템과 통합됩니다. 이는 합성 휘파람 소리를 특정 물체와 연결함으로써 이루어집니다. CHAT은 WDP가 조지아 공대와 협력하여 개발했습니다.
CHAT에 통합된 돌핀제마의 예측 능력은 시스템을 향상시키는 데 도움이 됩니다. 이는 잠재적으로 돌고래가 인간과 소통할 수 있게 합니다. 예를 들어, 돌고래는 물건을 요청할 수 있고, 연구자들은 그에 따라 응답할 수 있어 초보적 형태의 양방향 의사소통을 만듭니다. 이 기술을 정교화함으로써, 과학자들은 언젠가 돌고래의 자연 언어 구조에 기반한 의미 있는 교류를 할 수 있을 것입니다.
구글은 돌핀제마를 오픈 모델로 공개할 계획이며, 이를 통해 전 세계 연구자들이 모델을 사용하고 돌고래 및 다른 종을 연구하기 위해 적응시킬 수 있습니다. 다른 종의 발성에 맞게 모델을 설정하기 위해서는 약간의 미세 조정이 필요할 것입니다.
"과학적 발견에서 협력의 가치를 인식하여, 우리는 이번 여름에 돌핀제마를 오픈 모델로 공유할 계획입니다. 대서양 얼룩 돌고래 소리에 대해 훈련되었지만, 우리는 병 코돌고래나 회전돌고래와 같은 다른 고래류 종을 연구하는 연구자들에게도 유용할 것으로 예상합니다. 다른, 종의 발성에 대해서는 미세 조정이 필요할 수 있으며, 모델의 개방적 특성이 이러한 적응을 용이하게 합니다."
야생에서 가장 지능적인 생물로 널리 간주되는 돌고래는 우리가 이해한 것보다 훨씬 더 복잡한 의사소통 시스템을 가지고 있을 수 있습니다. 과학자들이 고도로 정교한 음성 패턴을 발견한다면, 이는 우리가 그들의 지능과 상호작용을 바라보는 방식을 재구성할 수 있습니다.
AI는 해양 동물 보호에 중요한 역할을 해왔습니다. 러트거스 대학의 연구자들은 고래 서식지와 이동을 예측하는 AI 기반 도구를 개발하여 대서양을 가로지르는 선박이 고래를 피할 수 있도록 안내합니다. AI가 계속해서 더욱 정교해짐에 따라, 해양 연구 발전과 해양 생물 보호에서 더 큰 역할을 할 것으로 예상됩니다.