Google이 돌고래와 이야기할 수 있는 AI "Dolphin Gemma"를 개발

 구글이 돌고래의 대화 음성을 생성할 수 있는 AI 'Dolphin Gemma'를 개발했는데, Dolphin Gemma는 구글 스마트폰 픽셀 시리즈 상에서 작동하도록 설계됐으며, 돌고래 소통에 대한 연구에서 성과를 거둘 것으로 기대되고 있다.



돌고래는 구애 시 똑딱거리는 클릭음을 울리거나, 개체마다 고유한 '시그니처 호루라기'를 이용해 서로 부르거나 하는 대화 행동을 취하는 것으로 알려져 있는데, 아래 이미지는 '엄마 돌고래가 새끼 돌고래를 부를 때의 휘슬 소리'를 스펙트로그램화한 것이라고 한다.



돌고래에 대한 연구 프로젝트인 Wild Dolphin Project(WDP)는, 큰돌고래의 특정 집단을 1985년부터 계속 관찰하고 있으며, 돌고래 각 개체의 상세 정보와 연결된 음성 데이터를 대량으로 축적하고 있다. 구글은 자사가 개발하고 있는 기반 모델 'Gemma'와 WDP가 축적해온 데이터를 조합해, 돌고래 울음소리를 생성할 수 있는 AI 모델 'Dolphin Gemma'를 개발했다.


Dolphin Gemma의 파라미터 수는 약 4억으로, 픽셀 시리즈에서 작동하도록 설계되었고, Dolphin Gemma에서 생성한 휘슬(왼쪽)과 버스트 펄스(오른쪽)의 스펙트로그램은 이런 느낌.



DolphinGemma는 WDP가 개발하는 수중 디바이스 'CHAT(Cetacean Hearing and Telemetry)'에서 활용되고, CHAT는 '이미 알려진 돌고래 언어를 인간용으로 번역하는 기능'이나 '돌고래용으로 설계한 음성을 수중에서 발하는 기능'등을 갖추고 있어, 돌고래와 인간의 쌍방향 커뮤니케이션을 가능하게 하는 것을 목표로 개량이 계속되고 있다.


CHAT의 용례는 이런 느낌인데, 먼저 돌고래의 놀잇감이 되는 스카프를 든 상태에서 두 사람의 인간이 돌고래에게 다가간다.



돌고래가 인간을 보고 있는 상태에서, 한 사람이 CHAT에서 음성을 내고, 다른 사람으로부터 스카프를 받는다.


이 모습을 목격한 돌고래는 '저 소리를 내면 스카프를 받을 수 있다'고 학습하는 것. 현 시점에서는 CHAT의 컴퓨터에는 Pixel 6가 이용되고 있다고 하고, 이미 Pixel 9를 탑재한 CHAT의 개발이 진행되고 있어, 2025년 여름에는 Pixel 9와 Dolphin Gemma를 이용한 연구가 시작될 예정이다.

Previous
Next Post »