Følg oss her

AI

Nå forstår AI delfinspråk

Google har lansert en ny AI-modell kalt DolphinGemma, utviklet for å tolke hvordan delfiner kommuniserer – med et langsiktig mål om å muliggjøre kommunikasjon mellom arter.

Publisert

d.

Foto: Shutterstock

Delfiners klikk, fløytelyder og pulserende signaler har i mange år fascinert forskere. Ambisjonen har vært å avdekke mønstrene i disse komplekse lydsekvensene. I samarbeid med ingeniører ved Georgia Institute of Technology og basert på feltarbeid fra Wild Dolphin Project (WDP), har Google utviklet DolphinGemma som et verktøy for å nå dette målet.

Les også: OpenAI lanserer ny supermodell – kan lese og huske enorme tekstmengder

DolphinGemma ble lansert i forbindelse med National Dolphin Day og er en grunnleggende AI-modell spesialisert på å lære strukturen i delfiners lyder. Modellen kan til og med generere nye lyder som ligner naturlig delfin-kommunikasjon. Det skriver mediet ainews.

Wild Dolphin Project har siden 1985 drevet verdens lengste sammenhengende undervannsstudie av delfiner. Gjennom flere tiår har prosjektet samlet kunnskap om kontekstspesifikke lyder, som:

  • Signaturfløytelyder: Unike lydsignaler som fungerer som individuelle «navn» og er sentrale i sosiale interaksjoner, for eksempel når en mor gjenforenes med sin kalv.
  • Pulserende «skvattelyder»: Typisk knyttet til konflikt eller aggressiv atferd.
  • Klikkelyder: Ofte brukt under kurtise eller når delfiner jakter på haier.

Denne langvarige innsatsen har gitt grunnlaget for å trene avanserte AI-modeller som DolphinGemma.

Et AI-øre for delfiners lyder

Å analysere det enorme omfanget og kompleksiteten i delfiners kommunikasjon er en oppgave som egner seg spesielt godt for kunstig intelligens.

DolphinGemma bruker spesialiserte lydteknologier, blant annet SoundStream-tokenisering, for å representere delfinlyder effektivt. Deretter behandles disse dataene i en modell som er skreddersydd for komplekse sekvensanalyser.

Modellen er basert på teknologi fra Googles Gemma-familie av lette modeller (som deler teknologi med de kraftigere Gemini-modellene). DolphinGemma fungerer som et system der lydsekvenser mates inn og nye lydsekvenser genereres.

Ved å trene på omfattende datasett fra Wild Dolphin Project lærer modellen å identifisere mønstre og forutsi sannsynlige påfølgende lyder – på samme måte som språkmodeller for mennesker forutser neste ord i en setning.

Med rundt 400 millioner parametre er DolphinGemma optimalisert for å kunne kjøres effektivt på enheter som Googles Pixel-smarttelefoner, som WDP bruker til datainnsamling i felt.

Når WDP nå begynner å bruke modellen aktivt i feltarbeidet, forventes det å gi et betydelig løft i forskningen ved å identifisere mønstre og strukturer som tidligere krevde omfattende manuell analyse.

CHAT-systemet og toveis interaksjon

Samtidig som DolphinGemma fokuserer på å forstå naturlig delfinkommunikasjon, pågår det også arbeid med å utvikle systemer for aktiv toveis interaksjon.

CHAT (Cetacean Hearing Augmentation Telemetry) er et prosjekt utviklet av WDP i samarbeid med Georgia Tech. Her forsøker man å etablere et felles, forenklet vokabular i stedet for å oversette delfiners naturlige språk direkte.

Systemet skaper kunstige fløytelyder som knyttes til spesifikke objekter delfinene liker, som for eksempel skjerf eller tang. Målet er at delfinene, drevet av sin naturlige nysgjerrighet, skal lære å imitere disse lydene for å be om gjenstandene.

På lengre sikt kan naturlige lyder, forstått gjennom modeller som DolphinGemma, bli integrert i dette interaktive rammeverket.

Bruk av Google Pixel i havforskning

En viktig faktor bak både analysen av naturlige lyder og CHAT-systemet er mobil teknologi. Google Pixel-telefoner fungerer som prosesseringsenheter for lyddata i sanntid, selv i utfordrende undervannsmiljøer.

Pixel-telefonene brukes blant annet til å:

  • Registrere imitasjonsforsøk blant bakgrunnsstøy.
  • Identifisere hvilken spesifikk lyd som ble brukt.
  • Varsle forskeren via beinledende hodetelefoner under vann.

Dette gjør det mulig for forskeren å raskt respondere med riktig objekt og forsterke assosiasjonen delfinen har lært. Den kommende generasjonen av CHAT-systemet, planlagt for sommeren 2025, vil ta i bruk Pixel 9, som skal kunne håndtere både dyp læring og malbaserte algoritmer parallelt for enda bedre ytelse.

Bruken av kommersielt tilgjengelige smarttelefoner reduserer behovet for dyrt spesialutstyr, gjør systemene lettere å vedlikeholde, og kutter strømforbruket.

Fremtidig tilgjengelighet

Google planlegger å gjøre DolphinGemma tilgjengelig som en åpen modell senere i 2025. Selv om den foreløpig er trent på lyder fra flekkdelfiner i Atlanterhavet, kan arkitekturen potensielt tilpasses andre hvalarter med justeringer.

Målet er å gi forskere over hele verden tilgang til kraftige verktøy for å analysere sine egne akustiske datasett, og slik bidra til en raskere samlet fremgang i forståelsen av disse intelligente havpattedyrene.

Dette markerer et viktig skritt fra passiv lytting til aktiv tolkning – og kanskje bringer vi en dag vår egen art litt nærmere ekte kommunikasjon med delfiner.

Les også: Lag dine egne videoklipp med kunstig intelligens

Annonse