AI baru Google sedang mencoba berbicara dengan lumba-lumba—Serius

Dalam kolaborasi yang terdengar langsung dari sci-fi tapi sangat berlandaskan dekade ilmu kelautan, Google telah bekerja sama dengan ahli biologi laut dan peneliti AI untuk membangun model bahasa besar yang dirancang bukan untuk berbicara dengan manusia, tetapi dengan lumba-lumba.

Model tersebut adalah DolphinGemma, sebuah LLM mutakhir yang dilatih untuk mengenali, memprediksi, dan akhirnya menghasilkan vokalisasi lumba-lumba, dalam upaya bukan hanya untuk membongkar kode bagaimana mamalia laut berkomunikasi satu sama lain—tetapi juga bagaimana kita mungkin dapat berkomunikasi dengan mereka sendiri. Dikembangkan dalam kemitraan dengan Proyek Lumba-lumba Liar (WDP) dan peneliti di Georgia Tech, model ini mewakili tonggak terbaru dalam pencarian yang telah berlangsung selama lebih dari 40 tahun.

Menyelam dalam komunitas lumba-lumba

Sejak tahun 1985, WDP telah menjalankan studi bawah air lumba-lumba terpanjang di dunia. Proyek ini menyelidiki kelompok lumba-lumba bintang Atlantik liar (S. frontalis) di Bahama. Selama beberapa dekade, tim telah mengumpulkan data audio dan video di bawah air secara non-invasif yang terkait dengan lumba-lumba individu di kelompok tersebut, mendetailkan aspek hubungan dan sejarah kehidupan hewan-hewan tersebut.

Proyek ini telah menghasilkan kumpulan data luar biasa—yang dipenuhi dengan 41 tahun pasangan suara-perilaku seperti desisan kencan, suara berisik agresif yang digunakan dalam konfrontasi cetacea, dan “whistle tanda tangan” yang bertindak sebagai nama panggilan lumba-lumba.

Harta karun vokalisasi yang diberi label ini memberikan para peneliti Google apa yang mereka butuhkan untuk melatih model AI yang dirancang untuk suara lumba-lumba seperti yang dilakukan ChatGPT untuk kata-kata. Dengan demikian, DolphinGemma lahir: model berparameter sekitar 400 juta yang dibangun di atas penelitian yang sama yang mendorong model Gemini Google.

MEMBACA  Google Tampaknya Menambahkan 'Emoji Audio,' Termasuk Suara Kentut, ke Android. Begini Cara Menggunakannya

DolphinGemma adalah audio-masuk, audio-keluar—model ini “mendengarkan” vokalisasi lumba-lumba dan memprediksi suara apa yang akan datang berikutnya—pada dasarnya mempelajari struktur komunikasi lumba-lumba.

AI dan komunikasi hewan

Model kecerdasan buatan sedang mengubah tingkat dimana para ahli dapat mendekripsi komunikasi hewan. Semuanya di bawah matahari—dari gonggongan anjing dan teriakan burung—dengan mudah dimasukkan ke dalam model bahasa besar yang kemudian dapat menggunakan pengenalan pola dan konteks yang relevan untuk menyaring informasi dan menduga apa yang hewan tersebut “katakan.”

Tahun lalu, para peneliti di Universitas Michigan, Institut Nasional Astrofisika Meksiko, dan Institut Optik dan Elektronika menggunakan model ucapan AI untuk mengidentifikasi emosi anjing, jenis kelamin, dan identitas dari dataset gonggongan.

Cetacea, sebuah kelompok yang mencakup lumba-lumba dan paus, adalah target yang sangat baik untuk interpretasi AI karena gaya hidup dan cara mereka berkomunikasi. Pertama, paus dan lumba-lumba adalah makhluk sosial yang canggih, yang berarti bahwa komunikasi mereka penuh dengan nuansa. Tetapi klik dan bersiul tajam yang digunakan hewan tersebut untuk berkomunikasi juga mudah direkam dan dimasukkan ke dalam model yang bisa membongkar “tata bahasa” suara hewan itu. Mei lalu, misalnya, organisasi nirlaba Project CETI menggunakan alat perangkat lunak dan pembelajaran mesin pada perpustakaan 8.000 kode paus sperma, dan menemukan pola irama dan tempo yang memungkinkan para peneliti membuat alfabet fonetik paus tersebut.

Berbicara dengan lumba-lumba dengan smartphone

Model DolphinGemma dapat menghasilkan suara baru, seperti lumba-lumba dalam pola akustik yang benar, yang potensial membantu manusia terlibat dalam percakapan bolak-balik dengan lumba-lumba secara real-time. Komunikasi dua arah ini bergantung pada apa yang disebut blog Google sebagai Telemetri Peningkatan Pendengaran Cetacea, atau CHAT—komputer bawah air yang menghasilkan suara lumba-lumba yang sistem ini asosiasikan dengan objek yang disukai lumba-lumba dan sering berinteraksi dengan mereka, termasuk rumput laut dan syal para peneliti.

MEMBACA  Seni Star Wars Ini Menuntut Anda untuk Menatap Mata Jar Jar Binks

“Dengan mendemonstrasikan sistem antara manusia, para peneliti berharap lumba-lumba yang secara alami ingin tahu akan belajar meniru peluit untuk meminta barang-barang ini,” seperti yang dinyatakan dalam blog Kata Kunci Google. “Pada akhirnya, ketika lebih banyak suara alami lumba-lumba dipahami, mereka juga dapat ditambahkan ke dalam sistem.”

CHAT terpasang di ponsel pintar yang dimodifikasi, dan gagasan para peneliti adalah menggunakan sistem ini untuk membuat kosakata bersama dasar antara lumba-lumba dan manusia. Jika lumba-lumba meniru peluit sintetis yang terkait dengan mainan, seorang peneliti dapat merespons dengan memberikannya—semacam charades lumba-lumba, dengan teknologi baru yang bertindak sebagai perantara.

Iterasi masa depan CHAT akan mengemas lebih banyak daya pemrosesan dan algoritma yang lebih cerdas, memungkinkan respon yang lebih cepat dan interaksi yang lebih jelas antara lumba-lumba dan rekan-rekan manusia mereka. Tentu saja, hal ini mudah diucapkan untuk lingkungan terkendali—tapi menimbulkan beberapa pertimbangan etis serius tentang cara berinteraksi dengan lumba-lumba di alam liar jika metode komunikasi menjadi lebih canggih.

Sebuah musim panas ilmu lumba-lumba

Google berencana untuk merilis DolphinGemma sebagai model terbuka musim panas ini, memungkinkan para peneliti yang mempelajari spesies lain, termasuk lumba-lumba botol atau lumba-lumba putar, untuk menerapkannya secara lebih luas. DolphinGemma bisa menjadi langkah signifikan untuk para ilmuwan lebih memahami salah satu wajah mamalia laut yang paling akrab.

Kita belum sepenuhnya siap untuk sebuah pidato TED lumba-lumba, tetapi kemungkinan komunikasi dua arah adalah indikator menarik dari apa yang model AI bisa membuat mungkin.