Serak, trills, growls, huuuuu, squawks. Hewan berbicara dengan berbagai cara, namun manusia baru saja menggores permukaan bagaimana mereka berkomunikasi satu sama lain dan dengan dunia hidup lainnya. Spesies kita telah melatih beberapa hewan—dan jika Anda bertanya pada kucing, hewan juga telah melatih kita—namun kita belum benar-benar memecahkan kode komunikasi lintas spesies.
Semakin banyak, peneliti hewan menggunakan kecerdasan buatan untuk mempercepat penyelidikan kami tentang komunikasi hewan—baik dalam spesies maupun antara cabang-cabang di pohon kehidupan. Saat ilmuwan mengungkap sistem komunikasi hewan yang kompleks, mereka semakin mendekati pemahaman tentang apa yang dikatakan makhluk-makhluk itu—bahkan mungkin bagaimana berbicara balik. Namun, saat kami mencoba untuk menjembatani kesenjangan linguistik antara manusia dan hewan, beberapa ahli mengungkapkan kekhawatiran yang valid tentang apakah kemampuan tersebut sesuai—atau apakah kita bahkan seharusnya mencoba berkomunikasi dengan hewan sama sekali.
Menggunakan AI untuk mengurai bahasa hewan
Menuju ke depan dari pak—atau seharusnya pod?—adalah Proyek CETI, yang telah menggunakan pembelajaran mesin untuk menganalisis lebih dari 8.000 “kode” paus sperma—pola klik terstruktur yang direkam oleh Proyek Paus Sperma Dominika. Peneliti mengungkapkan struktur kontekstual dan kombinatorial dalam klik paus, memberi nama fitur seperti “rubato” dan “ornamentasi” untuk menjelaskan bagaimana paus dengan halus menyesuaikan vokalisasi mereka selama percakapan. Pola-pola ini membantu tim menciptakan semacam alfabet fonetik untuk hewan tersebut—sistem yang ekspresif dan terstruktur yang mungkin bukan bahasa sebagaimana yang kita ketahui tetapi mengungkap tingkat kompleksitas yang sebelumnya tidak disadari oleh para peneliti. Proyek CETI juga sedang mengerjakan pedoman etika untuk teknologi tersebut, sebuah tujuan kritis mengingat risiko penggunaan AI untuk “berbicara” dengan hewan.
Sementara itu, Google dan Proyek Lumba-Lumba Liar baru-baru ini memperkenalkan DolphinGemma, sebuah model bahasa besar (LLM) yang dilatih pada 40 tahun vokalisasi lumba-lumba. Sama seperti ChatGPT adalah LLM untuk input manusia—mengambil informasi visual seperti makalah penelitian dan gambar dan menghasilkan respons terhadap pertanyaan yang relevan—DolphinGemma mengonsumsi data suara lumba-lumba dan memprediksi vokalisasi apa yang akan datang. DolphinGemma bahkan dapat menghasilkan suara mirip lumba-lumba, dan sistem dua arah prototipe para peneliti, Cetacean Hearing Augmentation Telemetry (secara tepat, CHAT), menggunakan antarmuka berbasis smartphone yang digunakan lumba-lumba untuk meminta barang seperti syal atau rumput laut—mungkin membentuk dasar bagi dialog lintas spesies di masa depan.
“DolphinGemma digunakan di lapangan musim ini untuk meningkatkan pengenalan suara real-time kami di sistem CHAT,” kata Denise Herzing, pendiri dan direktur Proyek Lumba-Lumba Liar, yang memimpin pengembangan DolphinGemma bekerja sama dengan para peneliti di Google DeepMind, dalam sebuah email kepada Gizmodo. “Musim gugur ini kami akan menghabiskan waktu untuk mencerna vokalisasi lumba-lumba yang sudah diketahui dan biarkan Gemma menunjukkan pola ulang apa pun yang mereka temukan,” seperti vokalisasi yang digunakan dalam kencan dan disiplin induk-anak.
Dengan cara ini, tambah Herzing, aplikasi AI tersebut memiliki dua tujuan: Peneliti dapat menggunakannya baik untuk mengeksplorasi suara alami lumba-lumba maupun untuk lebih memahami respons hewan terhadap peniruan suara lumba-lumba manusia, yang diproduksi secara sintetis oleh sistem CHAT AI.
Memperluas alat AI hewan
Di luar lautan, peneliti menemukan bahwa model pidato manusia dapat dimanfaatkan kembali untuk mendekode sinyal hewan darat, juga. Sebuah tim yang dipimpin oleh Universitas Michigan menggunakan Wav2Vec2—sebuah model pengenalan pidato yang dilatih pada suara manusia—untuk mengidentifikasi emosi, jenis kelamin, ras anjing, dan bahkan identitas individu berdasarkan gonggongan mereka. Model manusia yang sudah dilatih melampaui versi yang hanya dilatih pada data anjing, menunjukkan bahwa arsitektur model bahasa manusia dapat sangat efektif dalam mendekode komunikasi hewan.
Tentu saja, kita perlu mempertimbangkan tingkat kecanggihan yang berbeda dari model AI ini. Menentukan apakah gonggongan anjing bersifat agresif atau bermain-main, atau apakah itu jantan atau betina—hal-hal ini mungkin lebih mudah dimengerti oleh model daripada, katakanlah, makna halus yang terkandung dalam fonetika paus sperma. Namun demikian, setiap studi ini menggerakkan ilmuwan lebih dekat untuk memahami bagaimana alat AI, sebagaimana yang ada saat ini, dapat diterapkan dengan baik dalam bidang yang begitu luas ini—dan memberikan kesempatan bagi AI untuk melatih dirinya sendiri menjadi bagian dari toolkit peneliti yang lebih berguna.
Dan bahkan kucing—sering dianggap sombong—tampaknya lebih komunikatif daripada yang mereka tunjukkan. Dalam studi 2022 dari Universitas Paris Nanterre, kucing menunjukkan tanda-tanda jelas mengenali suara pemiliknya, namun selain itu, kucing tersebut merespons lebih intens ketika diajak berbicara langsung dengan “bahasa kucing.” Itu menunjukkan bahwa kucing tidak hanya memperhatikan apa yang kita katakan, tetapi juga bagaimana kita mengatakannya—terutama ketika itu datang dari seseorang yang mereka kenal.
Pekan lalu, sepasang peneliti cumi-cumi menemukan bukti bahwa hewan-hewan tersebut memiliki empat “gelombang,” atau gerakan fisik, yang mereka tunjukkan satu sama lain, serta pemutaran kembali manusia gelombang cumi-cumi. Kelompok tersebut berencana untuk menerapkan algoritma untuk mengategorikan jenis gelombang, secara otomatis melacak gerakan makhluk-makhluk tersebut, dan memahami konteks di mana hewan-hewan tersebut mengekspresikan diri mereka lebih cepat.
Perusahaan swasta (seperti Google) juga turut serta. Minggu lalu, mesin pencari terbesar China, Baidu, mengajukan paten dengan administrasi kekayaan intelektual negara itu yang mengusulkan untuk menerjemahkan vokalisasi hewan (khususnya kucing) menjadi bahasa manusia. Secara singkat, teknologi ini akan mengonsumsi sejumlah data dari kucing Anda, dan kemudian menggunakan model AI untuk menganalisis data, menentukan keadaan emosional hewan, dan menghasilkan pesan bahasa manusia yang nampak yang ingin disampaikan hewan peliharaan Anda.
Penerjemah universal untuk hewan?
Secara bersamaan, studi-studi ini mewakili pergeseran besar dalam pendekatan ilmuwan terhadap komunikasi hewan. Alih-alih mulai dari awal, tim peneliti membangun alat dan model yang dirancang untuk manusia—dan membuat kemajuan yang mungkin akan membutuhkan waktu jauh lebih lama sebaliknya. Tujuan akhirnya bisa (baca: bisa) menjadi semacam Batu Rosetta untuk kerajaan hewan, didukung oleh AI.
“Kita sudah sangat baik dalam menganalisis bahasa manusia hanya dalam lima tahun terakhir, dan kita mulai menyempurnakan praktik mentransfer model yang dilatih pada satu set data dan menerapkannya pada data baru,” kata Sara Keen, seorang ekolog perilaku dan insinyur listrik di Proyek Spesies Bumi, dalam panggilan video dengan Gizmodo.
Proyek Spesies Bumi berencana meluncurkan model bahasa audio unggulan mereka untuk suara hewan, NatureLM, tahun ini, dan demo untuk NatureLM-audio sudah live. Dengan data input dari seluruh pohon kehidupan—serta pidato manusia, suara lingkungan, dan bahkan deteksi musik—model tersebut bertujuan untuk menjadi konverter pidato manusia menjadi analog hewan. Model ini “menunjukkan transfer domain yang menjanjikan dari pidato manusia ke komunikasi hewan,” proyek tersebut menyatakan, “mendukung hipotesis kami bahwa representasi bersama dalam AI dapat membantu mendekode bahasa hewan.”
“Sebagian besar pekerjaan kami benar-benar mencoba untuk mengubah cara orang berpikir tentang tempat kita di dunia,” tambah Keen. “Kami menemukan penemuan-penemuan keren tentang komunikasi hewan, tetapi pada dasarnya kami menemukan bahwa spesies lain sama rumit dan nuansanya seperti kita. Dan pengungkapan itu cukup menggembirakan.”
Dilema etika
Memang, para peneliti umumnya setuju tentang janji alat berbasis AI untuk meningkatkan pengumpulan dan interpretasi data komunikasi hewan. Namun beberapa merasa bahwa ada ketidakcocokan dalam komunikasi antara keakraban ilmiah itu dan persepsi publik tentang bagaimana alat-alat ini dapat diterapkan.
“Saya pikir saat ini ada banyak ketidaktahuan dalam liputan topik ini—bahwa entah bagaimana pembelajaran mesin dapat menciptakan pengetahuan kontekstual ini dari hampa. Bahwa selama Anda memiliki ribuan jam rekaman audio, entah bagaimana kotak hitam sihir pembelajaran mesin dapat memeras arti dari itu,” kata Christian Rutz, seorang ahli perilaku dan kognisi hewan dan presiden pendiri International Bio-Logging Society, dalam panggilan video dengan Gizmodo. “Itu tidak akan terjadi.”
“Arti datang melalui penjelasan kontekstual dan inilah di mana saya pikir sangat penting bagi bidang ini secara keseluruhan, di periode kegembiraan dan antusiasme ini, untuk tidak lupa bahwa penjelasan ini berasal dari ekologi perilaku dasar dan keahlian sejarah alam,” tambah Rutz. Dengan kata lain, mari kita tidak meletakkan kuda di depan kereta, terutama karena kereta—dalam hal ini—adalah apa yang mendorong kuda tersebut.
Namun dengan kekuatan besar… Anda tahu klikenya. Pada dasarnya, bagaimana manusia dapat mengembangkan dan menerapkan teknologi ini dengan cara yang tidak hanya memberikan pencerahan ilmiah tetapi juga meminimalkan kerusakan atau gangguan bagi subjek hewan itu? Para ahli telah menyarankan standar etika dan guardrails untuk menggunakan teknologi tersebut yang memprioritaskan kesejahteraan makhluk saat kita semakin dekat dengan—nah, ke mana pun teknologi itu akan pergi.
Saat AI maju, pembicaraan tentang hak-hak hewan harus berkembang. Di masa depan, hewan bisa menjadi peserta aktif dalam pembicaraan itu—suatu gagasan yang para ahli hukum mengeksplorasi sebagai latihan pemikiran, tetapi suatu saat bisa menjadi kenyataan.
“Yang sangat kami butuhkan—selain dari memajukan sisi pembelajaran mesin—adalah membangun kolaborasi yang bermakna antara para ahli pembelajaran mesin dan peneliti perilaku hewan,” kata Rutz, “karena hanya ketika Anda menyatukan dua hal itu, Anda punya kesempatan.”
Tidak ada kekurangan data komunikasi untuk dimasukkan ke dalam model AI yang rakus data, dari suara tikus prairie yang sempurna hingga jejak lendir siput (ya, sungguh). Namun persis bagaimana kita memanfaatkan informasi yang kita peroleh dari pendekatan baru ini memerlukan pertimbangan etika yang matang yang terlibat dalam “berbicara” dengan hewan.
Sebuah makalah terbaru tentang kekhawatiran etika menggunakan AI untuk berkomunikasi dengan paus merinci enam area masalah utama. Ini termasuk hak privasi, kerusakan budaya dan emosional pada paus, antropom