Pada tahun 2025, kita akan melihat AI dan machine learning dimanfaatkan untuk membuat kemajuan nyata dalam memahami komunikasi hewan, menjawab pertanyaan yang telah membingungkan manusia selama kita ada: “Apa yang hewan katakan satu sama lain?” Hadiah Coller-Dolittle baru-baru ini, menawarkan hadiah uang hingga setengah juta dolar bagi ilmuwan yang “membobol kode” adalah indikasi dari keyakinan yang optimis bahwa perkembangan teknologi terbaru dalam machine learning dan large language models (LLMs) menempatkan tujuan ini dalam jangkauan kita.
Banyak kelompok penelitian telah bekerja selama bertahun-tahun pada algoritma untuk membuat makna dari suara hewan. Proyek Ceti, misalnya, telah mendekode rangkaian klik paus sperma dan lagu lumba-lumba bungkuk. Alat machine learning modern ini memerlukan jumlah data yang sangat besar, dan sampai saat ini, jumlah yang banyak dan berkualitas tinggi serta data yang diannotasi dengan baik belum tersedia.
Pertimbangkan LLM seperti ChatGPT yang memiliki data latihan yang tersedia untuk mereka yang mencakup seluruh teks yang tersedia di internet. Informasi tentang komunikasi hewan seperti ini belum bisa diakses di masa lalu. Bukan hanya karena korpora data manusia jauh lebih besar dari jenis data yang kami miliki untuk hewan di alam liar: Lebih dari 500 GB kata digunakan untuk melatih GPT-3, dibandingkan dengan sedikit lebih dari 8.000 “codas” (atau vokalisasi) untuk analisis terbaru Proyek Ceti tentang komunikasi paus sperma.
Selain itu, saat bekerja dengan bahasa manusia, kita sudah tahu apa yang dikatakan. Bahkan kita tahu apa yang merupakan “kata,” yang merupakan keuntungan besar dibandingkan dengan interpretasi komunikasi hewan, di mana ilmuwan jarang tahu apakah suara serigala tertentu, misalnya, berarti sesuatu yang berbeda dari suara serigala lainnya, atau bahkan apakah serigala menganggap suara teriakan sebagai suatu “kata” dalam bahasa manusia.
Meskipun begitu, tahun 2025 akan membawa kemajuan baru, baik dalam jumlah data komunikasi hewan yang tersedia bagi ilmuwan, maupun dalam jenis dan kekuatan algoritma AI yang dapat diterapkan pada data tersebut. Perekaman otomatis suara hewan telah ditempatkan dalam jangkauan mudah setiap kelompok penelitian ilmiah, dengan perangkat perekaman berbiaya rendah seperti AudioMoth yang semakin populer.
Dataset besar sekarang tersedia secara online, karena perekam dapat dibiarkan di lapangan, mendengarkan panggilan gibon di hutan atau burung di hutan, 24/7, selama periode waktu yang lama. Ada saat-saat ketika dataset besar tersebut tidak mungkin dikelola secara manual. Sekarang, algoritma deteksi otomatis baru berdasarkan jaringan saraf konvulsional dapat melalui ribuan jam rekaman, memilih suara hewan dan mengelompokkannya ke dalam berbagai jenis, sesuai dengan karakteristik akustik alaminya.
Setelah dataset hewan besar tersebut tersedia, algoritma analitis baru menjadi mungkin, seperti menggunakan jaringan saraf mendalam untuk menemukan struktur tersembunyi dalam urutan vokalisasi hewan, yang mungkin analog dengan struktur bermakna dalam bahasa manusia.
Namun, pertanyaan mendasar yang masih belum jelas adalah, apa sebenarnya yang kita harapkan untuk dilakukan dengan suara hewan ini? Beberapa organisasi, seperti Interspecies.io, menetapkan tujuannya dengan jelas sebagai, “untuk mentransduksi sinyal dari satu spesies ke sinyal yang koheren untuk spesies lain.” Dengan kata lain, untuk menerjemahkan komunikasi hewan ke dalam bahasa manusia. Namun sebagian besar ilmuwan setuju bahwa hewan non-manusia sebenarnya tidak memiliki bahasa yang sesungguhnya—setidaknya tidak dengan cara yang kita manusia memiliki bahasa.
Hadiah Coller Dolittle sedikit lebih canggih, mencari cara “untuk berkomunikasi dengan atau mendekripsi komunikasi organisme.” Mendekripsi adalah tujuan yang sedikit kurang ambisius daripada menerjemahkan, mengingat kemungkinan bahwa hewan mungkin tidak, sebenarnya, memiliki bahasa yang bisa diterjemahkan. Hari ini kita tidak tahu seberapa banyak informasi, atau seberapa sedikit, hewan menyampaikan satu sama lain. Pada tahun 2025, umat manusia akan memiliki potensi untuk melompati pemahaman kita bukan hanya seberapa banyak hewan mengatakan tetapi juga apa sebenarnya yang mereka katakan satu sama lain.