Lompatan Besar Google: Suaramu Direka dalam Terjemahan Langsung

Saya sudah kehilangan hitungan berapa kali saya dijanjikan terobosan berikutnya dalam dunia penerjemahan berbasis aplikasi. Sejak era Google Translate dimulai, rasanya perusahaan teknologi (bukan cuma Google, tapi juga Samsung dan Apple) terus menggodai masa depan di mana ucapan bisa diterjemahkan secara instan, memungkinkan komunikasi yang hampir mulus antara orang-orang dari *suara SpongeBob sarkastik* seluruh dunia. Namun kenyataannya, masa depan itu, seberapa menarik pun di atas kertas, belum juga terwujud.

Sebegitu hebatnya aplikasi-aplikasi ini dalam menerjemahkan ucapan dan teks dengan akurasi yang cukup tinggi, mereka masih belum sanggup menyamai kecepatan dan irama percakapan dunia nyata. Merancang alat penerjemah yang bisa mengimbangi kecepatan bicara kita (yang, ya, bicara beneran) bukanlah hal yang mudah. Kita bicara cepat, dan kita mengharapkan respons yang lebih cepat lagi, yang membuat penerjemahan langsung bukan seperti maraton tapi lebih seperti lari sprint, atau mungkin lebih tepatnya, sprint yang panjangnya bisa sepanjang maraton.

Mengingat janji lama akan penerjemahan waktu-nyata yang cepat dan berguna itu, saya sudah terkondisikan untuk menggelengkan kepala setiap kali fitur terjemahan langsung muncul di sebuah keynote, persis seperti yang saya lakukan selama acara tahunan hardware Pixel Google. Namun tahun ini, gelengan kepala itu mungkin tidak perlu terjadi. Dalam keynote Made by Google, Google memamerkan sebuah fitur yang tidak hanya menerjemahkan ucapan Anda secara real-time, tetapi juga membuat deepfake suara asli Anda (juga hampir real-time) sehingga lawan bicara dapat mendengar Anda berbicara dalam bahasa mereka. Dan iya, ini juga berlaku sebaliknya. Benar, dua deepfake yang saling bicara; tidak ada yang aneh di sini, folks.

Dan yang lebih gilanya, Google begitu yakin dengan fitur terjemahan langsung barunya sehingga mereka menampilkan demo langsung, yang, jujur saja… mereka berhasil? Editor Senior Gizmodo untuk Consumer Tech, Raymond Wong, merekam seluruhnya secara langsung di keynote Google. Untuk hiburan Anda, suara Jimmy Fallon yang dideepfake ke dalam bahasa Spanyol:

MEMBACA  Di Dalam Dunia Bitcoin yang Tersembunyi di Austin

Wow, suara Jimmy Fallon diterjemahkan—dideepfake—ke bahasa Spanyol di Pixel 10… dan itu bekerja dengan cepat dan akurat. Bahkan menangkap infleksi dengan benar. Ini adalah fitur AI yang mengubah permainan secara diam-diam… terjemahan pic.twitter.com/SAXeowCXpE

— Ray Wong (@raywongy) August 20, 2025

Saya juga menyaksikan segment ini dari rumah, dan pasangan saya, yang penutur bahasa Spanyol dan bilingual, mengonfirmasi bahwa fitur terjemahan AI baru Google tampaknya berhasil dengan sempurna, termasuk infleksinya. Jangan salah, saya masih ingin menguji fitur terjemahan itu sendiri, tetapi dari penampakannya, Google memulai dengan sangat baik disini.

Yang menggerakkan kemampuan terjemahan ini adalah Gemini Nano, versi ringkas dari model bahasa besar Google yang terus diiterasi dan chip Tensor G5 Pixel 10. Google mengatakan model Nano dan fitur terjemahannya dalam kasus ini dijalankan secara on-device, yang berarti tidak ada apa pun—termasuk panggilan Anda—yang dikirim ke cloud saat Anda menerjemahkan. Itu membuat fitur barunya kurang ‘jijik’, dan saya bilang “kurang” karena jujur saja, fitur ini tetap saja mendeepfake suara Anda.

Sejujurnya, jika fitur terjemahan baru Google ini tidak berjalan on-device, saya mungkin akan sedikit khawatir. Sekeren apapun itu, pemikiran tentang memiliki tiruan suara Anda yang disimpan di server suatu tempat adalah ide yang buruk, mengingat fakta bahwa orang menggunakan biometrik untuk semua jenis keamanan digital penting, termasuk perbankan. Dan bagaimanapun, on-device atau tidak, fitur ini tetap terasa menyeramkan. Rupanya kita sudah berada di tahap deepfake suara instan. Bayangkan saja apa yang bisa AI lakukan dengan sedikit waktu dan pelatihan.

Tapi lebih dari segalanya, saya terkesan dengan apa yang Google pamerkan hari ini, terutama sebagai seseorang yang telah menyaksikan perusahaan teknologi menjanjikan terlalu banyak tentang fitur terjemahan selama bertahun-tahun. Masih terlalu dini untuk menyatakan bahwa Google telah menemukan ‘Holy Grail’ dari terjemahan waktu-nyata, tetapi untuk sekali ini, saya merasa bahwa gagasan tentang terjemahan mulus berbasis ponsel telah membuat lompatan besar. Jadi, anggap gelengan kepala saya secara resmi dicabut, Google.

MEMBACA  Film Dokumenter Titan Baru Masuk 10 Besar Netflix, tapi Ada Film Titan Lain yang Wajib Ditonton