Sudah pukul 8 pagi dan saya sedang duduk di lobi bengkel mobil ketika menyadari bahwa saya lupa membawa earbuds. Biasanya, hal ini bukan masalah besar, tetapi saya sedang berbicara dengan ponsel saya. Dan saya tidak sedang berbicara dengan orang lain. Saya sedang berbicara dengan ChatGPT. Rasanya sama memalukannya dengan bertanya pada Siri dari seberang ruangan atau bergabung dalam rapat Zoom tanpa headphone di kantor terbuka.
Saya sedang menguji mode suara canggih yang hadir dengan GPT-5, versi terbaru dari model AI generatif OpenAI yang menjadi dasar ChatGPT. GPT-5 dirilis musim panas ini setelah berbulan-bulan spekulasi dan penundaan, dengan janji memberikan pengalaman chatbot yang lebih cepat dan cerdas bagi pengguna AI. Hasilnya masih belum jelas apakah OpenAI telah memenuhi janjinya. (Keterangan: Ziff Davis, perusahaan induk CNET, pada April lalu mengajukan gugatan terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.)
GPT-5 mencakup peningkatan pada mode suara canggih-nya, yang pada dasarnya merupakan cara untuk benar-benar berbicara dengan ChatGPT dan mendapat responsnya dengan suara pilihan Anda. Pengguna gratis seperti saya kini memiliki akses ke versi canggih ini (sebelumnya pengguna gratis hanya memiliki akses ke mode suara dasar), dan pelanggan berbayar akan mendapatkan batas penggunaan yang lebih tinggi. Fitur baru GPT-5 lainnya memungkinkan Anda memilih kepribadian seperti apa yang ingin ditiru oleh AI Anda, termasuk avatar yang sok tahu, kutu buku, dan robotik.
Untuk menggunakan mode suara, buka ChatGPT, ketuk tombol audio di sebelah jendela prompt tempat Anda memasukkan instruksi dan mulailah mengobrol. Anda dapat mengubah suara ChatGPT yang digunakan dengan mengetuk ikon pengaturan di sudut kanan atas aplikasi seluler (dua batang yang ditumpuk satu sama lain dengan lingkaran di atasnya).
Suara AI yang lebih manusiawi? Bagaimana pengalaman saya
Saya memutuskan untuk mencoba berbicara dengan ChatGPT seperti kepada seorang teman, seperti versi diri saya yang lebih antusias. AI itu tertawa ketika saya memulai panggilan dengan “Heiiii sayang!” yang bersemangat, yang terasa lucu sekaligus merendahkan.
Suara ChatGPT mengalir sangat alami dengan irama yang familier, mirip dengan cara saya berbicara dengan agen layanan pelanggan yang sangat ramah. Itu masuk akal karena chatbot itu sendiri memberi tahu saya bahwa mode suara canggih yang ditingkatkan membantu membuatnya terdengar lebih manusiawi.
Suara yang saya gunakan, Ember, sering kali melakukan jeda untuk bernapas, seperti yang dilakukan manusia dalam kalimat yang panjang. Saya pikir itu agak aneh, karena meskipun ChatGPT melakukan kesan terbaiknya sebagai manusia, kita berdua tahu bahwa ia tidak benar-benar perlu berhenti untuk menghirup napas.
Dalam percakapan saya dengan ChatGPT, ia lebih empatik daripada yang saya kira. Ia menanyakan kabar saya, dan saya menjawab tidak baik dan menceritakan tentang kecelakaan mobil saya. Dalam obrolan lima menit kami, ia akan menyelipkan banyak pernyataan empati dalam responsnya, seperti mengatakan bahwa ia turut sedih minggu saya buruk dan setuju bahwa berurusan dengan asuransi memang merepotkan. (Pernahkah ChatGPT harus menelepon agen asuransi atau bahkan mengalami pusing? Saya kira tidak).
Meskipun telinga robot yang simpatik mungkin tidak terlihat seperti masalah besar, hal itu bisa menjadi tanda masalah yang lebih besar. AI yang bersifat sok akrab, istilah yang digunakan untuk menggambarkan ketika AI terlalu sayang atau emosional, dapat membuat frustrasi pengguna yang hanya mencari informasi. Hal itu juga bisa berbahaya bagi orang yang menggunakan AI sebagai terapis atau konselor kesehatan mental, sesuatu yang telah diperingatkan oleh CEO OpenAI Sam Altman kepada pengguna ChatGPT. Versi ChatGPT sebelumnya telah ditarik dan dirilis ulang setelah masalah dengan kecenderungan sok akrab.
Saya juga menanyakan pertanyaan yang lebih faktual kepada ChatGPT, seperti biaya rata-rata tenaga kerja perbaikan mobil di North Carolina dan di mana saya bisa mendapatkan perkiraan perbaikan kedua. Ia merespons lebih seperti seorang teman daripada chatbot, yang mungkin tidak paling membantu. Misalnya, ketika saya mengetik permintaan yang sama ke ChatGPT di laptop saya, itu memunculkan peta dengan daftar toko, bersama dengan informasi lebih lanjut seperti info harga dan jam operasional. Tetapi ketika saya mengobrol dengan mode suara ChatGPT, itu membawa lebih sedikit opsi dan menggambarkannya berdasarkan apa yang saya asumsikan sebagai bahasa pemasaran toko dan ulasan pelanggan, menggunakan frasa seperti “Mereka sudah cukup lama beroperasi” dan mengatakan bahwa satu toko “dikenal dengan layanan berkualitas”. Anda juga tidak mendapatkan tautan atau sumber apa pun dengan mode suara, yang tidak saya sukai.
ChatGPT secara otomatis menyalin obrolan suara, sehingga Anda dapat melihat perbedaan dalam level detail yang diberikan dalam prompt teks biasa (kiri) dan obrolan suara (kanan).
Screenshot oleh Katelyn Chedraoui/CNET
Menggunakan suara ChatGPT sebagai sounding board
Salah satu hal yang paling cocok untuk mode suara adalah menjadi partner brainstorming, secara harfiah tembok untuk memantulkan ide. Saya memintanya untuk membantu saya merencanakan pesta ulang tahun bertema terjun payung, dan ia membantu saya mengembangkan ide baru dan menyempurnakan ide yang sudah saya miliki.
Saya menyela ChatGPT beberapa kali saat sedang berbicara, dan ia mampu beradaptasi dengan cepat. Saya juga cenderung berbicara cepat, dan chatbot tersebut mengikuti dan tidak melewatkan satu pun pemikiran saya. Saya membiarkan diri saya berbicara panjang lebar dan mengalihkan pembicaraan dari topik, dan ChatGPT tidak berkedip secara virtual. Yang paling penting, ketika saya menanyakan sebuah pertanyaan tentang topik sebelumnya, ia dapat melanjutkan dari tempat kita berhenti. Peningkatan memori ChatGPT yang patut dihargai untuk pertimbangan penting itu.
Tonton ini: Dampak Tersembunyi dari Booming Pusat Data AI
05:13
Haruskah Anda menggunakan mode suara ChatGPT?
Secara keseluruhan, saya pikir mode suara bagus sebagai cara lain untuk menggunakan ChatGPT, tetapi ini hanya berguna dalam situasi tertentu. Jika Anda membutuhkan penelitian mendalam dan informasi yang lebih detail, mode suara tidak akan cocok untuk Anda. Tetapi jika Anda hanya ingin berbicara dengan seseorang (atau sesuatu) atau memecahkan masalah dengan keras, mode suara adalah alternatif yang bagus daripada harus mengartikulasikan pikiran Anda dan mengetikkannya.
Saya masih percaya bahwa kita belum menormalisasi berbicara dengan AI di ruang publik, terutama tanpa headphone. Tetapi ini bisa menjadi alternatif yang berguna bagi orang yang lebih baik dalam berpikir dengan bersuara. Untuk informasi lebih lanjut, lihat bagaimana AI mengubah mesin pencari dan generator gambar AI terbaik.