Alat transkripsi kecerdasan buatan OpenAI mengalami halusinasi berlebihan – ini adalah alternatif yang lebih baik

OpenAI\’s Whisper, sebuah alat pengenalan dan transkripsi ucapan kecerdasan buatan (AI) diluncurkan pada tahun 2022, telah ditemukan mengalami halusinasi atau membuat sesuatu yang tidak benar – begitu banyak sehingga para ahli khawatir bisa menyebabkan kerusakan serius dalam konteks yang salah. Pekan lalu, AP melaporkan bahwa seorang peneliti di Universitas Michigan “menemukan halusinasi dalam delapan dari setiap 10 transkripsi audio yang dia periksa” yang dihasilkan oleh Whisper selama studi pertemuan umum. Data poin tersebut adalah salah satu dari banyak data: terpisah, seorang insinyur yang meninjau 100 jam transkripsi Whisper memberitahu AP bahwa dia menemukan halusinasi dalam sekitar 50% dari mereka, sementara pengembang lain menemukan halusinasi dalam hampir setiap transkripsi yang dihasilkan menggunakan Whisper, yang mencapai 26.000. Sementara pengguna selalu bisa mengharapkan transkripsi AI salah dalam kata atau ejaan di sana-sini, para peneliti mencatat bahwa mereka “belum pernah melihat alat transkripsi berbasis AI lainnya mengalami halusinasi sebanyak Whisper.” OpenAI mengatakan bahwa Whisper, sebuah jaringan saraf sumber terbuka, “mendekati tingkat keberagaman dan akurasi manusia dalam pengenalan ucapan bahasa Inggris.” Ini terintegrasi secara luas di beberapa industri untuk jenis transkripsi ucapan umum, termasuk mentranskripsi dan menerjemahkan wawancara serta membuat teks subtitle video. Tingkat ketersebaran yang begitu luas dapat dengan cepat menyebarkan teks yang difabrikasi, kutipan yang disalahartikan dan dibuat-buat, dan informasi yang salah di berbagai media, yang dapat bervariasi dalam signifikansi berdasarkan sifat materi asli. Menurut AP, Whisper digunakan dalam beberapa versi ChatGPT, terintegrasi ke pusat panggilan, asisten suara, dan platform cloud dari Oracle dan Microsoft, dan diunduh lebih dari 4,2 juta kali bulan lalu dari HuggingFace. Lebih mengkhawatirkan lagi, para ahli memberitahu AP, adalah bahwa para profesional medis semakin menggunakan “alat berbasis Whisper” untuk mentranskripsi konsultasi pasien-dokter. AP mewawancarai lebih dari 12 insinyur, peneliti, dan pengembang yang mengkonfirmasi bahwa Whisper memproduksi frasa dan kalimat lengkap yang difabrikasi dalam teks transkripsi, beberapa di antaranya “dapat mencakup komentar rasial, retorika kekerasan, dan bahkan perawatan medis yang dibayangkan.” Temuan para peneliti menunjukkan masalah yang lebih luas dalam industri AI: alat-alat dibawa ke pasar terlalu cepat demi keuntungan, terutama saat AS masih kurang memiliki regulasi AI yang tepat. Hal ini juga relevan mengingat perdebatan terus-menerus antara OpenAI dan organisasi nirlaba serta prediksi terbaru dari kepemimpinan yang tidak mempertimbangkan risiko AI. Seorang juru bicara OpenAI mengatakan bahwa perusahaan terus mempelajari cara mengurangi halusinasi dan menghargai temuan para peneliti, menambahkan bahwa OpenAI menggabungkan umpan balik dalam pembaruan model. Sementara Anda menunggu OpenAI untuk menyelesaikan masalah tersebut, kami merekomendasikan mencoba Otter.ai, alat transkripsi AI yang dipercaya oleh jurnalis yang baru saja menambahkan enam bahasa baru. Bulan lalu, seorang pengguna Otter.ai yang lama mencatat bahwa fitur ringkasan AI baru di platform tersebut mengalami halusinasi statistik, tetapi kesalahan itu tidak ada dalam transkripsi itu sendiri. Mungkin bijaksana untuk tidak mengandalkan fitur tersebut, terutama karena risiko bisa meningkat ketika AI diminta untuk merangkum konteks yang lebih besar. Panduan Otter.ai untuk transkripsi sendiri tidak menyebutkan halusinasi, hanya bahwa “akurasi bisa bervariasi berdasarkan faktor seperti kebisingan latar belakang, aksen pembicara, dan kompleksitas percakapan,” dan menyarankan pengguna untuk “meninjau dan mengedit transkripsi untuk memastikan akurasi yang lengkap, terutama untuk tugas kritis atau percakapan penting.” Jika Anda memiliki iPhone, iOS 18.1 baru dengan Apple Intelligence sekarang memungkinkan perekaman panggilan dan transkripsi AI, tetapi editor-in-chief ZDNET Jason Hiner mengatakan ini masih “proyek yang sedang berlangsung.” Sementara itu, OpenAI baru saja mengumumkan rencana untuk memberikan pengguna ChatGPT Plus sebesar 250 juta lebih banyak alat.

MEMBACA Saham bisa anjlok setelah 'melt-up' yang tidak bijaksana jika Fed memangkas suku bunga untuk menghindari resesi