Jawaban ChatGPT untuk Pertanyaan Pemrograman Salah 52% dari Waktu: Studi

Chatbot kecerdasan buatan seperti ChatGPT dari OpenAI dijual sebagai alat revolusioner yang dapat membantu pekerja menjadi lebih efisien dalam pekerjaan mereka, mungkin menggantikan orang-orang itu sepenuhnya di masa depan. Tetapi sebuah studi baru yang menakjubkan telah menemukan bahwa ChatGPT menjawab pertanyaan pemrograman komputer secara salah 52% dari waktu.

Mengapa Semua Orang Menggugat Perusahaan AI? | Teknologi Masa Depan

Penelitian dari Universitas Purdue, pertama kali terlihat oleh media Futurism, disajikan awal bulan ini di Konferensi Interaksi Komputer-Manusia di Hawaii dan melihat 517 pertanyaan pemrograman di Stack Overflow yang kemudian dimasukkan ke ChatGPT.

“Analisis kami menunjukkan bahwa 52% jawaban ChatGPT mengandung informasi yang salah dan 77% terlalu panjang,” studi baru tersebut menjelaskan. “Namun, partisipan studi pengguna kami masih lebih memilih jawaban ChatGPT 35% dari waktu karena kekomprehensifan dan gaya bahasa yang terartikulasi dengan baik.”

Mengganggu, pemrogram dalam studi tidak selalu menangkap kesalahan yang dihasilkan oleh chatbot AI.

“Namun, mereka juga mengabaikan informasi yang salah dalam jawaban ChatGPT 39% dari waktu,” menurut studi tersebut. “Hal ini mengimplikasikan perlunya mengatasi informasi yang salah dalam jawaban ChatGPT terhadap pertanyaan pemrograman dan meningkatkan kesadaran akan risiko yang terkait dengan jawaban yang tampaknya benar.”

Jelas, ini hanya satu studi, yang tersedia untuk dibaca secara online, tetapi menunjukkan masalah yang dapat dirasakan oleh siapa pun yang telah menggunakan alat-alat ini. Perusahaan teknologi besar saat ini sedang menuangkan miliaran dolar ke dalam AI untuk memberikan chatbot yang paling dapat diandalkan. Meta, Microsoft, dan Google semua berada dalam perlombaan untuk mendominasi ruang yang sedang muncul ini yang berpotensi merombak hubungan kita dengan internet. Namun, ada sejumlah hambatan yang menghalangi.

MEMBACA  Uni Eropa akan mulai bekerja untuk memperluas sanksi terhadap Iran, kata Borrell menurut Reuters.

Yang terutama di antara masalah-masalah itu adalah bahwa AI seringkali tidak dapat diandalkan, terutama jika pengguna memberikan pertanyaan yang benar-benar unik. Pencarian AI baru dari Google terus-menerus mengeluarkan sampah yang seringkali diambil dari sumber yang tidak dapat diandalkan. Bahkan, sudah beberapa kali minggu ini ketika Pencarian Google telah menampilkan artikel satir dari The Onion sebagai informasi yang dapat diandalkan.

Google membela diri dengan bersikeras bahwa jawaban yang salah adalah anomali.

“Contoh yang kami lihat umumnya adalah pertanyaan yang sangat jarang, dan tidak mewakili pengalaman kebanyakan orang,” kata juru bicara Google kepada Gizmodo melalui email awal minggu ini. “Sebagian besar AI Overview memberikan informasi berkualitas tinggi, dengan tautan untuk menelusuri lebih dalam di web.”

Namun pembelaan itu, bahwa “pertanyaan yang tidak umum” menunjukkan jawaban yang salah, sebenarnya lucu. Apakah pengguna hanya boleh bertanya kepada chatbot ini pertanyaan-pertanyaan yang paling sepele? Bagaimana bisa itu diterima, ketika janjinya adalah bahwa alat-alat ini seharusnya revolusioner?

OpenAI tidak segera menanggapi permintaan komentar pada Jumat tentang studi baru mengenai jawaban ChatGPT. Gizmodo akan memperbarui pos ini jika kami mendengar kembali.

\”