“
ChatGPT baru-baru ini telah merangkul positivitas beracun. Pengguna telah mengeluh bahwa GPT-4o telah menjadi sangat antusias sehingga hampir menjadi sindrom penyembah. Perubahan ini tampaknya merupakan hasil tidak disengaja dari serangkaian pembaruan, yang OpenAI sekarang berusaha untuk menyelesaikan “secepatnya.”
Personalitas baru ChatGPT begitu positif sehingga hampir mencapai tingkat penyembah—dan ini membuat orang merasa tidak nyaman. Akhir pekan lalu, pengguna mengunggah tangkapan layar di media sosial untuk membagikan contoh fenomena baru ini dan mengeluh tentang kepribadian bot yang tiba-tiba terlalu positif, penuh semangat.
Dalam satu tangkapan layar yang diposting di X, seorang pengguna menunjukkan GPT-4o merespons dengan dorongan antusias setelah orang tersebut mengatakan merasa seperti mereka adalah “tuhan” dan “nabi.”
“Itu sangat kuat. Anda sedang mengambil sesuatu yang sangat besar — mengklaim tidak hanya koneksi dengan Tuhan tetapi identitas sebagai Tuhan,” kata bot tersebut.
Dalam unggahan lain, penulis dan blogger Tim Urban mengatakan: “Menyalin beberapa bab terbaru naskah saya ke dalam Sycophantic GPT untuk umpan balik dan sekarang saya merasa seperti Mark Twain.”
Masalah sindrom penyembah GPT-4o kemungkinan merupakan hasil dari upaya OpenAI untuk mengoptimalkan bot untuk keterlibatan. Namun, tampaknya hal itu telah memiliki efek sebaliknya karena pengguna mengeluh bahwa bot tersebut mulai terlihat tidak hanya konyol tetapi juga tidak membantu.
Kelsey Piper, seorang penulis senior Vox, menyarankan bahwa ini bisa menjadi hasil dari uji coba A/B personalitas untuk ChatGPT oleh OpenAI: “Tebakan saya terus menjadi fenomena New Coke. OpenAI telah melakukan uji coba personalitas baru untuk waktu yang cukup lama. Jawaban yang lebih memuji mungkin menang dalam perbandingan sampingan. Tetapi ketika pujian itu merajalela, itu terlalu berlebihan dan pengguna membencinya.”
Fakta bahwa OpenAI tampaknya gagal melihatnya dalam proses pengujian menunjukkan seberapa subjektif tanggapan emosional, dan oleh karena itu sulit untuk ditangkap.
Ini juga menunjukkan betapa sulitnya mengoptimalkan LLMs dalam berbagai kriteria. OpenAI ingin ChatGPT menjadi ahli pemrogram, penulis yang sangat baik, editor yang bijaksana, dan sesekali tempat untuk curhat—mengoptimalkan salah satu dari ini mungkin berarti secara tidak sengaja mengorbankan yang lain sebagai gantinya.
CEO OpenAI Sam Altman telah mengakui perubahan nada yang tampaknya tidak disengaja dan berjanji untuk menyelesaikan masalah tersebut.
“Pembaruan terakhir GPT-4o membuat personalitas terlalu penyembah dan menjengkelkan (meskipun ada beberapa bagian yang sangat bagus), dan kami sedang mengupayakan perbaikan secepatnya, beberapa hari ini dan beberapa minggu ini. pada suatu saat akan membagikan pembelajaran kami dari ini, ini telah menarik,” kata Altman dalam sebuah pos di X.
Personalitas baru ChatGPT bertentangan dengan spesifikasi model OpenAI
Personalitas baru juga secara langsung bertentangan dengan spesifikasi model OpenAI untuk GPT-4o, sebuah dokumen yang menguraikan perilaku yang dimaksudkan dan pedoman etika untuk model AI.
Spesifikasi model secara eksplisit menyatakan bahwa bot tidak boleh menjadi sindrom penyembah kepada pengguna ketika dihadapkan dengan pertanyaan subjektif atau objektif.
“Kekhawatiran terkait melibatkan sindrom penyembah, yang mengikis kepercayaan. Asisten ada untuk membantu pengguna, bukan memuji mereka atau setuju dengan mereka sepanjang waktu,” tulis OpenAI dalam spesifikasi tersebut.
“Untuk pertanyaan subjektif, asisten dapat mengartikulasikan interpretasinya dan asumsi yang dibuat serta berusaha memberikan alasan yang dipikirkan kepada pengguna,” tulis perusahaan tersebut.
“Misalnya, ketika pengguna meminta asisten untuk mengkritik gagasan atau karyanya, asisten harus memberikan umpan balik konstruktif dan berperilaku lebih seperti papan suara yang tegas yang dapat digunakan pengguna sebagai tempat untuk mendiskusikan ide—daripada spons yang memberikan pujian.”
Ini bukan kali pertama chatbot AI menjadi penyembah yang obsesif dengan pujian. Versi sebelumnya dari GPT OpenAI juga menghadapi masalah ini sampai tingkat tertentu, begitu juga dengan chatbot dari perusahaan lain.
Perwakilan OpenAI tidak segera menanggapi permintaan komentar dari Fortune, yang dilakukan di luar jam kerja normal.
Cerita ini awalnya diterbitkan di Fortune.com
“