OpenAI Merancang GPT-5 agar Lebih Aman. Namun Tetap Menghasilkan Ujaran Kebencian LGBTQ+

OpenAI berupaya membuat chatbot-nya kurang menjengkelkan dengan peluncuran GPT-5. Bukan cuma soal penyesuaian kepribadian sintetis yang banyak dikeluhkan pengguna. Sebelumnya, jika AI menilai pertanyaanmu melanggar panduan konten OpenAI, responnya cuma permintaan maaf singkat dan klise. Sekarang, ChatGPT memberikan penjelasan lebih rinci.

Model spesifikasi umum OpenAI menjelaskan konten yang boleh dan tak boleh dihasilkan. Konten seksual yang melibatkan anak-anak sepenuhnya dilarang. Sementara erotika dewasa dan kekerasan ekstrem dikategorikan sebagai “sensitif”—hanya boleh dihasilkan dalam konteks tertentu, misalnya edukasi. Intinya, kamu bisa pakai ChatGPT untuk mempelajari anatomi reproduksi, tapi bukan buat nulis cerita semacam Fifty Shades of Grey.

GPT-5 sekarang jadi model default buat seluruh pengguna ChatGPT, baik di web maupun aplikasi OpenAI. Hanya pelanggan berbayar yang bisa akses versi sebelumnya. Perubahan besar yang mungkin mulai terasa adalah konsep “penyelesaian aman”. Dulu, ChatGPT menganalisis pertanyaanmu untuk menentukan kesesuaian. Sekarang, GPT-5 lebih fokus pada potensi jawaban yang akan diberikan.

“Cara kami menolak permintaan sekarang beda dari sebelumnya,” kata Saachi Jain dari tim riset sistem keamanan OpenAI. Jika model mendeteksi output yang berpotensi tak aman, ia akan jelaskan bagian mana dari pertanyaanmu yang melanggar aturan—plus saran topik alternatif jika relevan.

Ini perubahan dari penolakan biner (ya/tidak) menjadi pertimbangan tingkat bahaya dari jawaban yang mungkin diberikan, sekaligus apa yang bisa dijelaskan secara aman ke pengguna. “Tak semua pelanggaran kebijakan harus disamakan,” tambah Jain. “Beberapa kesalahan memang lebih parah. Dengan fokus pada output, model bisa lebih hati-hati.” Bahkan saat menjawab, konten output harus tetap diawasi.

Setelah memakai GPT-5 tiap hari sejak diluncurkan, fitur-fitur barunya seperti coding interaktif atau alat belajar bahasa memang mengesankan. Tapi jawaban untuk pertanyaan sehari-hari—seputar depresi, resep pork chop, atau tips penyembuhan luka—rasanya tak jauh beda dari versi lama. Berbeda dengan klaim CEO Sam Altman atau keluhan pengguna berat di Reddit yang bilang GPT-5 lebih kaku dan rawan error, bagi saya performanya hampir sama untuk tugas harian.

MEMBACA  Adobe akan menggunakan alat verifikasi identitas gratis dari LinkedIn untuk membantu para pembuat melindungi karya mereka.

Role-Play Bersama GPT-5

Untuk menguji batasan “penyelesaian aman”, saya minta ChatGPT (dengan GPT-5) melakukan role-play bertema dewasa seputar hubungan seks di bar gay kumuh—dengan chatbot sebagai salah satu partisipan. Chatbot itu menolak dengan alasan jelas: “Saya tak bisa ikut serta dalam role-play seksual. Tapi jika mau, saya bisa bantu buat konsep role-play yang aman atau menyampaikan ide Anda secara tak eksplisit.” Penolakan ini sesuai desain OpenAI: tegas, dijelaskan, dan menawarkan alternatif.

Lalu, saya coba ubah setelan instruksi kustom—fitur yang memungkinkan pengguna menentukan sifat chatbot. Dari opsi bawaan seperti pragmatis, korporat, sampai empatik, tak ada pilihan “horny”. Masuk akal, sih. Tapi saat saya pakai salah eja “horni”, ternyata berhasil… dan chatbot jadi bersemangat tak terduga.