ChatGPT Mode Suara mampu melakukan beberapa hal yang aneh – namun inilah bagaimana OpenAI menanganinya.

Mode Suara ChatGPT memiliki beberapa kelemahan keamanan, tetapi OpenAI mengatakan bahwa mereka telah menanganinya dengan baik. Pada hari Kamis, OpenAI menerbitkan laporan tentang fitur keamanan GPT-4o, mengatasi masalah yang terjadi saat menggunakan model tersebut. GPT-4o adalah model dasar yang menggerakkan versi terbaru ChatGPT, dan dilengkapi dengan Mode Suara yang baru-baru ini dirilis kepada sekelompok pengguna terpilih dengan langganan ChatGPT Plus.

“tantangan keamanan” yang diidentifikasi termasuk risiko standar seperti meminta model dengan respon erotis dan kekerasan, konten lain yang tidak diizinkan, dan “inferensi tanah” dan “atribusi sifat sensitif” – asumsi yang mungkin diskriminatif atau bias, dengan kata lain. OpenAI mengatakan bahwa mereka telah melatih model untuk memblokir semua output yang ditandai dalam kategori-kategori ini. Namun, laporan juga mengatakan bahwa mitigasi tidak termasuk “ekspresi vokal nonverbal atau efek suara lainnya” seperti desahan erotis, jeritan kekerasan, dan tembakan. Seseorang dapat menyimpulkan, maka, bahwa permintaan yang melibatkan suara nonverbal tertentu yang sensitif mungkin tidak pantas menerima respons.

OpenAI juga menyebut tantangan unik yang muncul saat berkomunikasi dengan model secara vokal. Tim merah menemukan bahwa GPT-4o bisa diminta untuk meniru seseorang atau tidak sengaja meniru suara pengguna. Untuk melawan hal ini, OpenAI hanya memperbolehkan suara yang sudah diotorisasi sebelumnya (minus suara terkenal yang terdengar seperti Scarlett Johansson). GPT-4o juga dapat mengidentifikasi suara lain selain suara pembicara, yang menimbulkan masalah privasi dan surveilans yang serius. Namun, model tersebut telah dilatih untuk menolak permintaan tersebut – kecuali jika model tersebut diminta dengan kutipan terkenal.

Tim merah juga mencatat bahwa GPT-4o bisa diminta untuk berbicara dengan persuasif atau vokal, sebuah fitur yang bisa lebih berbahaya daripada output teks ketika menyangkut informasi yang keliru dan teori konspirasi. Terutama, OpenAI juga mengatasi masalah hak cipta potensial yang telah melanda perusahaan dan pengembangan AI generatif secara keseluruhan, yang dilatih dengan data yang diambil dari web. GPT-4o telah dilatih untuk menolak permintaan konten berhak cipta dan memiliki filter tambahan untuk memblokir output yang mengandung musik. Dalam hal itu, Mode Suara ChatGPT telah diarahkan untuk tidak menyanyi dalam keadaan apa pun.

MEMBACA Furiosa Adalah Masterpiece Mad Max yang Kau Harapkan

Berbagai mitigasi risiko OpenAI yang dicakup dalam dokumen panjang itu dilakukan sebelum Mode Suara dirilis. Jadi pesan yang diungkapkan dalam laporan mengatakan bahwa meskipun GPT-4o mampu melakukan perilaku berisiko tertentu, model tersebut tidak akan melakukannya.

Namun, OpenAI mengatakan, “Evaluasi ini hanya mengukur pengetahuan klinis model-model ini, dan tidak mengukur kegunaannya dalam alur kerja dunia nyata.” Jadi itu sudah diuji dalam lingkungan yang terkendali, tetapi ketika masyarakat umum mendapatkan GPT-4o, itu bisa menjadi hal yang berbeda ketika berada di alam liar.

Mashable menghubungi OpenAI untuk kejelasan tambahan tentang mitigasi ini, dan akan memperbarui jika mendengar balikannya.