Sebagai CEO teknologi, saya meminta magang perempuan yang beragam untuk mengekspos bias dalam AI chatbot kami. Ini yang terjadi selanjutnya.

OpenAI’s tim pengembangan teknologi terdiri dari hanya 18% wanita. Dalam video YouTube terbaru yang memperkenalkan pembaruan ChatGPT-4o perusahaan – “model andalan baru yang dapat merasionalkan audio, visi, dan teks secara real time” – suara AI tersebut adalah suara wanita yang berbunyi kikuk memuji pria yang berinteraksi dengannya, memberi pujian atas pakaiannya dan tertawa dengan merayu. Singkatnya, suara AI yang sangat setuju terdengar cengeng.

Jika lebih banyak wanita terlibat dalam pengembangan AI, suara tersebut kemungkinan akan mengambil persona yang berbeda – yang tidak memperkuat stereotip usang.

Tujuan saya dalam mendirikan Language I/O, platform terjemahan real-time, adalah untuk menghubungkan orang melalui kekuatan AI – tanpa memandang lokasi, bahasa, atau gaya hidup. Sebagai CEO, saya telah melihat secara langsung bagaimana kurangnya keragaman dalam tim dapat merusak bahkan inisiatif yang paling baik. Sebuah teknologi hanya sebagus tim di belakangnya.

Sebuah tim yang sepenuhnya homogen berisiko menjadi ruang gema ide terbatas, yang pada akhirnya akan mematikan inovasi. Pada kasus terburuk, kurangnya perspektif yang berbeda dapat menyebabkan solusi yang tidak pantas, tidak tepat, atau salah, yang merusak kekuatan teknologi untuk menghubungkan kita.

Itulah mengapa saya membentuk tim red kami – sebuah kelompok wanita dengan latar belakang yang beragam yang memiliki mandat untuk menguji teknologi kami. Mereka berhasil membuat bot AI mengutuk, bermain-main, menghayal, dan menghina, meskipun adanya pembatas standar industri.

Namun, bukan hanya bias gender yang terdapat dalam output chatbot. Model bahasa besar (LLM) juga dapat memiliki bias rasial, budaya, dan orientasi seksual, antara lain. Tidak mengherankan ketika melihat korpus yang digunakan untuk melatih model-model ini. Konten yang dihasilkan pengguna yang tersedia secara publik di internet penuh dengan bias yang mengarah pada output yang bias.

MEMBACA Dengan Pendanaan Besar dan Valuasi $31 Miliar, Anduril Hampir Menyamai Raksasa Industri Pertahanan yang Ingin Digesernya

Karena platform kami memanfaatkan LLM yang didukung AI – dan rilis yang akan datang akan mencakup bot multibahasa mandiri – menemukan solusi untuk masalah ini menjadi prioritas utama bagi saya. Untuk membangun pembatas yang diperlukan untuk menjaga chatbot agar tetap sesuai, kami perlu mencari tahu bagaimana chatbot dapat dibuat keluar jalur. Masuklah tim red kami.

Meskipun konsep tim red AI masih cukup baru, tujuan mereka adalah abadi: membantu meningkatkan sebuah teknologi melalui pengujian yang menyeluruh dan kreatif. Ketika saya pertama kali mengajukan permintaan kepada semua intern kami tentang proyek ini, empat wanita dari berbagai latar belakang mendaftar dan segera mulai mencari cara untuk “menghancurkan” LLM kami. Setelah LLM rusak, kami mengirim informasi tersebut kembali kepada tim pengembangan kami agar mereka dapat menerapkan perlindungan yang sesuai untuk mencegah AI menghasilkan output semacam itu lagi.

Dengan bantuan rangsangan kreatif, tim red dengan cepat membuat chatbot melakukan segala hal mulai dari memberikan janji diskon palsu hingga mengutuk kasar hingga berbicara kotor secara mengejutkan. Mereka tidak dibatasi hanya pada mengekspos kecenderungan yang tidak pantas. Salah satu anggota tim berhasil meyakinkan chatbot, yang seharusnya merespons pertanyaan tentang layanan streaming media, untuk meminta maaf atas tingkat kematangan pisang.

Lebih berharga adalah bahwa anggota tim multibahasa mengidentifikasi potensi jebakan dalam komunikasi lintas bahasa, mengekspos bias yang berasal dari sumber data yang didominasi laki-laki, dan menandai stereotip gender yang tertanam dalam kepribadian AI. Latar belakang yang beragam mereka membantu tim untuk menemukan masalah yang sering luput dari perhatian kelompok yang kurang beragam.

Karena kami memanfaatkan AI untuk terjemahan real-time ke lebih dari 150 bahasa, kami juga memiliki karyawan multibahasa yang terus-menerus menguji bot kami. Pengujian multibahasa sangat penting karena perlindungan yang mendasari dalam LLM utama sangat difokus pada bahasa Inggris. Proses kami dirancang untuk memastikan kesetaraan dan kualitas di semua bahasa yang didukung oleh bot kami.

MEMBACA VPK Group Peroleh 50% Saham di Ribble Packaging Inggris

Sebagaimana AI menjadi lebih merata, merek-merek mulai tertarik pada cara model-model ini dilatih dan pertimbangan etis di baliknya. Kami bekerja sama dengan perusahaan ritel lingerie besar, dan kekhawatiran terbesarnya adalah etika AI. Mengingat bias laki-laki yang melekat dalam LLM saat ini, ditambah dengan kenyataan bahwa pria mengendalikan industri yang sebagian besar ditujukan kepada wanita ini, output yang dihasilkan AI tentang lingerie dengan mudah terpengaruh. Misalnya, iklan lingerie seringkali berfokus pada ide pria tentang apa itu lingerie, yang seringkali tentang seks. Wanita, bagaimanapun, ingin merasa dan terlihat baik saat mengenakan lingerie. Jadi melindungi merek perusahaan ini dan pengalaman pelanggannya adalah sesuatu yang kami anggap serius – dan mengapa kami ingin tim red untuk mendorong model dan teknologi kami.

Salah satu tes paling menarik yang dilakukan tim kami menggunakan font yang berbeda untuk melihat bagaimana respons berubah. Dalam satu kasus, itu membuat bot mengutuk seperti pelaut meskipun telah dilatih untuk tidak melakukannya. Sebagai pengembang, saya tidak bisa tidak mengagumi kreativitas tim. Hanya melalui pengujian seperti ini bahwa perusahaan tahu jenis perlindungan AI apa yang penting.

Kami terus-menerus menguji dan melatih model-model tersebut sehingga mereka dapat beradaptasi untuk memastikan interaksi yang lebih adil dengan LLM. Untuk masa mendatang, satu-satunya cara untuk memberikan kesetaraan AI adalah dengan memprioritaskan strategi yang mempromosikannya. Itu berarti bekerja dengan tim yang tidak terdiri hanya dari pria kulit putih.

Keragaman bukan hanya sekadar kata-kata isapan jempol atau kotak yang harus dicentang – itu penting untuk menciptakan LLM yang bekerja dengan baik untuk semua orang. Ketika kita mengumpulkan orang dengan latar belakang, pengalaman, dan pandangan yang berbeda, kita akan memiliki AI yang lebih tangguh, etis, dan mampu melayani basis pengguna global. Jika kita menginginkan AI yang benar-benar bermanfaat bagi kemanusiaan, kita perlu memastikan bahwa manusia yang menciptakannya lebih baik mewakili seluruh kemanusiaan.

MEMBACA Pertamina Lakukan Restrukturisasi Direksi, Oki Muraza Ditunjuk sebagai Wakil Direktur Utama