Penjualan Data Pengguna Reddit untuk Pelatihan AI Menarik Penyelidikan FTC

Reddit mengatakan menjelang penawaran saham perdana minggu depan bahwa lisensi posting pengguna kepada Google dan pihak lain untuk proyek AI bisa menghasilkan pendapatan sebesar $203 juta dalam beberapa tahun ke depan. Platform yang didorong oleh komunitas ini terpaksa mengungkapkan pada Jumat bahwa regulator AS sudah memiliki pertanyaan tentang garis bisnis baru tersebut.

Dalam pengajuan regulasi, Reddit mengatakan bahwa mereka menerima surat dari Federal Trade Commission AS pada hari Kamis yang bertanya tentang “penjualan, lisensi, atau berbagi konten yang dihasilkan pengguna dengan pihak ketiga untuk melatih model AI.”

FTC, regulator antitrust utama pemerintah AS, memiliki kekuatan untuk memberikan sanksi kepada perusahaan yang terbukti terlibat dalam praktik perdagangan yang tidak adil atau menipu. Ide lisensi konten yang dihasilkan pengguna untuk proyek AI telah menimbulkan pertanyaan dari para pembuat kebijakan dan kelompok hak asasi manusia tentang risiko privasi, keadilan, dan hak cipta.

Reddit bukanlah satu-satunya yang mencoba menghasilkan uang dari lisensi data, termasuk yang dihasilkan oleh pengguna, untuk AI. Situs tanya jawab pemrograman Stack Overflow telah menandatangani kesepakatan dengan Google, Associated Press telah menandatangani kesepakatan dengan OpenAI, dan pemilik Tumblr Automattic mengatakan sedang “bekerja dengan perusahaan AI tertentu” tetapi akan memungkinkan pengguna untuk memilih keluar dari pengiriman data mereka. Tidak ada dari pihak yang memberikan lisensi segera merespons permintaan komentar. Reddit juga bukan satu-satunya perusahaan yang menerima surat FTC tentang lisensi data, Axios melaporkan pada Jumat, mengutip mantan pejabat agensi yang tidak disebutkan namanya.

Belum jelas apakah surat kepada Reddit secara langsung terkait dengan tinjauan terhadap perusahaan lain.

Reddit mengatakan dalam pengungkapan Jumat bahwa mereka tidak percaya bahwa mereka terlibat dalam praktik yang tidak adil atau menipu tetapi memperingatkan bahwa berurusan dengan penyelidikan pemerintah dapat mahal dan memakan waktu. “Surat tersebut menunjukkan bahwa staf FTC tertarik untuk bertemu dengan kami untuk mempelajari lebih lanjut tentang rencana kami dan bahwa FTC bermaksud untuk meminta informasi dan dokumen dari kami saat penyelidikannya berlanjut,” demikian bunyi pengajuan itu. Reddit mengatakan surat FTC tersebut menggambarkan pemeriksaan sebagai terkait dengan “penyelidikan non-publik.”

MEMBACA Website Alaska Airlines crash saat penjualan Cyber Monday dimulai, mengakibatkan penerbangan terhenti.

Reddit, yang 17 miliar posting dan komentarnya dilihat oleh para ahli AI sebagai berharga untuk melatih chatbot dalam seni percakapan, mengumumkan kesepakatan bulan lalu untuk melisensikan konten tersebut kepada Google. Reddit dan Google tidak segera merespons permintaan komentar. FTC menolak berkomentar.

Chatbot AI seperti ChatGPT OpenAI dan Gemini Google dianggap sebagai ancaman kompetitif bagi Reddit, penerbit, dan bisnis berbasis iklan lainnya. Dalam setahun terakhir, prospek lisensi data kepada pengembang AI muncul sebagai keuntungan potensial dari AI generatif bagi beberapa perusahaan.

Namun, penggunaan data yang dikumpulkan secara online untuk melatih model AI telah menimbulkan sejumlah pertanyaan yang merambat melalui ruang rapat, ruang sidang, dan Kongres. Bagi Reddit dan yang lain yang data mereka dihasilkan oleh pengguna, pertanyaan-pertanyaan tersebut meliputi siapa yang benar-benar memiliki konten dan apakah adil untuk melisensikannya tanpa memberikan bagian kepada penciptanya. Para peneliti keamanan telah menemukan bahwa model AI dapat bocor data pribadi yang disertakan dalam materi yang digunakan untuk membuat mereka. Dan beberapa kritikus telah menyarankan bahwa kesepakatan tersebut dapat membuat perusahaan-perusahaan kuat menjadi lebih dominan.