Reddit Memperketat Pengawasan terhadap Bot AI

Pada bulan Mei, Reddit mengumumkan bahwa ia akan memungkinkan OpenAI untuk melatih modelnya pada konten Reddit dengan harga. Sekarang, menurut The Verge, Reddit akan memblokir sebagian besar bot otomatis dari mengakses, belajar dari, dan menghasilkan keuntungan dari datanya tanpa perjanjian lisensi yang serupa.

Reddit berencana untuk melakukan ini dengan memperbarui file robots.txt-nya, “kontrak sosial dasar web” yang menentukan bagaimana web crawler dapat mengakses situs tersebut. Sebagian besar perusahaan AI yang baru lahir (termasuk, pada satu titik, OpenAI) melatih model mereka pada konten yang mereka ambil dari seluruh web tanpa memperhatikan hak cipta atau Ketentuan Layanan situs individual.

Lalu, menurut Alex Heath dari The Verge, mesin pencari seperti Google lolos dari bentuk pengambilan ini berkat “pemberian dan pengambilan” dari Google mengirim lalu lintas kembali ke situs individu sebagai imbalan atas kemampuan untuk merambah mereka untuk informasi. Sekarang, perusahaan AI sedang memiringkan keseimbangan dengan mengambil informasi yang sama dan memberikannya kepada pengguna tanpa mengirim mereka kembali ke situs asal informasi tersebut.

Pejabat hukum Reddit, Ben Lee, mengatakan kepada The Verge bahwa parameter robots.txt tidak dapat ditegakkan secara hukum tetapi mempublikasikan niat Reddit untuk menegakkan kebijakan kontennya adalah “sinyal bagi mereka yang tidak memiliki perjanjian dengan kami bahwa mereka seharusnya tidak mengakses data Reddit.”

Dalam sebuah pos blog tentang perubahan tersebut, Reddit mencatat bahwa “pelaku yang beritikad baik – seperti peneliti dan organisasi… akan terus memiliki akses ke konten Reddit untuk penggunaan non-komersial.” Termasuk Internet Archive, rumah untuk Mesin Wayback.

MEMBACA  Teknologi terbaik CES 2024 yang dapat Anda beli sekarang