Dalam beberapa minggu mendatang, Reddit akan mulai memblokir sebagian besar bot otomatis dari mengakses data publiknya. Anda perlu membuat kesepakatan lisensi, seperti yang dilakukan Google dan OpenAI, untuk menggunakan konten Reddit untuk pelatihan model dan tujuan komersial lainnya.
Meskipun ini sebenarnya telah menjadi kebijakan Reddit sebelumnya, perusahaan sekarang menegakkannya dengan memperbarui file robots.txt-nya, bagian inti dari web yang menentukan bagaimana web crawler diizinkan mengakses situs. “Ini adalah sinyal bagi mereka yang tidak memiliki kesepakatan dengan kami bahwa mereka seharusnya tidak mengakses data Reddit,” kata Ben Lee, pejabat hukum utama perusahaan itu, kepada saya. “Ini juga merupakan sinyal bagi pelaku jahat bahwa kata ‘izinkan’ dalam robots.txt tidak berarti, dan tidak pernah berarti, bahwa mereka dapat menggunakan data sesuka hati mereka.”