Reddit Blokir Internet Archive untuk Mengambil Datanya – Ini Alasannya

Andriy Onufriyenko/Getty Images

Poin penting ZDNET

Internet Archive kini hanya bisa mengambil data dari beranda Reddit.
Tujuan Reddit adalah memblokir perusahaan AI yang mengambil data pengguna tanpa izin.
Banyak penerbit (dan lainnya) menggugat perusahaan AI karena melanggar hak cipta.

Reddit sedang melindungi privasinya dari perusahaan AI yang menggunakan cara tidak langsung untuk mengambil kontennya.

Platform media sosial ini, yang dikenal sebagai tempat pengguna bisa berbagi informasi secara anonim tentang hampir semua topik, akan memblokir Wayback Machine milik Internet Archive untuk mengindeks data onlinenya, menurut laporan The Verge pada Senin lalu. Langkah ini diambil setelah diketahui bahwa perusahaan AI, yang tidak bisa mengambil data langsung dari Reddit karena kebijakan platform tersebut, justru mengumpulkan data dari arsip Internet Archive dan menggunakannya untuk melatih model AI.

Kini, Wayback Machine hanya bisa mengambil data dari beranda Reddit, sementara akses ke profil pengguna, komentar, dan detail postingan diblokir.

Internet Archive, yang diluncurkan tahun 1996, adalah organisasi nirlaba yang mengelola database digital besar berisi konten web. Arsip ini sebagian dikelola oleh Wayback Machine, perangkat lunak yang mengumpulkan dan menyimpan halaman web persis seperti saat diambil—seperti lalat dalam batu ambar digital. Ini berguna untuk peneliti yang mempelajari evolusi budaya online hingga bukti forensik digital.

Apa arti langkah Reddit?

Menurut The Verge, Reddit sebelumnya telah menyampaikan kekhawatiran tentang pengambilan data oleh Internet Archive. Nirlaba ini juga diberi tahu sebelum pembatasan mulai berlaku kemarin.

Internet Archive belum memberikan pernyataan resmi tentang respons mereka terhadap kebijakan baru Reddit. Namun, direktur Wayback Machine, Mark Graham, mengatakan bahwa mereka akan terus berdiskusi dengan Reddit.

Ketegangan yang Meningkat

Keputusan Reddit untuk membatasi Wayback Machine terjadi di tengah ketegangan antara perusahaan AI dan penerbit digital. Reddit menjadi perusahaan teknologi pertama yang terlibat langsung dalam debat ini.

Pada Juni lalu, Reddit menggugat Anthropic karena mengambil datanya secara ilegal. Namun, sebelumnya mereka juga telah bekerja sama dengan Google dan OpenAI dalam kesepakatan lisensi.

(Catatan: Ziff Davis, perusahaan induk ZDNET, menggugat OpenAI pada April 2025 dengan tuduhan pelanggaran hak cipta dalam pelatihan sistem AI.)

Pengembang AI membutuhkan data dalam jumlah besar untuk melatih model generatif mereka. Banyak perusahaan mengambil data dari situs web publik, termasuk media sosial dan berita, dengan dalih penggunaan wajar dalam hukum hak cipta—meski hal ini masih diperdebatkan di pengadilan.

Sebagai respons, banyak organisasi yang kontennya diambil secara masif—termasuk penulis dan seniman—telah menggugat. Sementara itu, beberapa memilih bekerja sama dengan perusahaan seperti OpenAI, Anthropic, atau Google, dengan imbalan visibilitas lebih besar dalam respons chatbot atau manfaat lainnya.

MEMBACA Hari Prime 2025: Kindle Paperwhite vs. Edisi Signature – Mana yang Lebih Layak Dibeli?

Apa arti langkah Reddit?

Ketegangan yang Meningkat