Merek Media Online Berharap Protokol Baru Hentikan Crawler AI yang Tidak Diinginkan

Banyak merek media online, seperti Yahoo, Quora, dan Medium, mengambil langkah baru untuk mencegah perusahaan AI menyalin dan menggunakan konten mereka guna melatih model tanpa izin.

Para penerbit, termasuk perusahaan induk CNET yaitu Ziff Davis, memandang alat baru yang disebut RSL ini sebagai cara lain untuk memastikan pengembang AI besar tidak memakai karya mereka tanpa pembayaran atau kompensasi — sebuah isu yang sudah memicu banyak gugatan hukum.

RSL, yang merupakan singkatan dari Really Simple Licensing, terinspirasi oleh Really Simple Syndication, sebuah standar web lama yang menyediakan pembaruan konten otomatis dan terkini dalam format yang dapat dibaca komputer. Seperti RSS, RSL bersifat terbuka, terdesentralisasi, dan dapat bekerja dengan hampir semua jenis konten daring, termasuk halaman web, video, dan kumpulan data.

Watch this: The New iPhone Air Changes the Game for Preorders

05:34

Saat ini, ketika robot internet jelajah milik perusahaan AI, yang dikenal sebagai crawler, ingin mengambil informasi dari suatu situs, ia harus melewati robots.txt, yang bertindak sebagai pintu masuk atau non-entri dasar. Perusahaan AI telah menemukan cara untuk mengelak dari robots.txt atau mengabaikannya sama sekali dan telah akhirnya digugat. Tujuan RSL adalah menjadi lapisan teknologi yang lebih kuat untuk menangani crawler AI, yang kini menyumbang lebih dari separuh lalu lintas internet. (Keterangan: Ziff Davis, perusahaan induk CNET, pada bulan April mengajukan gugatan terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.)

“RSL dibangun langsung dari warisan RSS, menyediakan lapisan lisensi yang hilang untuk Internet yang berfokus pada AI,” ujar Tim O’Reilly, CEO O’Reilly Media, dalam siaran pers. “Ini memastikan bahwa para pencipta dan penerbit yang memicu inovasi AI bukan hanya bagian dari percakapan tetapi juga mendapat kompensasi yang adil untuk nilai yang mereka ciptakan.”

MEMBACA  Siapa yang Membakar Sepeda Motor Demonstran Menolak UU TNI?

Merek-merek yang telah bergabung dengan RSL mencakup Reddit, People, Internet Brands, Fastly, wikiHow, O’Reilly, Daily Beast, The MIT Press, Miso, Adweek, Ranker, Evolve Media, dan Raptive.

“Jika AI dilatih dengan karya para penulis kami, maka ia harus membayar untuk karya tersebut,” kata CEO Medium Tony Stubblebine dalam siaran pers. “Saat ini, AI berjalan dengan konten yang dicuri. Mengadopsi Standar RSL ini adalah cara kami memaksa perusahaan-perusahaan AI itu untuk membayar apa yang mereka pakai, berhenti menggunakannya, atau tutup.”

Kemunculan RSL terjadi ketika lalu lintas web daring anjlok akibat perubahan dari Google dan maraknya AI. Jawaban yang dihasilkan AI terintegrasi Google di bagian atas Penelusuran Google telah dikritik oleh para penerbit karena mengurangi klik potensial yang seharusnya mereka dapatkan. Google membantah bahwa AI Overview mengirimkan “klik berkualitas lebih tinggi” ke situs, yakni orang-orang yang lebih tertarik dan tinggal lebih lama di situs. Chatbot AI seperti ChatGPT juga membantu dalam penelitian dan sintesis, yang berarti orang tidak perlu menjelajahi berbagai situs untuk mengumpulkan informasi seperti dulu. Secara keseluruhan, penerbit kehilangan hingga 25% lalu lintas karena platform AI, menurut laporan dari Infactory.

“Adopsi luas Standar RSL akan melindungi integritas karya orisinal dan mempercepat kerangka kerja yang saling menguntungkan bagi penerbit dan penyedia AI,” ujar CEO Ziff Davis Vivek Shah.

Sebagai tanggapan, penerbit menggugat perusahaan AI atau menandatangani kesepakatan lisensi. Dalam kasus lain, situs beralih ke layanan seperti Tollbit, yang bertujuan untuk menagih crawler AI setiap kali mereka meminta untuk memeriksa isi situs. Jaringan penyampaian konten seperti Cloudflare, yang membantu memastikan akses cepat ke situs daring, secara langsung memblokir crawler AI.

MEMBACA  Guru sekarang dapat menambahkan siswa ke dalam grup kustom di dalam Google Classroom

Pendiri bersama RSL Eckart Walther menyatakan bahwa standar RSL dan upaya seperti yang dilakukan Cloudflare adalah saling melengkapi, dengan banyak perusahaan media yang sama berpartisipasi dalam keduanya. Walther menyamakan alat seperti Cloudflare dengan tukang kasar yang melindungi situs web dari crawler yang tidak diinginkan, sementara RSL memungkinkan crawler untuk memahami aturan dan harga masuk. “Metode kompensasi ini juga dapat bekerja bersama. Misalnya, seorang penerbit mungkin ingin menagih untuk perayapan konten mereka, dan kemudian juga meminta pembayaran royalti setiap kali konten digunakan oleh model AI untuk menjawab pertanyaan,” kata Walther dalam surel kepada CNET.