AI terkena klaim hak cipta saat perusahaan mendekati ‘perbatasan data’

“

Tetap terinformasi dengan pembaruan gratis

Perusahaan kecerdasan buatan teratas menghadapi gelombang litigasi hak cipta dan tuduhan bahwa mereka secara agresif mengambil data dari web, masalah yang diperparah seiring dengan start-up mencapai “perbatasan data” yang menghambat kemajuan baru dalam teknologi.

Bulan ini, sebuah trio penulis menggugat Anthropic atas “mencuri ratusan ribu buku berhak cipta”, menuduh start-up kecerdasan buatan San Francisco itu “tidak pernah mencari – apalagi membayar – lisensi untuk menyalin dan memanfaatkan ekspresi yang dilindungi yang terkandung dalam karya berhak cipta yang dimasukkan ke dalam model-modelnya”.

Gugatan class action menambah daftar panjang kasus hak cipta yang sedang berlangsung, yang paling menonjol di antaranya diajukan oleh New York Times terhadap OpenAI dan Microsoft akhir tahun lalu. Times mengklaim perusahaan-perusahaan tersebut “menghasilkan keuntungan dari pelanggaran hak cipta massif, eksploitasi komersial, dan penyalahgunaan kekayaan intelektual The Times”.

Jika kasus berhasil, argumen penerbit tersebut bisa diperluas ke perusahaan-perusahaan lain yang melatih model AI dari seluruh internet, dengan potensi untuk litigasi lebih lanjut.

Perusahaan-perusahaan AI telah membuat kemajuan signifikan dalam 18 bulan terakhir, tetapi telah mulai menghadapi apa yang para ahli sebut sebagai “perbatasan data”, memaksa mereka untuk menyelam ke dalam reruntuhan web yang semakin dalam, membuat kesepakatan untuk mengakses kumpulan data pribadi atau mengandalkan data sintetis.

“Tidak ada makan siang gratis lagi. Anda tidak bisa menyalin kumpulan data skala web lagi. Anda harus pergi dan membelinya atau memproduksinya. Itulah perbatasan yang kita hadapi sekarang,” kata Alex Ratner, salah satu pendiri Snorkel AI, yang membangun dan memberi label pada kumpulan data untuk perusahaan-perusahaan.

MEMBACA Perubahan Kecil Tanpa Katalis untuk Penurunan

Anthropic, start-up AI yang mendeskripsikan dirinya sebagai “bertanggung jawab”, juga dituduh oleh pemilik situs web atas “penyalinan data web yang mencolok” untuk melatih sistemnya dalam sebulan terakhir. Perplexity, mesin pencari berbasis AI yang bertujuan menghadapi monopoli Google dalam kueri web, menghadapi tuduhan serupa.

Google sendiri telah menimbulkan kekhawatiran di kalangan penerbit, yang telah kesulitan untuk mencegah perusahaan itu menyalin situs mereka untuk alat AI tanpa juga mengeluarkan diri dari hasil pencarian.

Start-up AI terlibat dalam perlombaan sengit untuk dominasi di mana mereka memerlukan gunung data pelatihan, bersama dengan algoritma yang semakin canggih dan semikonduktor yang lebih kuat untuk membantu chatbot mereka menghasilkan respon kreatif dan mirip manusia.

OpenAI yang merupakan induk dari ChatGPT dan Anthropic sendiri telah mengumpulkan lebih dari $20 miliar untuk membangun model AI generatif yang kuat, yang dapat merespons permintaan dalam bahasa alami, dan tetap unggul atas pesaing baru, termasuk xAI milik Elon Musk.

Namun, persaingan antara perusahaan-perusahaan AI juga membuat mereka menjadi sasaran penerbit dan pemilik materi yang diperlukan untuk mengembangkan model.

Kasus Times bertujuan untuk menetapkan bahwa OpenAI secara efektif telah mengkannibalkan konten mereka dan mereproduksinya dengan cara-cara “yang menggantikan The Times dan mencuri audiens dari sana”. Sebuah putusan dalam kasus tersebut akan memberikan kejelasan yang lebih besar kepada penerbit tentang nilai konten mereka.

Sementara itu, start-up AI membuat kesepakatan dengan penerbit untuk memastikan chatbot mereka menghasilkan respon yang akurat dan terkini. OpenAI, yang baru-baru ini mengumumkan produk pencarian sendiri, membuat kesepakatan dengan Condé Nast, penerbit majalah New Yorker dan Vogue, menambahkan kerjasama dengan lainnya termasuk The Atlantic, Time, dan The Financial Times. Perplexity juga telah menandatangani kesepakatan berbagi pendapatan dengan sejumlah penerbit.

MEMBACA PDB, Angka Pekerja Terdampak Badai untuk Menetapkan Agenda Sebelum Rapat Kebijakan Fed

Anthropic belum mengumumkan kemitraan serupa, tetapi pada bulan Februari start-up tersebut merekrut Tom Turvey, seorang veteran Google selama 20 tahun yang telah bekerja pada strategi kemitraan perusahaan dengan penerbit besar.

Google telah melakukan lebih dari perusahaan lain untuk menetapkan preseden tentang bagaimana hubungan antara penerbit dan perusahaan teknologi berfungsi saat ini. Pada tahun 2015, perusahaan tersebut memenangkan kasusnya terhadap sekelompok penulis yang mengklaim bahwa pemindaian dan pengindeksan karya mereka melanggar fair use. Kemenangan itu bergantung pada argumen bahwa penggunaan konten Google itu “sangat transformatif”.

Kasus Times terhadap OpenAI bergantung pada klaim bahwa “tidak ada yang ‘transformatif'” tentang bagaimana perusahaan teknologi tersebut telah menggunakan konten grup surat kabar tersebut. Sebuah putusan akan memberikan preseden baru kepada penerbit. Namun, kasus Google, memakan waktu satu dekade untuk diselesaikan, selama periode tersebut mesin pencari tersebut telah menegaskan posisi dominannya.

“