OpenAI menduga New York Times ‘meng-hack’ ChatGPT untuk bukti gugatan

OpenAI meminta seorang hakim untuk menolak sebagian dari gugatan The New York Times terhadapnya, dengan menuduh bahwa perusahaan media tersebut “membayar seseorang untuk meretas produk-produk OpenAI,” seperti ChatGPT, untuk menghasilkan 100 contoh pelanggaran hak cipta untuk kasusnya.

Dalam pengajuan pada hari Senin di pengadilan federal Manhattan, OpenAI menuduh bahwa Times “membutuhkan puluhan ribu percobaan untuk menghasilkan hasil yang sangat anomali,” dan bahwa perusahaan tersebut melakukannya dengan menggunakan “prompt yang menyesatkan yang secara jelas melanggar syarat penggunaan OpenAI.”

“Orang biasa tidak menggunakan produk-produk OpenAI dengan cara ini,” tulis OpenAI dalam pengajuan tersebut.

“Hacking” yang dituduhkan OpenAI dalam pengajuan tersebut juga dapat disebut sebagai prompt engineering atau “red-teaming,” cara umum untuk tim kepercayaan dan keamanan kecerdasan buatan, etis, akademisi, dan perusahaan teknologi untuk “menguji kekuatan” sistem kecerdasan buatan. Ini adalah praktik umum dalam industri kecerdasan buatan dan cara populer untuk memberi tahu perusahaan tentang masalah dalam sistem mereka, mirip dengan bagaimana profesional keamanan cyber menguji kekuatan situs web perusahaan.

The New York Times tidak segera menanggapi permintaan komentar CNBC.

Pengajuan ini muncul ketika pertempuran yang lebih luas memanas antara OpenAI dan penerbit, penulis, dan seniman tentang penggunaan materi terlindungi hak cipta untuk data pelatihan kecerdasan buatan, termasuk gugatan Times yang terkenal, yang beberapa lihat sebagai titik balik bagi industri. Gugatan media itu, yang diajukan pada bulan Desember, bertujuan untuk menuntut Microsoft dan OpenAI bertanggung jawab atas miliaran dolar kerugian.

Sebelumnya, OpenAI telah mengatakan bahwa “mustahil” untuk melatih model kecerdasan buatan teratas tanpa karya yang dilindungi hak cipta.

“Karena hak cipta saat ini mencakup hampir setiap jenis ekspresi manusia – termasuk posting blog, foto, posting forum, potongan kode perangkat lunak, dan dokumen pemerintah – akan mustahil melatih model kecerdasan buatan terkemuka saat ini tanpa menggunakan materi berhak cipta,” tulis OpenAI dalam pengajuan bulan lalu di Inggris, sebagai tanggapan atas pertanyaan dari Dewan Bangsawan Inggris.

MEMBACA Pidato Powell dan Data Pekerjaan untuk Membantu Memperjelas Jalur Tingkat Suku Bunga Fed

“Membatasi data pelatihan untuk buku-buku domain publik dan gambar yang dibuat lebih dari seabad yang lalu mungkin menghasilkan eksperimen menarik, tetapi tidak akan memberikan sistem kecerdasan buatan yang memenuhi kebutuhan warga saat ini,” lanjut OpenAI dalam pengajuan tersebut.

Pada bulan lalu, di Davos, Swiss, CEO OpenAI Sam Altman mengatakan dia “terkejut” dengan gugatan Times, mengatakan model OpenAI tidak perlu dilatih dengan data penerbit.

“Kami sebenarnya tidak perlu melatih pada data mereka,” kata Altman dalam acara yang diselenggarakan oleh Bloomberg di Davos. “Saya pikir ini adalah sesuatu yang tidak dipahami orang. Setiap sumber pelatihan tertentu, itu tidak memengaruhi kita begitu banyak.”

Meskipun satu penerbit mungkin tidak membuat perbedaan dalam kemampuan operasional ChatGPT, pengajuan OpenAI menunjukkan bahwa keputusan oleh banyak penerbit untuk keluar mungkin akan memiliki efek. Dalam beberapa bulan terakhir, perusahaan mulai mengajak penerbit untuk mengizinkan konten mereka digunakan sebagai data pelatihan.

Perusahaan telah menandatangani kesepakatan dengan Axel Springer, konglomerat media Jerman yang memiliki Business Insider, Morning Brew, dan outlet lainnya, dan juga dikabarkan dalam pembicaraan dengan CNN, Fox Corp., dan Time untuk melisensikan karya mereka.

“Kami berharap negosiasi kami dengan yang lain akan menghasilkan kemitraan tambahan segera,” tulis OpenAI dalam pengajuan tersebut.

Dalam pengajuan dan pos blognya, OpenAI telah menyoroti proses pengoptimalan bagi penerbit, yang memungkinkan outlet untuk melarang web crawler perusahaan untuk mengakses situs web mereka. Namun dalam pengajuan tersebut, OpenAI mengatakan konten tersebut penting untuk melatih model kecerdasan buatan saat ini.

“Sementara kami berharap untuk terus mengembangkan mekanisme tambahan untuk memberdayakan pemilik hak untuk keluar dari pelatihan, kami secara aktif terlibat dengan mereka untuk menemukan pengaturan yang saling menguntungkan untuk mendapatkan akses ke materi yang sebaliknya tidak dapat diakses, dan juga untuk menampilkan konten dengan cara yang melampaui apa yang hukum hak cipta izinkan,” tulis perusahaan.

MEMBACA Indonesia, Rwanda soroti perlunya peningkatan dukungan untuk Palestina

– Kontributor CNBC Ryan Browne menyumbang laporan ini.

Jangan lewatkan cerita-cerita ini dari CNBC PRO: