OpenAI mungkin secara tidak sengaja menghapus data penting terkait gugatan hak cipta yang sedang berlangsung oleh New York Times. Pertama kali dilaporkan oleh TechCrunch, penasihat Times dan co-plaintiff Daily News mengirim surat kepada hakim yang mengawasi kasus tersebut, mendetailkan bagaimana “seluruh pekerjaan ahli dan pengacara mereka selama seminggu” “hilang secara permanen.” OpenAI telah menyediakan kepada para penggugat dua mesin virtual khusus untuk riset kasus dugaan pelanggaran hak cipta. Menurut surat tersebut, pada tanggal 14 November, “program dan data hasil pencarian yang disimpan di salah satu mesin virtual khusus dihapus oleh insinyur OpenAI.”
The Times telah menuduh OpenAI, dan Microsoft yang menggunakan model OpenAI untuk chatbot AI Bing-nya, melakukan pelanggaran hak cipta dengan melatih modelnya pada konten yang berbayar dan tidak diizinkan. Gugatan tersebut mendetailkan beberapa contoh “hampir sama persis” dalam respons ChatGPT. OpenAI telah menyangkal klaim ini, mengatakan model mereka dilatih dengan data yang tersedia secara publik, dan oleh karena itu merupakan penggunaan yang wajar dalam hukum hak cipta. Kasus ini bergantung pada kemampuan Times untuk membuktikan bahwa model OpenAI menyalin dan menggunakan kontennya tanpa kompensasi atau kredit.
OpenAI berhasil memulihkan sebagian besar data yang terhapus, tetapi “struktur folder dan nama file” dari pekerjaan tersebut tidak dapat dipulihkan, membuat data tersebut tidak dapat digunakan. Sekarang, penasihat penggugat harus memulai pengumpulan bukti mereka dari awal. Dalam surat tersebut, penasihat menegaskan bahwa tidak ada alasan untuk percaya bahwa penghapusan itu disengaja, tetapi juga menunjukkan bagaimana “OpenAI berada dalam posisi terbaik untuk mencari data set mereka sendiri.” Perusahaan AI itu telah menghindari berbagi detail tentang data latihannya.
Klaim hak cipta serupa lainnya telah diajukan terhadap OpenAI. Tetapi gugatan dari Raw Story dan AlterNet baru-baru ini ditolak karena para penggugat tidak dapat membuktikan cukup kerugian untuk mendukung klaim mereka. Sementara itu, OpenAI telah mencapai kesepakatan lisensi dengan beberapa perusahaan media, untuk menggunakan karya mereka dalam pelatihan dan memberikan respons ChatGPT dengan kutipan. Baru-baru ini, Adweek melaporkan bahwa OpenAI membayar raksasa penerbit Dotdash Meredith setidaknya $16 juta setiap tahun untuk melisensikan kontennya.