OpenAI mengatakan bahwa mereka memiliki bukti bahwa DeepSeek China menggunakan model mereka untuk melatih pesaingnya

Tetap terinformasi dengan pembaruan gratis

OpenAI mengatakan telah menemukan bukti bahwa perusahaan start-up kecerdasan buatan China, DeepSeek, menggunakan model milik perusahaan AS tersebut untuk melatih pesaing sumber terbuka miliknya sendiri, ketika kekhawatiran meningkat atas potensi pelanggaran kekayaan intelektual.

Pembuat ChatGPT berbasis San Francisco mengatakan kepada Financial Times bahwa mereka telah melihat beberapa bukti “distilasi”, yang mereka curigai berasal dari DeepSeek.

Teknik ini digunakan oleh pengembang untuk mendapatkan kinerja yang lebih baik pada model yang lebih kecil dengan menggunakan output dari model yang lebih besar dan lebih mampu, memungkinkan mereka mencapai hasil yang serupa pada tugas-tugas tertentu dengan biaya yang jauh lebih rendah.

Distilasi adalah praktik umum dalam industri tersebut, namun kekhawatiran adalah bahwa DeepSeek mungkin melakukannya untuk membangun model pesaingnya sendiri, yang merupakan pelanggaran terhadap syarat layanan OpenAI.

“Masalahnya adalah ketika Anda [mengeluarkannya dari platform dan] melakukannya untuk membuat model Anda sendiri untuk tujuan Anda sendiri,” kata seseorang yang dekat dengan OpenAI.

OpenAI menolak untuk memberikan komentar lebih lanjut atau memberikan rincian buktinya. Syarat layanannya menyatakan pengguna tidak boleh “mengcopy” layanannya atau “menggunakan output untuk mengembangkan model yang bersaing dengan OpenAI”.

Rilis model penalaran R1 DeepSeek telah mengejutkan pasar, serta investor dan perusahaan teknologi di Silicon Valley. Model-modelnya yang dibangun dengan anggaran minim telah mencapai peringkat tinggi dan hasil yang dapat dibandingkan dengan model-model terkemuka di AS.

Saham Nvidia turun 17 persen pada hari Senin, menghapus $589 miliar dari nilai pasar, karena ketakutan bahwa investasi besar dalam perangkat keras AI mahal mungkin tidak diperlukan. Saham tersebut pulih sebesar 9 persen pada hari Selasa, bersama dengan saham teknologi lainnya.

MEMBACA Sean ‘Diddy’ Combs Divonis 4 Tahun Penjara dan Denda Setengah Juta Dolar untuk Kasus yang Melibatkan Pekerja Seks, Kekerasan, dan Pesta Seks

OpenAI dan mitranya Microsoft menyelidiki akun yang diyakini sebagai milik DeepSeek tahun lalu yang menggunakan antarmuka pemrograman aplikasi OpenAI, atau API, dan memblokir akses mereka dengan dugaan distilasi yang melanggar syarat layanan, tambah seseorang yang memiliki pengetahuan langsung. Penyelidikan ini pertama kali dilaporkan oleh Bloomberg.

Microsoft menolak untuk berkomentar dan OpenAI tidak segera menanggapi permintaan komentar tentang detail ini. DeepSeek tidak menanggapi permintaan komentar. China sedang libur untuk perayaan tahun baru lunar.

Sebelumnya, tsar kecerdasan buatan dan kripto Presiden Donald Trump, David Sacks, mengatakan “memungkinkan” bahwa pencurian kekayaan intelektual telah terjadi.

Disarankan

“Ada teknik dalam AI yang disebut distilasi . . . ketika satu model belajar dari model lain [dan] mengambil pengetahuan dari model induk,” kata Sacks kepada Fox News pada hari Selasa.

“Dan ada bukti substansial bahwa apa yang dilakukan DeepSeek di sini adalah mereka mendistilasi pengetahuan dari model-model OpenAI, dan saya rasa OpenAI tidak terlalu senang dengan hal ini,” tambah Sacks, meskipun dia tidak memberikan bukti.

DeepSeek mengatakan hanya menggunakan 2.048 kartu grafis Nvidia H800 dan menghabiskan $5,6 juta untuk melatih model V3 mereka dengan 671 miliar parameter, sebagian kecil dari apa yang OpenAI dan Google habiskan untuk melatih model seukuran yang sama. Beberapa ahli mengatakan model tersebut menghasilkan tanggapan yang menunjukkan bahwa model itu telah dilatih pada output dari GPT-4 milik OpenAI, yang akan melanggar syarat layanannya.

Pihak dalam industri mengatakan bahwa praktik tersebut adalah hal yang umum dilakukan oleh laboratorium kecerdasan buatan di China dan AS untuk menggunakan output dari perusahaan seperti OpenAI, yang telah berinvestasi dalam merekrut orang untuk mengajari model-model mereka cara menghasilkan tanggapan yang terdengar lebih manusiawi. Hal ini mahal dan membutuhkan tenaga kerja yang intensif, dan pemain kecil sering kali mengikuti langkah ini, kata pihak dalam industri.

MEMBACA Judul Terkait Alokasi Anggaran untuk Preman

“Ini adalah praktik yang sangat umum bagi start-up dan akademisi untuk menggunakan output dari LLM komersial yang berorientasi pada manusia, seperti ChatGPT, untuk melatih model lain,” kata Ritwik Gupta, kandidat PhD dalam bidang AI di University of California, Berkeley.

“Ini berarti Anda mendapatkan langkah umpan balik manusia ini secara gratis. Bagi saya, tidak mengherankan jika DeepSeek seharusnya melakukan hal yang sama. Jika mereka melakukannya, menghentikan praktik ini mungkin sulit,” tambahnya.

Praktik tersebut menyoroti kesulitan bagi perusahaan yang ingin melindungi keunggulan teknis mereka. “Kami tahu perusahaan-perusahaan berbasis [China] – dan lainnya – terus mencoba mendistilasi model-model dari perusahaan-perusahaan AI terkemuka di AS,” kata OpenAI dalam pernyataan terbarunya.

Perusahaan tersebut menambahkan: “Kami melakukan tindakan pencegahan untuk melindungi IP kami, termasuk proses yang hati-hati untuk menentukan kemampuan-kemampuan terdepan mana yang akan dimasukkan dalam model-model yang dirilis, dan kami percaya . . . sangat penting bahwa kami bekerja sama dengan pemerintah AS untuk melindungi model-model paling mampu dari upaya para lawan dan pesaing untuk mengambil teknologi AS.”

OpenAI sedang berjuang melawan tuduhan pelanggaran hak cipta dari surat kabar dan pencipta konten, termasuk gugatan dari The New York Times dan penulis terkemuka, yang menuduh perusahaan tersebut melatih model-modelnya pada artikel dan buku mereka tanpa izin.