Apa yang dilatihkan kepada Sora? Kreatif meminta jawaban.

Pada hari Kamis, OpenAI sekali lagi mengguncang dunia AI dengan model pembuatan video yang disebut Sora.

Demo tersebut menunjukkan video yang fotorealistik dengan detail dan kompleksitas yang tajam, berdasarkan teks sederhana. Sebuah video yang didasarkan pada teks “Bayangan di jendela kereta yang melintasi pinggiran kota Tokyo” terlihat seperti difilmkan dengan ponsel, dengan kamera yang goyah dan bayangan penumpang kereta. Tidak ada tangan yang terdistorsi aneh terlihat.

Tweet mungkin telah dihapus

Sebuah video dari teks “Trailer film yang menampilkan petualangan seorang pria berusia 30 tahun yang mengenakan helm sepeda motor berwarna merah wol rajutan, langit biru, gurun garam, gaya sinematik, difilmkan dengan film 35mm, warna-warni yang hidup” terlihat seperti perpaduan Christopher Nolan dan Wes Anderson.

Tweet mungkin telah dihapus

Video lain yang menampilkan anak anjing golden retriever bermain di dalam salju menghasilkan bulu lembut dan salju yang lembut sehingga terlihat nyata dan dapat dirasakan sentuhannya.

Pertanyaan senilai 7 triliun dolar adalah, bagaimana OpenAI mencapai ini? Kami sebenarnya tidak tahu karena OpenAI hampir tidak membagikan apa pun tentang data pelatihannya. Tetapi untuk menciptakan model yang canggih ini, Sora membutuhkan banyak data video, jadi kita dapat berasumsi bahwa model ini dilatih dengan data video yang diambil dari berbagai penjuru internet. Dan beberapa orang berspekulasi bahwa data pelatihan tersebut termasuk karya yang dilindungi hak cipta. OpenAI tidak segera menanggapi permintaan komentar mengenai data pelatihan Sora.

Lihat Juga:

8 video liar Sora AI yang dihasilkan oleh alat OpenAI yang baru yang perlu Anda lihat

Dalam kertas teknis OpenAI, fokusnya sebagian besar adalah pada metode untuk mencapai hasil ini: Sora adalah model difusi yang mengubah data visual menjadi “patch” atau potongan data yang dapat dimengerti oleh model. Tetapi hampir tidak ada yang disebutkan mengenai asal data visual tersebut.

MEMBACA Perkenalkan Eksekutif Tenis yang Menghasilkan Pendapatan Lebih dari $500 Juta per Tahun untuk Tim AS Terbuka

OpenAI mengatakan bahwa mereka “mengambil inspirasi dari model bahasa besar yang memperoleh kemampuan umum dengan melatihnya menggunakan data skala internet.” Bagian yang sangat samar-samar mengenai “mengambil inspirasi” adalah satu-satunya referensi yang mengelak terhadap sumber data pelatihan Sora. Di bagian selanjutnya dalam kertas tersebut, OpenAI mengatakan, “melatih sistem generasi teks ke video membutuhkan sejumlah besar video dengan teks keterangan yang sesuai.” Satu-satunya sumber data visual yang besar dapat ditemukan di internet, petunjuk lain dari asal usul Sora.

Isu hukum dan etika mengenai bagaimana data pelatihan diperoleh untuk model AI telah ada sejak OpenAI meluncurkan ChatGPT. Baik OpenAI maupun Google telah dituduh “mencuri” data untuk melatih model bahasa mereka, dengan kata lain menggunakan data yang diambil dari media sosial, forum online seperti Reddit dan Quora, Wikipedia, pangkalan data buku pribadi, dan situs berita.

Hingga saat ini, alasan untuk mengambil data pelatihan dari seluruh internet adalah karena data tersebut tersedia untuk umum. Tetapi tersedia untuk umum tidak selalu berarti domain publik. Sebagai contoh, New York Times menggugat OpenAI dan Microsoft karena pelanggaran hak cipta, dengan tuduhan bahwa model-model OpenAI menggunakan karya-karya Times secara kata per kata atau mengutip cerita-cerita tersebut tanpa mencantumkan sumber dengan benar.

Sekarang terlihat bahwa OpenAI melakukan hal yang sama, tetapi dengan video. Jika ini terjadi, dapat diharapkan bahwa pelaku industri hiburan akan memberikan tanggapan tentang hal tersebut.

Tetapi masalahnya tetap: Kami masih belum tahu sumber data pelatihan Sora. “Perusahaan ini (meskipun namanya) selalu merahasiakan apa yang mereka latih dalam model-model tersebut,” tulis Gary Marcus, seorang ahli AI yang memberikan kesaksian di Komite Pengawasan AI Senat AS. “Banyak orang telah berspekulasi bahwa kemungkinan ada banyak hal di dalamnya yang dihasilkan dari mesin permainan seperti Unreal. Saya tidak akan terkejut jika juga telah banyak pelatihan dengan kunjungan di YouTube, dan berbagai materi yang dilindungi hak cipta,” kata Marcus, sebelum menambahkan, “Pelaku industri seni mungkin benar-benar terjepit di sini.”

MEMBACA Petunjuk dan Jawaban NYT Connections Hari Ini, 4 November #877

Meskipun OpenAI menolak untuk mengungkap rahasia-rahasianya, para seniman dan kreatif mengasumsikan hal yang terburuk. Justine Bateman, seorang pembuat film dan penasihat AI generatif SAG-AFTRA, tidak menahan kata-kata. “Setiap nanodetik dari sampah AI ini dilatih dengan karya curian oleh seniman sungguhan,” tulis Bateman di X. “Membuat jijik,” tambahnya.

Tweet mungkin telah dihapus

Orang-orang di industri kreatif lainnya khawatir tentang bagaimana munculnya Sora dan model pembuat video akan mempengaruhi pekerjaan mereka. “Saya bekerja di bidang efek visual film, hampir semua orang yang saya kenal merasa putus asa, panik tentang apa yang harus dilakukan sekarang,” tulis @jimmylanceworth.

OpenAI tidak sepenuhnya mengabaikan dampak besar yang mungkin dimiliki Sora. Namun, hal tersebut lebih berfokus pada kerugian potensial yang berkaitan dengan deepfake dan disinformasi. Saat ini, OpenAI sedang dalam fase uji coba dengan memeriksa konten yang tidak pantas dan berbahaya. Di akhir pengumumannya, OpenAI mengatakan bahwa mereka akan “melibatkan pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi penggunaan positif untuk teknologi baru ini.”

Namun, hal tersebut tidak mengatasi kerugian yang mungkin telah terjadi dengan dibuatnya Sora.

Topik
Kecerdasan Buatan
OpenAI