Meta mengumumkan model AI baru yang dapat menghasilkan video dengan suara

Pemilik Facebook, Meta, mengumumkan pada hari Jumat bahwa mereka telah membangun model AI baru bernama Movie Gen yang dapat membuat klip video dan audio yang terlihat realistis sebagai tanggapan terhadap permintaan pengguna, mengklaim bahwa ini dapat menyaingi alat-alat dari perusahaan media generasi terkemuka seperti OpenAI dan ElevenLabs.

Contoh kreasi Movie Gen yang disediakan oleh Meta menunjukkan video hewan berenang dan berselancar, serta video menggunakan foto-foto orang yang sebenarnya untuk menggambarkan mereka melakukan tindakan seperti melukis di atas kanvas.

Movie Gen juga dapat menghasilkan musik latar belakang dan efek suara yang disinkronkan dengan konten video, kata Meta dalam sebuah pos blog, dan menggunakan alat ini untuk mengedit video yang sudah ada.

Dalam salah satu video tersebut, Meta memasukkan pom-pom ke tangan seorang pria yang sedang berlari sendirian di padang gurun, sementara dalam video lainnya, Meta mengubah tempat parkir di mana seorang pria sedang berseluncur skateboard dari tanah kering menjadi yang tertutup genangan air.

Video yang dibuat oleh Movie Gen dapat memiliki durasi hingga 16 detik, sementara audio dapat memiliki durasi hingga 45 detik, kata Meta. Mereka membagikan data yang menunjukkan tes buta yang menunjukkan bahwa model ini berkinerja baik dibandingkan dengan penawaran dari startup termasuk Runway, OpenAI, ElevenLabs, dan Kling.

Penyampaian ini datang saat Hollywood telah berjuang untuk menggunakan teknologi video AI generatif tahun ini, setelah Microsoft-backed OpenAI pada bulan Februari pertama kali memperlihatkan bagaimana produknya, Sora, dapat membuat video seperti film fitur sebagai tanggapan terhadap perintah teks.

Para teknolog di industri hiburan bersemangat untuk menggunakan alat-alat tersebut untuk meningkatkan dan mempercepat pembuatan film, sementara yang lain khawatir tentang mengadopsi sistem yang tampaknya telah dilatih pada karya hak cipta tanpa izin.

MEMBACA  45 aktivis demokrasi dipenjara di Hong Kong dalam sidang uji coba keamanan nasional yang bersejarah Menurut Reuters

Para pembuat kebijakan juga telah menyoroti kekhawatiran tentang bagaimana deepfake yang dihasilkan oleh AI digunakan dalam pemilihan di seluruh dunia, termasuk di Amerika Serikat, Pakistan, India, dan Indonesia.

Juru bicara Meta mengatakan bahwa perusahaan kemungkinan tidak akan merilis Movie Gen untuk digunakan secara terbuka oleh pengembang, seperti yang dilakukan dengan seri model bahasa besar Llama mereka, mengatakan bahwa mereka mempertimbangkan risiko secara individual untuk setiap model. Mereka menolak untuk berkomentar tentang penilaian Meta untuk Movie Gen secara khusus.

Sebaliknya, kata mereka, Meta sedang bekerja langsung dengan komunitas hiburan dan pencipta konten lainnya tentang penggunaan Movie Gen dan akan mengintegrasikannya ke dalam produk Meta tahun depan.

Menurut pos blog dan paper penelitian tentang alat tersebut yang dirilis oleh Meta, perusahaan menggunakan campuran dataset berlisensi dan yang tersedia secara publik untuk membangun Movie Gen.

OpenAI telah bertemu dengan eksekutif Hollywood dan agen-agen tahun ini untuk membahas kemitraan yang mungkin melibatkan Sora, meskipun belum ada kesepakatan yang dilaporkan keluar dari pembicaraan tersebut. Kekhawatiran atas pendekatan perusahaan meningkat pada bulan Mei ketika aktor Scarlett Johansson menuduh pembuat ChatGPT meniru suaranya tanpa izin untuk chatbot mereka.

Lions Gate Entertainment, perusahaan di balik “The Hunger Games” dan “Twilight,” mengumumkan pada bulan September bahwa mereka memberikan akses kepada startup AI Runway ke perpustakaan film dan televisi mereka untuk melatih model AI. Sebagai gantinya, mereka mengatakan, studio dan para pembuat film mereka dapat menggunakan model tersebut untuk meningkatkan karya mereka.